2021. 7. 3. 22:05ㆍ정 보 처 리 기 사 공 부/실 기
● 데이터베이스
다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합이다.
● 데이터베이스 정의
통합된 데이터 | 자료의 중복을 배제한 데이터 모임 |
저장된 데이터 | 저장 매체에 저장된 데이터 |
운영 데이터 | 조직의 업무를 수행하는 데 필요한 데이터 |
공용 데이터 | 여러 애플리케이션, 시스템들이 공동으로 사용하는 데이터 |
● 데이터베이스 특성
실시간 접근성 | 쿼리에 대하여 실시간 응답이 가능해야 함 |
계속적인 변화 | 새로운 데이터의 삽입, 삭제, 갱신으로 항상 최신의 데이터를 유지함 |
동시 공용 | 다수의 사용자가 동시에 같은 내용의 데이터를 이용할 수 있어야 함 |
내용 참조 | 데이터베이스에 있는 데이터를 참조할 때 데이터 레코드의 주소나 위치에 의해서가 아니라 사용자가 요구하는 데이터 내용으로 데이터를 찾는다. |
● 데이터베이스 종류
관계형 데이터베이스 관리시스템(RDBMS) | · 관계형 DBMS는 관계형 모델을 기반으로 하는 가장 보편화된 데이터베이스 관리시스템이다. · 데이터를 저장하는 테이블의 일부를 다른 테이블과 상하 관계로 표시하며 상하관계를 정리한다. · 변화하는 업무나 데이터 구조에 대한 유연성이 좋아 유지 관리가 용이하다. · RDBMS 종류는 Oracle, SQL Server, MySQL, Maria DB 등이 있다. |
계층형 데이터베이스 관리시스템(HDBMS) | · 계층형 DBMS는 데이터를 상하 종속적인 관계로 계층화하여 관리하는 데이터베이스이다. · 데이터에 대한 접근 속도가 빠르지만, 종속적인 구조로 인하여 변화하는 데이터 구조에 유연하게 대응하기가 쉽지 않다. · HDBMS 종류는 IMS, System2000 등이 있다. |
네트워크 데이터베이스 관리시스템(NDBMS) | · 네트워크 DBMS는 데이터의 구조를 네트워크상의 망상 형태로 표현한 데이터 모델이다. · 트리 구조나 계층형 데이터베이스보다는 유연하지만 설계가 복잡한 단점이 있다. · NDBMS 종류는 IDS, IDMS 등이 있다. |
● DBMS(Database Management System)
DBMS는 데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업, 복구, 보안 등의 기능을 지원하는 소프트웨어이다.
● DBMS 유형
키-값(Key-Value) DBMS | · 키 기반 Get / Put / Delete 제공, 메모리 기반에서 성능 우선 시스템 및 빅데이터 처리 가능 DBMS · Unique한 키에 하나의 값을 가지고 있는 형태 · Redis, DynamoDB |
컬럼 기반 데이터 저장(Column Family Data Store) DBMS | · Key 안에 (Column, Value) 조합으로 된 여러개의 필드를 갖는 DBMS · 테이블 기반, 조인 미지원, 컬럼 기반으로 구글의 Bigtable 기반으로 구현 · HBase, Cassandra |
문서 저장(Document Store) DBMS | · 값(Value)의 데이터 타입이 문서(Document)라는 타입을 사용하는 DBMS · 문서 타입은 XML, JSON과 같이 구조화된 데이터 타입으로, 복잡한 계층 구조 표현 가능 · MongoDB, Couchbase |
그래프(Graph) DBMS | · 시맨틱 웹과 온톨로지 분야에서 활용되는 그래프로 데이터를 표현하는 DBMS · 노드와 엣지로 특징되는 요소 특화 · 노드 간 관계를 구조화하여 저장 |
● DBMS 특징
데이터 무결성 | 부적절한 자료가 입력되어 동일한 내용에 대하여 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질 |
데이터 일관성 | 삽입, 삭제, 갱신, 생성 후에도 저장된 데이터가 변함없이 일정 |
데이터 회복성 | 장애가 발생하였을 시 특정 상태로 복구되어야 하는 성질 |
데이터 보안성 | 불법적인 노출, 변경, 손실로부터 보호되어야 하는 성질 |
데이터 효율성 | 응답 시간, 저장 공간 활용 등이 최적화되어 사용자, 소프트웨어, 시스템 등의 요구 조건을 만족시켜야 하는 성질 |
● 빅데이터
빅데이터는 시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리 가능한 데이터의 범위를 넘어서는 수십 페타바이트(PB) 크기의 비정형 데이터이다.
● 빅데이터의 특성
데이터의 양(Volume) | · 페타바이트 수준의 대규모 데이터 · 빅데이터 분석 규모에 관련된 특성 · 디지털 정보량이 기하급수적으로 폭증하는 것을 의미 |
데이터의 다양성(Variety) | · 정형, 비정형, 반정형의 다양한 데이터 · 빅데이터 자원 유형에 관련된 특성 · 로그, 소셜, 위치 등 데이터 유형이 다양해지는 것을 의미 |
데이터의 속도(Velocity) | · 빠르게 증가하고 수집되며, 처리되는 데이터 · 빅데이터 수집, 분석, 활용 속도와 관련된 특성 · 가치 있는 정보 활용을 위해 실시간 분석이 중요헤지는 것을 의미 |
● 빅데이터 수집, 저장, 처리 기술
비정형/반정형 데이터 수집 | 내·외부 정제되지 않은 데이터를 확보, 이를 통해 필요 정보를 추출하여 활용하기 위해서 효과적으로 수집 및 전송하는 기술 ex) 척와(Chukwa), 플럼(Flume), 스크라이브(Scribe) |
정형 데이터 수집 | 내·외부 정제된 대용량 데이터의 수집 및 전송 기술 ex) ETL, FTP, 스쿱(Sqoop), 하이호(Hiho) |
분산데이터 저장/처리 | 대용량 파일의 효과적인 분산 저장 및 분산 처리 기술 ex) HDFS, 맵 리듀스 |
분산데이터 베이스 | HDFS의 칼럼 기반 데이터베이스로 실시간 랜덤 조회 및 업데이트가 가능한 기술 ex) HBase |
● HDFS(Hadoop Distributed File System)
대용량 데이터의 집합을 처리하는 응용 프로그램에 적합하도록 설계된 하둡 분산 파일 시스템이다.
● 맵 리듀스(Map Reduce)
구글에서 대용량 데이터 처리를 분산 병렬 컴퓨팅에서 처리하기 위한 목적으로 제작하여 2004년에 발표한 소프트웨어 프레임워크이다.
● NoSQL
NoSQL은 전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로 데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없으며 수평적으로 확장이 가능한 DBMS이다.
● NoSQL의 특성(BASE)
Basically Avaiable | · 언제든지 데이터는 접근할 수 있어야 하는 속성 · 분산 시스템이기 때문에 항상 가용성 중시 |
Soft-State | · 노드의 상태는 내부에 포함된 정보에 의해 결정되는 것이 아니라 외부에서 전송된 정보를 통해 결정되는 속성 · 특정 시점에서는 데이터의 일관성이 보장되지 않음 |
Eventually Consistency | · 일정 시간이 지나면 데이터의 일관성이 유지되는 속성 · 일관성을 중시하고 지향 |
● NoSQL의 유형
DBMS 유형이랑 똑같음
● 온톨로지
실세계에 존재하는 모든 개념들과 개념들의 속성 그리고 개념들 간의 관계 정보를 컴퓨터가 이해할 수 있도록 서술해 놓은 지식베이스이다.
● 데이터 마이닝
대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술
● 데이터 마이닝 주요 기법
분류 규칙(Classification) | · 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 이를 토대로 새로운 레코드의 결과 값을 예측하는 기법 · 마케팅, 고객 신용평가 모형에 활용 |
연관 규칙(Association) | · 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법 · 제품이나 서비스의 교차판매, 매장 진열, 사기 적발 등 다양한 분야에서 활용 |
연속 규칙(Sequence) | · 연관 규칙에 시간 관련 정보가 포함된 형태의 기법 · 개인별 트랜잭션 이력 데이터를 시계열적으로 분석하여 트랜잭션의 향후 발생 가능성 예측 |
데이터 군집화(Clustering) | · 대상 레코드들을 유사한 특성을 지닌 몇 개의 소그룹으로 분할하는 작업으로 작업의 특성이 분류규칙과 유사 · 정보가 없는 상태에서 데이터를 분류하는 기법 · 분석대상에 결괏값이 없으며, 판촉활동이나 이벤트 대상을 선정하는 데 활용 |
● 텍스트 마이닝
텍스트 마이닝은 대량의 텍스트 데이터로부터 패턴 또는 관계를 추출하여 의미있는 정보를 찾아내는 기법이다.
'정 보 처 리 기 사 공 부 > 실 기' 카테고리의 다른 글
정보 처리 기사 실기 4. 통합 구현 - 연계 메커니즘 구성 (0) | 2021.07.04 |
---|---|
정보 처리 기사 실기 4. 통합 구현 - 연계 데이터 구성 (0) | 2021.07.03 |
정보 처리 기사 실기 3. 데이터 입출력 구현 - 물리 데이터 저장소 설계 (0) | 2021.07.03 |
정보 처리 기사 실기 3. 데이터 입출력 구현 - 논리 데이터 저장소 확인 (0) | 2021.07.03 |
정보 처리 기사 실기 2. 화면설계 - UI 설계 (0) | 2021.07.03 |