본문 바로가기

□ ADsP

[ADsP - 1과목] 제1장 데이터의 이해


과목Ⅰ. 데이터 이해 


제1장. 데이터의 이해 


제1절 데이터와 정보

1. 데이터의 정의

◆데이터의 정의

- 관념적, 추상적 → 기술적, 사실적

- 추론·추정의 근거를 이루는 사실(옥스퍼드) / 단순한 객체+다른 객체와의 상호관계 속에서 가치

- 객관적 사실+추론·예측·전망·추정을 위한 근거의 기능(당위적 특성)

- 일련의 가치 창출과정에서 가장 기초를 이루는 것


◆데이터 유형

- 정성적 데이터: 비정형 데이터(언어/문자), 비용·기술적 투자 多

- 정량적 데이터: 정형 데이터(수치/도형/기호), 저장·검색·분석에 용이


◆암묵지와 형식지

- 암묵지: 개인에게 습득된 무형의 지식(공유 어려움), 과학적 발견 / 공통화, 내면화

- 형식지: 형상화된 지식, 지식 전달과 공유가 용이 / 표출화, 연결화

- 데이터는 지식경영의 핵심이슈인 암묵지와 형식지의 상호작용에 중요한 역할

- 암묵지와 형식지의 상호작용(→지식형성의 중요한 기초)


2. 데이터와 정보의 관계

◆DIKW 피라미드: 지혜를 얻는 과정(계층 구조)

- 데이터(Data): 상관관계가 없는 가공하기 전의 순수한 가치·기호 (객관적 사실) ex. A마트는 100원, B마트는 200원

- 정보(Information): 데이터 가공 및 상관관계 간 이해 → 패턴인식+의미를 부여한 데이터 ex. A마트가 더 싸다

- 지식(Knowledge): 상호 연결된 정보패턴을 이해하여 이를 토대로 예측한 결과물 ex. A마트에서 사야겠다

- 지혜(Wisdom): 창의적 산물(지식의 축적+아이디어) ex. 다른 물건도 A마트가 더 쌀 것이라 판단

- 데이터, 정보, 지식: 상호관계 속에서 역할 수행, 가치 창출을 위한 일련의 프로세스로 기능




제2절 데이터베이스 정의와 특성
1. 용어의 연역
- 1950’s: 미국에서 군대의 군비상황을 관리하기 위해 컴퓨터 도서관을 설립하면서 데이터 기지(base)라는 데이터베이스 탄생
- 1963.6: 미국 SDC 개최한 심포지엄에서 공식적으로 사용(초기개념 유지)
- 1963: GE의 바크만이 최초의 현대적 의미의 데이터베이스관리시스템(IDS) 개발
- 1965: 시스템을 통한 체계적 관리와 저장의 의미(데이터베이스 시스템) 등장 (2차 심포지엄)
- 1970초: 데이터베이스 단일어 일반화(유럽)
- 1975: 미국의 CAC가 한국과학기술정보센터를 통해 서비스(한국)
- 1970말: 주요신문 등에 흔히 사용(미국)

2. 데이터베이스의 정의
◆과거: 단순한 데이터의 수집·저장
◆현대적 개념의 데이터베이스
- 체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물(EU)
- 소재를 체계적으로 배열 또는 구성한 편집물로서 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것(국재 저작권법)
- 동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장·공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합(컴퓨터 용어사전)
- 관련된 레코드의 집합, 소프트웨어로는 데이터베이스관리시스템(DBMS) 의미(위키피디아)
- “문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체(ADP 가이드)
- DBMS: 이용자가 쉽게 데이터베이스를 구축·유지할 수 있게 하는 소프트웨어
- DBMS+데이터베이스 = 데이터베이스시스템

3. 데이터베이스의 특징
◆데이터+정보를 저장하는 지식베이스
◆첨단 정보기술을 바탕으로 원하는 데이터를 저장, 검색할 수 있는 복합체
◆데이터베이스 일반적 특징
- 통합된 데이터: 중복x
- 저장된 데이터: 컴퓨터가 접근할 수 있는 저장매체(by 컴퓨터기술 바탕)
- 공용 데이터: 서로 다른 목적으로 데이터베이스 데이터 공동 사용(대용량화+복잡한 구조)
- 변화하는 데이터: 데이터 삽입/삭제 → 변화하면서도 정확한 데이터 유지
◆데이터베이스 정보의 축적
- 기계 가독성: 일정한 형식에 따라 정보처리기기가 읽고 쓰기 가능
- 검색 가능성: 다양한 방법으로 필요한 정보 검색 가능
- 원격 조작성: 원거리에서도 즉시 온라인으로 이용 가능
◆데이터베이스의 4가지 전달 측면
①정보이용 측면: 이용자의 정보요구에 따라 신속, 정확, 경제적으로 찾음
②정보관리 측면: 정보를 일정한 질서·구조에 따라 정리·저장·검색·관리 → 방대한 양의 정보 체계적 축적+새로운 내용 추가·갱신 용이
③정보기술발전의 측면: 정보처리, 검색·관리 소프트웨어, 하드웨어, 정보전송을 위한 네트워크 기술 등의 발전 견인
④경제·산업적 측면: 신속 제공·이용 → 경제·산업의 효율성 제고+국민 편의 증진의 수단




제3절 데이터베이스의 활용

1. 기업내부 데이터베이스

◆(90년대)

기업내부 데이터베이스(인하우스 DB)에 기업 경영 전반에 관한 모든 자료 연계하여 일관된 체계로 구축·운영(경영활동의 기반이 되는 전사 시스템으로 확대)


◆OLTP(Online Transaction Processing) 시스템 (90년대 중반 이전)

- 기업 활동의 영역별로 구축되던 시스템(정보 수집·조직 내 공유(경영정보시스템, MIS), 생산자동화, 통합자동화 등)

- 단순 자동화 / 기업의 기간계 시스템


◆OLAP(Online Analytical Processing) 시스템

- 분석이 중심이 되는 시스템 구축으로 변화(by 데이터 마이닝 등의 기술 발달)

- 2000년 이후 기업 DB구축 화두: CRM(고객관계관리), SCM(공급망관리)

- CRM, SCM은 상호 밀접한 관련(유통·판매와 고객 데이터는 연동)


◆인하우스 DB 발전과정에서 나타난 산업 부문별 변화된 모습

①제조부분

- 데이터베이스 기술의 가장 중요한 적용 분야

- (00년 전) 부품 테이블이나 재고관리 영역 → (00년 후) 부품 설계, 제조, 유통 전 공정 포함

- (초기) 기업별 고유 시스템 형태로 구축 (이후) 솔루션 유형으로 발전

- (00년 중반 이후) 중소기업의 인하우스 DB 구축 투자 증가, 실시간 기업(RTE) 대표적 화두

- 실시간 기업: 비즈니스 프로세스 투명, 민첩하게 유지 / 환경변화에 적응 최대화 및 지연시간을 없애는 정보화 전략대기업-중소기업 간 협업적 IT화의 비중 점차 확대

- (최근) 제조부문의 CRP 시스템 도입. DW, CRM, BI 등 진보된 정보기술 적용된 기업내부 인하우스 DB 구축이 주류


②금융부분

- IMF이후 금융사 간 합병, 지주회사 설립(부실 타파를 위한 노력) → 업무 프로세스 효율화, e비즈니스 활성화, 금융권 통합 시스템 구축

- (00년 초반) 데이터베이스 간 정보공유 및 통합이나 고객정보의 전략적 활용(EAI, ERP, e-CRM)

- (00년 중반) DW를 적극적 도입(관련 DB 마케팅 증대 노력), 대용량 DW를 위한 최적의 BI기반 시스템 구축

- (향후) EDW 확장이 데이터베이스 시장 확대에 기여 예상


③유통부분 (명사의 정의를 주고 주관식 가능성 有)

- (00년 이후) CRM, SCM(유통 공급망 관리) 구축, 상거래를 위한 인프라 및 KMS 위한 별도 백업시스템 구축

- (00년 중반) 체계적 고객정보 수집·분석과 상권분석(균형성과 관리, 핵심성과지표, 웹리포팅 등 다양한 고객 분석 룰과 기존 데이터베이스 연계)

- (최근) 전자태그(RFID)에 따른 대용량 데이터베이스 지원하는 플랫폼이 요구


2. 사회기반 구조로서의 데이터베이스

◆(90년대) 사회 각 부문의 정보화 본격화되면서 DB 구축 활발하게 추진

◆사회간접자본(SOC/무역, 통관, 물류, 조세, 국세, 조달 등) 차원에서 EDI활용 본격화+부가가치통신망(VAN)을 통한 정보망 구축

◆데이터베이스 고도화(지리, 교통) / 공공 DB 구축·이용(의료, 교육, 행정)

◆사회 전반의 기간재로 자리잡은 DB

- (물류) 종합물류정보망 구축(실시간 차량추적) / CVO, EDI, 물류정보 DB, 부가 서비스로 구성

- (지리) GIS 응용(4S 통합기술, LBS, SIM, 공간 DBMS 및 웹 GIS) / 지리정보유통망 가시화

- (교통) 지능형교통정보시스템(ITS), 교통정보, 기초자료 및 통계 제공, 대국민 서비스 확대

- (의료) 의료정보시스템, HL7 국내 표준화작업에 따라 전국적 진료 정보 공유체계 구축계획, u헬스 실현에 의료정보 데이터베이스 기반 활용

- (교육) 교육행정정보시스템 – 학사+기타 교육행정 전 업무 처리




*출처: '데이터 분석 전문가 가이드, 한국데이터진흥원'