자격증
# 빅데이터 조직 구조 유형
집중 구조
- 전사 분석 업무를 별도의 분석 전담 조직에서 담당.
- 전략적 중요도에 따라 분석조직이 우선순위를 정해서 진행 가능.
- 현업 업무부서의 분석 업무와 중복 및 이원화 가능성이 높다.
기능 구조
- 일반적인 형태로 별도 분석조직이 없고 해당 부서에서 분석 수행.
- 전사적 핵심 분석이 어려우며 과거에 국한된 분석 수행.
분산 구조
- 분석조직 인력들을 현업 부서로직접 배치해 분석 업무를 수행.
- 전사 차원의 우선순위 수행.
- 분석 결과에 따른 신속한 피드백이 나오고 베스트 프랙티스 공유 가능.
- 업무 과다와 이원화 가능성이 존재할 수 있기에 부서 분석 업무와 역할 분담이 명확해야 함.
# 데이터 사이언티스트 요구역량
소프트 스킬 (Soft Skill)
- 여러 분야의 협력 능력 : 커뮤니케이션 능력
- 분석의 통찰력 : 논리적 비판 능력, 창의적 사고력, 호기심
- 설들력 있는 전달력 : 스토리텔링 능력, 비주얼라이제이션
하드 스킬 (Hard Skill)
- 분석기술의 숙련도 : 목적에 맞는 최적 분석 설계, 노하우 축적
- 빅데이터 관련 이론적 지식 : 빅데이터 관련 기법 및 다양한 방법론 습득.
# 빅데이터의 가치
경제적 자산
- 새로운 기회를 창출하고, 위험을 해결하여 사회 및 경제 발전의 엔진 역할을 수행.
불확실성 제거
- 사회현상, 현실 세계의 데이터를 기반으로 한 패턴 분석과 미래 전망.
- 여러 가지 가능성에 대한 시나리오 시뮬레이션.
리스크 감소
- 환경, 소셜 네트워크, 모니터링 정보의 패턴 분석을 통해 위험 징후 및 이상 신호 포착.
- 이슈를 사전에 인지 및 분석하고 빠른 의사결정과 실시간 대응.
스마트한 경쟁력
- 대규모 데이터 분석을 통해 상황 인지, 인공지능 서비스 기능.
- 개인화, 지능화, 서비스 제공 확대.
- 트렌드 변화 분석을 통한 제품 경쟁력 확보.
타 분야 융합
- 타 분야와 융합을 통한 새로운 가치 창출.
- 방대한 데이터 활용을 통한 새로운 융합시장 진출.
# 분석 가치 에스컬레이터 (Analytic Value Escalator)
- 가트너가 빅데이터의 가치를 묘사 분석, 진단 분석, 예측 분석, 처방 분석의 4단계로 정의한 기법.
- 분석 가치 에스컬레이터에서는 높은 난도를수반하는 데이터 분석은 더 많은 가치를 창출한다.
1. 묘사 분석 (Descriptive Analysis)
- 분석의 가장 기본적인 지표를 확인하는 단계.
- 과거에 어떤 일이 일어났고, 현재 어떤 일이 일어나고 있는지 확인.
2. 집단 분석 (Diagnostic Analysis)
- 묘사 단계에서 찾아낸 분석의 원인을 이해하는 단계.
- 데이터를 기반으로 왜 발생했는지 이유를 확인.
3. 예측 분석 (Predictive Analysis)
- 데이터를 통해 기업 혹은 조직의 미래, 고객의 행동 등을 예측하는 단계.
- 무슨 일이 일어날 것인지 예측.
4. 처방 분석 (Prescriptive Analysis)
- 예측을 바탕으로 최적화하는 단계.
- 무엇을 해야 할 것인지 확인.
# 데이터 지식경영
- 데이터 기반 지식경영의 핵심 이슈는 암묵지와 형식지의 상호작용에 있다.
암묵지 (Tacit Knowledge)
- 학습과 경험을 통해 개인에게체화되어 있지만 겉으로 드러나지 않는 지식.
- 사회적으로 중요하지만 다른 사람에게공유되기 어려움.
형식지 (Explicit Knowledge)
- 문서, 매뉴얼처럼 형상화된 지식.
- 전달과 공유가 용이함.
# 데이터 지식경영 상호작용
공통화 (Socialization)
- 다른 사람과 대화 등 상호작용을 통해 개인이 암묵지를 습득하는 단계.
표출화 (Externalization)
- 형식지 요수 중 하나, 개인에게 내재된 경험을 객관적인 데이터인 문서나 매체로 저장하거나 가공, 분석하는 과정.
연결화 (Combination)
- 형식지가 상호결합하면서 새로운 형식지를 창출하는 과정.
내면화 (Internalization)
- 행동과 실천교육 등을 통해 형식지가 개인의 암묵지로 체화되는 단계.
# 빅데이터
- 수십 테라바이트 이상의 막대한 양의 정형 및 비정형 데이터.
- 데이터로부터 가치를 추출, 결과를 분석하는 기술의 의미로도 통용됨.
- 데이터에서부터 가치를 추출하는 것은 통찰, 지혜를 얻는 과정으로 DIKW 피라미드로 표현할 수 있다.
- 데이터를 수집, 저장, 관리, 분서갛는 기존의 관리 방법으로 막대한 양의 데이터를 처리하기 어려울 때 빅데이터를 사용한다.
# DIKW 피라미드
데이터(Data)
- 객관적 사실로서 다른 데이터와의 상관관계가 없는 가공하기 전의 순수한 수치나 기호.
정보(Information)
- 가공, 처리하여 데이터 간 연관 관계와 함께 의미가 도출된 요소.
지식(Knowledge)
- 획득된 다양한 정보를 구조화, 유의미한 정보로 분류하고 일반화시킨 결과물.
- 정보에 기반해 찾아진 규칙.
지혜(Wisdom)
- 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어
- 상황이나 맥락에 맞게 규칙을 적용하는 요소