[ADsP] 과목 2 데이터 분석 기획

 ADsP (Advanced Data Analytics Semi-Professional)

제1절 분석 기획 방향성 도출

분석 기획: 실제 분석 수행 전, 분석을 수행할 과제의 정의 및 의도한 결과를 도출 할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업

분석 기획시 고려사항 3가지

- 데이터

 · 확보가 우선적, 유형 분석(유형별 적용 가능 솔루션 및 방법 다양)

 · 정형 데이터(DB로 정제된 데이터), 비정형 데이터(이메일, 보고서, 소셜미디어 데이터),

    반정형 데이터(센서 중심으로 스트리밍되는 머신데이터)

- 활용방안과 활용 가능한 유즈케이스 탐색

 · 기존에 잘 구현되어 활용되고 있는 유사 분석 시나리오 및 솔루션 최대한 활용

- 장애요소들의 대한 사전계획

 · 조직역량의 내재화를 위하여 충분하고 계속적인 교육 및 활용방안 등의 변화관리 고려

* 3가지 암기 내용이해가 필요한 문제


제2절 분석 방법론
a. KDD 분석 방법론 (Knowledge Discovery in Databases) [출처] ADsP 정리) 3단원 1장 제2절 분석방법론
b. CRISP-DM 분석 방법론 (Cross Industry Standard Process for Data Mining)
CRISP-DM 프로세스 6단계
- 업무이해 : 프로젝트 목적과 요구사항 이해단계
 · 업무목적 파악, 상황 파악, 데.마 목표설정, 프로젝트 계획 수립
- 데이터 이해 : 데이터 수집, 속성 이해단계
 · 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인
- 데이터 준비 : 분석기법에 적합한 데이터에 편성단계, 시간 다소비
 · 분석용 데이터 셋 선택, 데이터 정제, 분석용 데이터 셋 편성, 데이터 통합, 데이터 포맷팅
- 모델링 : 다양한 모델링 기법과 알고리즘 선택하고 파라미터 최적화하는 단계,
                테스트용 데이터 셋으로 과적합 문제 확인
 · 모델링 기법 선택, 모델 테스트 계획 설계, 모델 작업, 모델 평가
- 평가 : 모델링 결과가 프로젝트 목적에 부합하는지 평가하는 단계
 · 분석결과 평가, 모델링 과정 평가, 모델 적용성 평가
- 전개 : 모델을 실업무에 적용하기 위한 계획을 수립하고 모니터링과 모델의
             유지보수 계획 마련 단계
* 6단계 순서를 묻는 문제
c. 빅데이터 분석 방법론 (계층적 프로세스 모델)

분석 과제 정의서
분석명분석 정의
해지 상담 접촉 패턴 분석기 해지 계약건 발생 고객의 해지 시점 상담정보 분석을 통해 해지 고객의 상담 특성을 발굴하는 분석
소스 데이터 데이터 입수 난이도분석방법
접촉채널, 건수, 접촉 평균 시간, 최종 접촉 이후 해지까지 시간, 상담인력 업무 능숙도서비스 수준 유지해지로 이어지는 해지 상담의 유의미한 속성을 요인 분석을 통해 발굴하고 클러스터링 분석을 통해 영향요인을 그룹핑하고, 그룹핑된 요인 그룹에 해지에 미치는 영향도를 회귀 분석함
데이터 입수 사유
N/A
분석 적용 난이도분석적용 난이 사유분석 주기분석 결과 검증 Owner
접촉 로그 등의 비구조적 데이터 분석 필요월별 업데이터해지방어팀



분석준비도 readiness (데이터 분석 도입의 수준을 파악을 위한 진단방법)

분석 업무 파악
인력 및 조직
분석기법
· 발생한 사실 분석 업무
· 예측 분석 업무
· 시뮬레이션 분석 업무
· 최적화 분석 업무
· 분석 업무 정기적 개선
· 분석전문가 직무 존재
· 전문가 교육훈련 프로그램
· 관리자 기본분석능력
· 전사총괄조직
· 경영진 분석 업무 이해
· 업무별 적합한 분석기법 
· 분석 업무 도입 방법론
· 분석기법 라이브러리
· 분석기법 효과성 평가
· 분석기법 정기적 개선
분석 데이터
분석 문화
IT 인프라
· 분석업무를 위한 데이터
   충분성/신뢰성/적시성
· 비구조적 데이터 관리
· 외부데이터 활용 체계
· 기준데이터 관리(MDM)
· 사실에 근거한 의사결정
· 관리자의 데이터 중심
· 회의 등에서 데이터 활용
· 직관보다 데이터활용
· 데이터 공유 및 협업 문화
· 운영시스템 데이터 통합
· EAI,ETL등 데이터 유통체계
· 분석 전용 서버 및 스토리지
· 분석 환경
  (빅데이터/통계/비쥬얼) 

 * 6가지 종류를 묻거나 6가지 중 1가지에 내용에 대해 물어보는 문제

ex) 다음 중 분석준비도의 분석업무영역이 아닌 것은?


분석 마스터플랜

  • 반복적인 분석체계는 모든 단계를 반복하기보다 데이터수집 및 확보와 분석데이터를 준비하는 단계를 순차적으로 진행하고
  • 모델링 단계는 반복적으로 수행하는 혼합형을 많이 적용하며이러한 특성을 고려하여 세부적인 일정계획도 수립해야 한다.

마스터 플랜 수립

우선순위 평가 → 단계적 로드맵 구성  이행계획수립
우선순위 고려요소: 전략적 중요도비즈니스 성과/ROI, 실행 용이성
적용범위/방식 고려요소: 업무내재화 적용 수준분석 데이터 적용 수준(·외부), 기술적용 수준
특히 우선순위 고려요소를 묻는 문제

ROI 관점 빅데이터의 핵심 특성
투자비용 측면 요소(ROI관점) (3V): Volume(규모/), Variety(종류/유형), Velocity(속도)
비즈니스 효과 측면 요소: 3V + Value(가치)
 * 출제율 높은 문제

포트폴리오 사분면 분석을 통한 과제 우선순위 선정 기법
시급성 기준 : 3 - 4 - 2 순 의사결정
난이도 기준 : 3 - 1 - 2 순 의사결정
D
 



 
E

전략적 중요도가 높아 경영에 미치는
   영향 큼  -> 시급하게 추진 필요
난이도가 높아 현재 수준에서 과제를
   바로 적용 어려움

현재 전략적 중요도 높지 않지만 중장기적
   관점에서 반드시 추진되야 함
분석과제를 바로 적용하기엔 난이도 높음


전략적 중요도가 높아 현재 시점에
   전략적 가치가 있음
과제 추진의 난이도가 어렵지 않아
   우선적 바로 적용 가능할 필요성 있음

전략적 중요도가 높지 않아 중장기전
   관점에서 관제추진 바람직
과제를 바로 적용하는 것은 어렵지 않음

                    현재 -------------------------------------- 시급성 --------------------------------------- 미래




분석성숙도 모델: 분석능력 및 분석결과 활용에 대한 조직의 성숙도 수준 평가해 현재 상태 점검(평가도구 : CMMI), 분석수준은 성숙 단계에 따라 점차 진화
단계
도입
활용
확산
최적화
설명
· 분석 시작환경과
시스템 구축
· 분석결과를 업무적용
· 전사차원에서 분석 관리/공유
· 분석을 진화시켜
혁신 및 성과향상 기여
비즈니스 부문
· 실적 분석 및 통계
· 정기보고 수행
· 운영 데이터 기반
· 미래결과 예측
· 시뮬레이션
· 운영데이터 기반
· 전사성과 실시간 분석
· 프로세스 혁신 3.0
· 분석규칙관리
· 이벤트 관리
· 외부환경분석 활용
· 최적화 업무 적용
· 실시간 분석
· 비즈니스 모델 진화
조직·역량 부문
· 일부부서에서 수행
· 담당자 역량 의존
· 전문담당부서 수행
· 분석기법 도입
· 관리자가 분석수행
· 전사 모든 부서 수행
· 분석 CEO 운영
· 데이터 사이언티스트
· 데이터 사이언스 그룹
· 경영진 분석 활용
· 전략 연계
IT
부문
· 데이터 웨어하우스
· 데이터 마트
· ETL/EAI
· OLAP
· 실시간 대시보드
· 통계분석 환경
· 빅데이터 관리 환경
· 시뮬레이션 죄적화
· 비쥬얼 분석
· 분석 전용 서버
· 분석 협업환경
· 분석 SandBox
· 프로세스 내재화
· 빅데이터 분석
 * 부문 3가지와 단계 4가지 암기(주관식) + 설명 이해

데이터 분석 조직 구조 3가지 유형
집중형 조직구조
기능 중심의 조직구조
분산된 조직구조
· 분석업무를 별도 분석 조직이담당
· 전략적 중요도에 따라 우선순위 정해 진행
· 현업 부서와 이원화/이중화 가능성 높음
· 일반적 분석수행구조
· 별도 조직없고 해당 부서에서 분석 수행
· 전사적 핵심 분석 어려움
· 과거실적에 국한된 분석 수행 
· 분석조직인력을 현업부서로 배치
· 전사차원의 우선순위 수행
· 분석결과에 따른 신속한 Action
· 베스트프랙티스 공유 가능
· 분석업무와 역할분담 명확화 필요
 * 3가지 유형 구별 및 내용 이해(출제 빈도 굉장히 높음)

















참고자료
https://blog.naver.com/liberty264/221014963458

댓글 쓰기

0 댓글