메타코드M 서포터즈 4기/2024 ADsP 2주 합격 올인원 패스

[ADsP] 메타코드 ADsP 2주 합격 올인원 패스 - 2과목 데이터 분석 기획(1)

theohyunee 2024. 5. 5. 19:55
반응형

안녕하세요.

빅데이터, AI 강의 플랫폼 메타코드M에서 제공하는

< 2024 ADsP 2주 합격 올인원 패스 [비전공자 맞춤] > 를 수강하였습니다.

2024 ADsP 2주 합격 올인원 패스 [ 비전공자 맞춤형 ] (이미지 클릭 시 강의 링크로 이동합니다.)

 

ADsP 에 대한 자세한 정보가 궁금하세요?

 


1. 개요

 

[ 목표 ]

01

이 포스트는 제2과목 - <데이터 분석 기획>

해당하는 내용을 강의를 기반으로 정리합니다.

 

02

포스트한 내용을 출력해서 가져가도 될 정도의

시험 대비용 진짜 ! 핵심 ! 내용! 만 정리하려 합니다.

👀 특히 이번 포스트는 빈출 개념이 많으니 집중하세요! 👀

 


2. 데이터 분석 기획의 이해 - (1)

데이터 분석 기획 

    • 분석을 수행할 문제를 정의하고 의도한 결과를 도출할 수 있도록 관리하는 방안을 사전에 계획하는 작업
    • 분석주제 유형(빈출!)

    • 목표 시점 별 기획 방안 

      • 과제 단위 - 급한 task에 적합하다. ( Speed, Quick, 빠른 결과물 )
      • 마스터 플랜 - 장기적인 task에 적합하다. ( Accuracy, Long Term, 지속 가능, 매뉴얼화 )
    • 분석 기획 시 고려사항
      • 가용 데이터 고려 - 데이터 구조/유형에 따라 분석 방법이 달라짐
      • 적절한 해결 방안 및 유스케이스 탐색 - 유사 시나리오 및 유사 분석
      • 장애 요소에 대한 사전 계획

 

분석 방법론

  • 데이터 분석을 위한 체계화된 절차 및 방법
    • 어느 정도 지식만 갖추면 활용 가능해야
    • 일정 수준 이상의 산출물이 지속적으로 나와야
  • 구성 요소(빈출!, 절방도기템산 - 확 외우고 써놓고 시작하기!)
    • 상세한 절차, 방법, 도구, 기법, 템플릿, 산출물
  • 방법론의 생성과정
    • 암묵지 → (형식화) → 형식지 → (체계화) → 방법론 → (내재화) → 암묵지

 

데이터 기반 의사결정의 중요성

  • 경험과 감에 따른 의사 결정이 아닌 데이터 기반
  • 합리적 의사결정을 가로막는 장애요소(빈출!)
    • 고정관념
    • 편향된 생각
    • 프레이밍 효과

 

적용 업무 특성에 따른 모델(빈출!)

  • 폭포수 모델
    • 순차적 / 하향식 모델
    • 현재 단계에서 문제 발생 시 이전 단계로 돌아가 피드백
  • 프로토타입 모델
    • 일부 개발 후 사용자의 평가를 분석하여 점진적으로 시스템을 개발하는 모델 (사용자 중심의 개발방법)
    • 사용자의 요구사항 / 데이터를 정확히 파악하기 어려울 때
  • 나선형 모델
    • 위험요소 제거를 중심으로, 반복을 통해 점진적으로 시스템을 개발
    • 대규모 시스템 개발에 적합

 

KDD 분석 방법론

  • KDD 분석 방법론(Knowledge Discovery in Databases)
    • 프로파일링 기술을 기반으로 데이터로부터 통계적 패턴/지식을 찾기 위해 활용할 수 있도록 정리한 데이터 마이닝 프로세스
  • KDD 분석 절차(암기!)

  • 과대적합 방지를 위한 데이터 변환(Transformation) 과정이 가장 중요함
  • 예시 ) 1,000 개의 가용 데이터 분할 - 700 / 150 / 150

 

CRISP-DM 분석 방법론

  • Cross Industry Standard Process for Data Mining
  • 계층적 프로세스 모델 (4레벨-6단계)

  • CRISP-DM 분석 절차

 

빅데이터 분석 방법론

  • 분석 절차

  • 분석기획
    • 비즈니스 이해, 프로젝트 정의, 계획 수립(기준 설정, KPI), 위험 식별(WBS, 작업 분할도)
    • 위험 대응 계획 수립(암기!)
      • 회피: 발생 원인 제거
      • 전이: 제3자에게 이전
      • 완화: 용인 가능 임계치까지 관리
      • 수용: 실제 발생 시에만 대응
  • 데이터 준비
    • 데이터 정의, 획득 방안 수립(법적 이슈 고려), 데이터 스토어 설계, 수집 및 저장, 정합성 점검
  • 데이터 분석
    • 분석용 데이터셋 준비, 탐색적 데이터 분석(EDA), 시각화, 분할(과적합 방지/모델 검증), 모델링
    • 모델 적용 및 운영 방안(알고리즘 설명서, 모니터링 방안 작성 등)
    • 모델 평가, 검증(시험 데이터)

 

 

 

 

👉🏻  2과목의 2번째 파트는 다음 포스트에 이어서 정리하도록 하겠습니다! :)

 

 

 

 

 

 

 

반응형
LIST