본문 바로가기

The Most Advanced Premium Learning Platform

IGM세계경영연구원

파이썬 활용 중급

현업 데이터 분석 과정

데이터 불러오기…시작을 어떻게 시작했더라?
데이터 분석 타이타닉, 아이리스 데이터로 할 땐 쉬웠는데
내 데이터에선 왜 분석이 안될까?


이젠 기초가 아닌 실전으로 들어가야 하는 시점!


데이터 전체를 보면서 맥락을 파악하여 분석 목적을 맞춰 데이터에 숨겨진 비즈니스 의사결정에 필요한 정보를 찾아볼 수 있습니다.

더이상 이론 따로 현업 따로 교육이 아닌 배운 내용을 협업데이터로 바로 적용할 수 있는 실전형 프로젝트 교육을 통해 차원이 다른 업무의 효율성과 효과성을 경험해보세요!

교육목표

  • 다양한 형태의 데이터를 탐색하고 적합한 분석 기법을 활용할 수 있는 역량을 확보하여 분석의 자신감을 향상시킨다.
  • 데이터 분석 프로세스 이해를 바탕으로 파이썬 주요 라이브러리 사용하여 효과적으로 데이터를 분석할 수 있는 방법론을 학습한다.
  • 파이썬 데이터분석 핵심 스킬을 학습하고 현업 데이터 또는 공공데이터를 기반으로 문제해결형 분석 프로젝트 실시한다.

과정 특징

  • 분석 프로세스 핵심 강의
  • 데이터 맥락 읽기
  • 현직자 꿀팁 방출!
  • 나만의 분석을 위한 1:1 코칭
  • 실습형 코칭
  • 데이터분석의 70%는 전처리! 분석 프로세스대로 스텝 바이 스텝! 학습하고 중요한 전처리와 시각화 단계에서는 그 비중을 높여 핵심만 강의
  • 데이터는 쌓여만 가는데.. 정작 중요할 땐 못 쓴다! 필요에 맞게! 타입에 맞게! 데이터를 쌓는 방법부터 그 데이터를 활용부분까지 다룬다
  • 데이터 없다면 필요 데이터 구하는 방법, 현직자만 알 수 있는 리얼 꿀팁으로 준비하여 데이터 분석을 가공/전처리/시각화까지 각 단계별 빠르고 정확하게 처리
  • 똑같은 데이터로 똑같은 분석법을 가진 천편일률적 프로젝트가 아닌 3일간의 교육 후 교수자와 1:1 코칭을 통해 나만의 문제로 내가 풀고자 하는 분석법을 가지고 프로젝트 실시

이 과정을 선택하는 이유

  • 데이터 분석의 전문가 직강!

    L*, S* 등 연간 데이터 분석 교육 시간만 1000시간! 실제 현업에서 데이터분석을 가진 축척 된 노하우를 가지고 있는 수준 높은 전문가들로 구성된 프리미엄 교육

  • 현업 데이터 분석을 위한 실전 예제로 반복 학습!

    데이터 분석이 분석만 잘 하는게 아니라 바로 업에 대한 이해, 데이터에 대한 이해를 뒷받침해야 한다. 그렇기 때문에 이번 강의는 영타 연습으로 끝나는 게 아닌 진짜 데이터와 현업을 연결하여 의미있는 데이터 분석과 분석의 결과물을 가지도록 실시

사용 라이브러리/툴

  • Jupyter Notebook
    주피터 노트북

    오픈소스 기반의 웹플랫폼으로 다양한 프로그래밍 언어로
    코드 작성 및 실행하는 통합개발환경(IDE)

  • Colaboratory
    Colab : 코랩

    설치 없이 브라우저 내에서 Python 스크립트를 작성하고 실행할 수 있는
    일종의 온라인 텍스트 에디터

  • Pandas
    판다스

    데이터를 분석 및 조작하기 위한 파이썬 패키지로,
    데이터 자료 구조를 다루는 데에 필수 라이브러리

  • Seaborn
    씨본

    matplotlib으로 기반으로 구동되는 통계 데이터 시각화 라이브러리

  • SciPy
    사이파이

    Numpy 기반으로 구동되는 수치 계산 라이브러리

  • Numpy
    넘파이

    수치해석용 파이썬 패키지로, 주로 벡터, 행렬 등 수치 연산을 수행하는
    선형대수 계산에 주로 사용

  • Matplotlib
    맷플로립

    NumPy 라이브러리를 활용한 시각화 라이브러리

  • Scikit-learn
    사이킷런

    머신러닝 알고리즘 사용을 위한 필수 라이브러리

  • Yellow Brick
    옐로브릭

    머신러닝 알고리즘의 시각화 라이브러리

커리큘럼

  • Day 1
  • Day 2
  • Day 3
  • Day 4
  • Pandas 리뷰를 통한 데이터 분석 핵심 실습

    • 기본 학습
      - 데이터 사이언스 기본 이해
    • 분석 내용 소개
      - 예제1. 한국 거래소(KRX) 전체 상장목록 분석 개요
    • 판다스를 통한 파일 로드와 기초 기술통계
      - Pandas를 통한 파일 저장과 불러오기
      - head, tail, sample을 통한 일부 데이터 가져오기
      - 기술통계 값 구하기와 자료의 해석
      - 색인하기 : df[컬럼], df.loc[행], df.loc[행, 열], df.loc[조건식, 열]
    • 색인과 정렬 빈도 분석 및 집계 연산
      - 다중공선성 변수 탐색 : 분산팽창지수
      - 오즈비 확인 : 로지스틱 회귀모형의 해석
      - 표준화 회귀계수 확인 : 목표변수에 대한 상대적인 영향력 확인
      - 목표변수의 추정확률 생성
      - 분류모형의 성능 평가 : 혼동행렬, F1 점수, ROC 곡선
    • 빈도 분석 및 집계 연산
      - 판다스를 활용한 데이터 시각화 : 히스토그램, 막대그래프, 선그래프, 산점도
    • API를 통한 데이터 수집
      - FinanceDataReader를 통한 여러 종목 데이터 수집
    • 데이터 병합과 전처리
      - 전자장비와 기기 업종 여러 종목의 수익률 비교하기
      - API를 통한 데이터 수집 이해하기, 수집된 데이터의 최근 수익률 비교하기
      - 데이터 병합하기, merge() 와 concat() 차이 이해하고 적용하기
      - 같은 시점에 분할 매수했다면? 종목별 수익률 구하고 시각화 하기
    • 수업정리
      - 수업내용 wrap-up 및 데일리 퀴즈
      - Q&A 및 교육설문
  • 다양한 데이터 분석 실습

    • 데이터 분석 개요
      - 예제 2 : 네이버 증권 ETF 데이터 분석
    • 1단계 : 데이터 수집
      - JSON 데이터 다루기
    • 2단계 : 데이터 전처리
      - 텍스트 데이터 전처리 : ETF 명칭을 통한 브랜드, 인버스, 레버리지 등의 파생변수 생성
    • 3단계 : 분석과 시각화
      - 브랜드, 인버스, 레버리지에 따른 시가총액, 거래량, 3개월수익률 등 분석
      - 상관 분석을 통한 유사한 ETF 종목 찾기
    • 4단계 : 데이터셋 준비
      - 예제3 : 국가통계포털(KOSIS) 소개
      - 소재부품장비산업별 수출·수입 데이터 소개
      - tidy-data 분석하기 좋은 깔끔한 데이터 알아보기
      - 데이터 요약과 기초 기술통계
    • 5단계 : 데이터 전처리
      - 불필요한 데이터 찾고 제거, 데이터 타입 변경하기, 데이터 색인하기
      - 파생변수 만들기, 사용하지 않는 컬럼 제거, 데이터 저장하기
    • 6단계 : 데이터 분석과 시각화
      - groupby 와 pivot_table 응용
      - plotly 를 활용한 인터랙티브한 시각화, 평균과 합계, 데이터의 해석
      - 데이터 시각화와 small-multiple을 이해하고 서브플롯 시각화 하기
    • 수업정리
      - 수업내용 wrap-up 및 데일리 퀴즈
      - Q&A 및 교육설문
  • 온라인 커머스 데이터로 실전 데이터 분석 실습

    • 학습내용 및 데이터 소개
      - 예제4 : 온라인 커머스 데이터 이해하기
    • 데이터 전처리
      - 데이터 요약과 전처리
중복데이터 제거
결측치 제거
    • 마케팅지표 구하기
      - 상품, 고객, 기간 관점에서 데이터 분석하기

      - DAU, MAU, ARPPU 등의 지표를 이해하고 직접 분석하기
    • 리텐션 분석
      - 코호트 분석을 통한 Retention 구하기
    • RFM분석

      - 고객 군집화와 RFM 분석
RFM 모형 이해


      - 판다스의 qcut 을 활용한 RFM 모형 구현

    • 수업정리
      - 수업내용 wrap-up 및 데일리 퀴즈
      - Q&A 및 교육설문
  • 데이터 분석 프로젝트 실시

    • 과제 수행
      - 자신의 현업 데이터로 사전 과제 해결 실습
      - 데이터 입출력
      - 데이터프레임 전처리
      - 데이터 시각화
      - 기술통계 분석
    • 중간 발표
      - 중간 발표 및 1차 피드백 인당 5분 내외
    • 과제 발표 및 피드백
      - 최종 발표 및 피드백
    • 수업정리
      - 수업내용 wrap-up 및 데일리 퀴즈 - Q&A 및 교육설문

강사소개

박조은 오늘코드 대표

  • 전문분야

    파이썬 프로그래밍 기초, 공공데이터분석, 데이터 시각화 

    캐글을 통한 머신러닝 / 딥러닝 활용

  • 경    력

    10년이상 게임과 광고분야에서 웹 및 백엔드 개발자로 근무

  • 주요 프로젝트 및 강의경력

    오늘코드 You Tube (https://www.youtube.com/c/todaycode)

    네이버 커넥트 제단 부스트코스 데이터사이언스 강의 설계 및 교수자

    서울대 평생교육원, 서울대 환경대학원, 한양대 대학원 BK21, 한신대 파이썬 강의

    인프런, 기상청, 통계청, 서울대디지털재단 등 온라인 교육 콘텐츠 제작

    SK Telecom DataCamp, 한국능률협회, 대웅제약, 현대자동차 남양연구소, SK C&C 신입사원 연수 등 다수의 기업 강의

후기

  • 형** 프로

    퇴근 후 혼자 학습하기 힘들었던 점이 있었는데, 데이터를 활용해서 시각화하는 method를 많이 배워서 좋았다. 취미로 여러 데이터를 시각화하며 파이썬 학습을 계속 이어가겠다  

과정로드맵

  • 파이썬 Basic
  • 파이썬 Advanced
  • 파이썬 현업 데이터 분석
  • 데이터 분석 프로젝트

IGM Digtal Talent School 연계 과정

주소 : 서울특별시 중구 장충단로 8길 11-16 사업자등록번호 : 101-86-24196 대표자 : 조승용 전화 : 02-2036-8300 팩스 : 02-2036-8399 Copyright©주식회사 IGM 세계경영연구원. All rights reserved.
QUICK MENU
TOP