- 데이터 기반 의사결정과 비즈니스 체계 변화를 이해할 수 있다.
- 데이터 분석에 기초가 될 수 있는 파이썬의 동작원리 및 기본적인 문법을 익힌다.
- 다양한 데이터를 획득/생성/처리/분석/시각화 하는 구체적인 방법을 학습하여 업무 또는 연구에 데이터 분석을 할 수 있게 한다.
직관적이고, 간결한 문법!
프로그래밍 언어 중 가장 핫한 파이썬을 통해
효율적 데이터 분석을 시작해보자!
본 과정은 데이터 분석을 시작하기 위한 다양한 프로그래밍 언어 중 파이썬을 이해하고 데이터 활용할 수 있도록 데이터를 파악, 전처리 및 시각화까지 꼭 알아야 할 내용을 중심으로 콤팩트하게 구성된 기초 과정입니다.
데이터를 통해 문제를 정의해보고 가설을 바탕으로 방법론을 적용 하면서 검증해 나가는 실무형 과정으로 프로그래밍이 처음 시작 하는 사람을 더 빠르게 몰입하고 더 깊이 있게 파이썬 데이터 분석의 세계로 이끕니다.
교육목표
과정 특징
이 과정을 선택하는 이유
사용 라이브러리/툴
오픈소스 기반의 웹플랫폼으로 다양한 프로그래밍 언어로
코드 작성 및 실행하는 통합개발환경 (IDE)
설치 없이 브라우저 내에서 Python 스크립트를 작성하고 실행할 수 있는
일종의 온라인 텍스트 에디터
수치해석용 파이썬 패키지로, 주로 벡터, 행렬 등 수치 연산을 수행하는
선형대수 계산에 주로 사용
데이터를 분석 및 조작하기 위한 파이썬 패키지로,
데이터 자료 구조를 다루는 데에 필수 라이브러리
커리큘럼
- 데이터 사이언스와 통계학
- 데이터 사이언스 벤다이어그램
- 데이터와 인공지능의 관계
- 파이썬 객체의 특징
- 숫자(실수, 정수), 다양한 연산자(산술, 비교, 논리, 할당)
- 문자열 생성, 문자열 인덱싱 및 포맷팅
- 리스트 생성, 인덱싱/슬라이싱, 원소 추가/삭제/변경
- 딕셔너리 생성, 원소 추가/삭제/변경
- while 반복문
- def 사용자 정의 함수
- 람다 표현식
- while 반복문
- def 사용자 정의 함수
- 람다 표현식
- 1차원 배열 생성
- 다양한 1차원 배열 생성
- 1차원 배열 인덱싱 및 슬라이싱
- 2차원 배열 생성
- 배열의 재구조화
- 2차원 배열 인덱싱 및 슬라이싱
- 배열 산술 연산 : 브로드 캐스팅
- 1차원 Series, 2차원 DataFrame 생성 및 둘러보기
- 1차원 시리즈 생성
- 1차원 시리즈 확인 : 차원, 원소 개수, 자료형
- 1차원 시리즈 인덱싱 및 슬라이싱
- 비트 연산자
- 얕은 복사 vs 깊은 복사
- 2차원 데이터프레임 생성
- 2차원 데이터프레임 확인 : 차원, 행/열 개수, 자료형 등
- 엑셀(xlsx) 파일 입출력
- 문자 인코딩의 이해
- 텍스트(csv) 파일의 인코딩 방식 확인
- 텍스트(csv) 파일 입출력
- 압축 파일 입출력
- 데이터프레임 인덱싱 및 슬라이싱
- 열(컬럼) / 행(로우) 선택(select) /삭제(drop)
- 열이름(컬럼명) 변경(rename) /자료형 변환(mutate)
- 조건에 맞는 행 선택(filtering)
- 시리즈의 비교 연산 함수
- 시리즈를 문자열로 처리하는 함수
- 결측값 처리 : 단순대체 및 행 삭제
- 데이터프레임 열 삽입(insert)
- 시리즈 데이터 지연(lagging)
- 시리즈 데이터 이동평균(moving average)
- 연속형 변수의 구간화(binning)
- 같은 함수 반복 실행(map, apply, applymap)
- 데이터프레임 정렬(arrange) 등
- 결측값 처리 : 단순대체 및 행 삭제
- 데이터프레임 열 삽입(insert)
- 시리즈 데이터 지연(lagging)
- 시리즈 데이터 이동평균(moving average)
- 연속형 변수의 구간화(binning)
- 같은 함수 반복 실행(map, apply, applymap)
- 데이터프레임 정렬(arrange) 등
- 데이터에 잠재되어 있는 패턴 시각화 및 인사이트 발굴
- 커널 밀도 추정 곡선 추가
- 히스토그램 겹쳐서 그리기
- 히스토그램 나눠서 그리기
- 팔레트 설정 및 사용자 팔레트 생성
- 상자 수염 그림 그리기(일변량 연속형)
- 집단별 상자 수염 그림 그리기(이변량 범주형 & 연속형)
- 막대그래프 그리기(일변량 범주형)
- 막대그래프에 텍스트 추가 등
강사소개
R과 Python 프로그래밍 기초, 통계 분석, 데이터 시각화, 머신러닝, 웹 크롤링, 텍스트 마이닝, 업무자동화
헬로데이터사이언스 대표 (2019 ~ 현재)
IGM세계경영연구원 겸임교수 (2022 ~ 현재)
aSSIST MBA 객원교수 (2021 ~ 현재)
하나금융경영연구소, 데이터 사이언티스트 (2013 ~ 2019)
하나카드, 데이터 분석가 (2010 ~ 2013)
현대캐피탈, 데이터 분석가 (2009 ~ 2010)
삼성화재해상보험, 데이터 분석가 (2002 ~ 2009)
SK하이닉스, LG전자, LS그룹, 삼성전기, LG인화원, GH SHOP, SK C&C, SK이노베이션, PoscolCT, ktds, KB 국민카드, GS 칼텍스, 한국언론재단 소속 언론사 다수
파이썬 프로그래밍 기초, 공공데이터분석, 데이터 시각화
캐글을 통한 머신러닝 / 딥러닝 활용
10년이상 게임과 광고분야에서 웹 및 백엔드 개발자로 근무
오늘코드 You Tube (https://www.youtube.com/c/todaycode)
네이버 커넥트 제단 부스트코스 데이터사이언스 강의 설계 및 교수자
서울대 평생교육원, 서울대 환경대학원, 한양대 대학원 BK21, 한신대 파이썬 강의
인프런, 기상청, 통계청, 서울대디지털재단 등 온라인 교육 콘텐츠 제작
SK Telecom DataCamp, 한국능률협회, 대웅제약, 현대자동차 남양연구소, SK C&C 신입사원 연수 등 다수의 기업 강의
후기
다양한 data 시각화 방법, 주피터 노트북으로 손쉽게 데이터 분석을 할 수 있었고 데이터를 어떻게 바라봐야 하는지 사전 기획의 중요성을 알게 되었다.
예제를 통해 코드 한줄 한줄 학습할 수 있어 이해에 많은 도움이 되었으며 짧은 교육기간 내 배울 수 있는 최대치를 학습 할 수 있었다.
과정의 취지에 맞게 기초 수준부터 다뤄져서 학습에 몰입할 수 있었고,강사님도 수준에 맞게 잘 설명해주셔서 파이썬 기초지식을 습득할 수 있었다. 회사 생활과 개인 역량 계발에 많은 자극이 되었습니다.
과정로드맵
IGM Digtal Talent School 연계 과정
Family Site