본문 바로가기

[패스트캠퍼스] 데이터분석부트캠프

(36)
[7주차] Python: 데이터 분석 미니 프로젝트_사전 자료조사 혹시나 해서 최종 자료말고는 내가 했던 사전 조사나 EDA, 분석 위주로 정리 주제는 최근 5년간 급격히 변한 서울 부동산 시장, 2030세대(영끌족) 중심 주제를 정하고 각자 주제에 대해 뭘 할 수 있을지 어떤 데이터를 구할 수 있을지 찾아보기로 함 파일 공유할 때 넣어놓은 참고 메모 ### 드리는 말씀 0. 분석을 이런식으로 진행하면 좋지 않을까 하는 것을 보여드리기 위함이니 시각적인 것, 또 너무 디테일한 숫자는 신뢰하지 않으셔도 돼요,,,ㅎㅎㅎㅎ 적어가며 해야 생각이 정리되어 혼잣말 같은 것들이 툭툭 튀어나올 수도 있어요,,, 1. 죄송해요...저는 생각이 기발하지 못한 것 같아요... 여러분들의 아이디어와 데이터를 모아 변수를 더 늘리기로 해요. 저도 열심히 돕겠습니다ㅠㅠ 2. '변동'률 데이터..
[9주차] 태블로: 기본 인터페이스 1. 태블로 인터페이스 1) 데이터 연결창 2) 데이터 준비창 ** csv 파일은 Microsoft Excel 통해서가 아닌 텍스트 파일 통해서 불어올 수 있음 태블로에서는 기본적으로 드래그앤 드랍으로 작동 - 1000개까지 보여줌(설정 가능) - 태블로에서는 원본 수정 불가능(태블로는 시각화 프로그램) - 왼쪽바에서 데이터 해석기는 사람이 수작업으로 해줘야하는 셀병합 데이터 등 같은 경우를 자체적으로 클렌징을 해줌 - 오른쪽 상단의 필터 → 작업창으로 넘어가기 전에 필요한 데이터만 필터링할 수 있게 ** 여기서 말하는 필터는 데이터 원본 필터, 태블로에서는 데이터 원본 필터뿐만 아니라 다양한 종류의 필터를 지원하고 있음. - 오른쪽 상단 필터 옆의 연결 - 라이브: 지금은 엑셀인 원본이 (서버, 클라우..
[6주차] Python: 크롤링 크롤링(crawling) : 스크래핑(scraping)이라고도 하며, 웹페이지를 그대로 가져와서 인터넷 상의 데이터 추출 : 크롤링하는 소프트웨어을 크롤러(crawler)라고 부름. 0. 한글 깨짐 방지 코드 import matplotlib.font_manager as fm # 본인이 원하는 폰트 찾아서 path 넣어주면 됨 # \하나만 쓰면 오류 잘나니까 \\ 2개 쓰기 font_path = 'C:\\Windows\\Fonts\\NanumBarunGothicLight.ttf' font = fm.FontProperties(fname=font_path).get_name() # plt.rc('font', family='NanumBarunGothic') 1. 기본 패키지, 함수 실습 1-1. 관련 모듈, 패키..
[5주차] Python: List List: List는 순서가 있는 데이터 타입으로 for과 함께 사용 가능 순서를 index라고 함. 인덱스는 0부터 시작 맨 처음은 0 맨 마지막은 -1 list를 슬라이싱해도 list : 선택을 하는거지 기존 리스트를 파괴하는 것이 아님 List Comprehension : 리스트를 더 간단하게 표현하기 : 기존 list갑을 기반으로 새 list를 만들려는 경우 더 짧은 구문 제공 colors = ['black', 'white', 'red', 'purple', 'blue', 'red', 'green'] # append 사용 new_list = [] for x in colors: if 'b' in x: new_list.append(x) print(new_list) # list comprehension ..
[5주차] Python: 제어문(if, elif, else) 제어문 control flow statements : 프로그램의 흐름을 제어하는 경우에 사용하는 실행문 : 조건문과 반복문 1. 조건문 if 조건 1: 실행할 명령문 elif 조건 2: 실행할 명령문 elif 조건 3: 실행할 명령문 ... else: (상단의 모든 조건에 해당하지 않을 때) 실행할 명령문 ** 명령 블록 : 명령어들로 이루어진 블록 단위 : 파이썬에서는 들여쓰기(indentation)로 명령 블록을 구분하고 그에 따라 실행 순서 결정되니 유의해서 쓰기(제대로 안쓰면 error) # 조건문 """ # 1 카페a와 카페b가 있다. 이 둘 중 더 가격이 낮은 곳으로 가려고 함. 만약 가격이 같은 경우, 카페 a를 감. 카페가 정해진 경우 '[정해진 카페 이름]로 가자!'를 출력 각 카페의 커..
[5주차] Python: 파이썬 데이터 타입, 변수 1. 데이터 타입 type() : 데이터 타입(자료형)을 출력하는 함수 int:정수 float: 실수 string: 문자 list: 리스트 boolean: True/False로 표현하는 자료형 ** string은 인덱싱, 슬라이싱 가능 ** 숫자 형태의 문자열, 문자 형태의 숫자는 서로 변환 가능 : int, float ↔ str 2. 변수 variable : 객체를 가리키는 이름, 대입 연산자라고도 함 # 변수 예제 # 1. 숫자형 1과 2를 더하는 sum이라는 변수 만들기 sum = 1 + 2 print(sum) # 2. 치킨값 숫자 변수 만들기 price_fried = 20000 price_seasoned = 21000 price_hot = 15000 print('매운 치킨 가격: ', price_..
[5주차] Python: Jupyter Notebook Markdown ## Markdown의 사용 **bold text** *italicized text* > blockquote ------------- # 3개 이상 구분선 1. First item 2. Second item 3. Third item - First item - Second item - Third item `print('hello_world')` -- code [title](링크) ![alt text](image.jpg) | This | is | |------|----| | a |table| # Markdown 실습 ## Welcome to PIZZA Party -------------------------- | | 이름 | 가격 | |-------|-------|-------| | 1 |페퍼로니 피자| 1..
[4주차] SQL: PIVOT, OVER, PARTITION BY 1. PIVOT : 데이터의 행과 열을 90˚ 회전 : 따로 함수가 있는 것은 아님 : 이번엔 CASE WHEN 이용 # 월별 주문 수 SELECT MONTH(OrderDate), COUNT(*) FROM Orders GROUP BY MONTH(OrderDate) SELECT SUM(CASE WHEN MONTH(OrderDate) = 1 THEN 1 END) AS '1월', # 1월이면 1을 더하기 SUM(CASE WHEN MONTH(OrderDate) = 2 THEN 1 END) AS '2월', SUM(CASE WHEN MONTH(OrderDate) = 3 THEN 1 END) AS '3월', SUM(CASE WHEN MONTH(OrderDate) = 4 THEN 1 END) AS '4월', SUM(C..