본문 바로가기

[패스트캠퍼스] 데이터분석부트캠프

(36)
[3주차] SQL: 그룹화(GROUP BY, HAVING) 키워드 작성 순서 실행 순서 SELECT 1 5 FROM 2 1 WHERE 3 2 GROUP BY 4 3 HAVING 5 4 ORDER BY 6 6 # 데이터베이스 생성 DROP DATABASE IF EXISTS pokemon; CREATE DATABASE pokemon; # 데이터베이스 지정 USE pokemon; # 테이블 생성 CREATE TABLE mypokemon ( number INT, name VARCHAR(20), type VARCHAR(10), height FLOAT, weight FLOAT ); # 데이터 삽입 INSERT INTO mypokemon (number, name, type, height, weight) VALUES (10, 'caterpie', 'bug', 0.3, 2.9)..
[3주차] SQL: ORDER BY, RANK, 함수(문자열, 날짜, 숫자) /* RANK - SELECT절에 사용 SELECT 컬럼이름, ..., RANK() OVER(ORDER BY 컬럼 ASC/DESC) FROM 테이블이름 WHERE 조건; */ SELECT name, attack, RANK() OVER(ORDER BY attack DESC) AS attank_rank FROM mypokemon; ** RANK, DENSE_RANK, ROW_NUMBER /* DENSE RANK() OVER (ORDER BY 컬럼이름) ROW_NUMBER() OVER (ORDER BY 컬럼이름) */ # 순위 함수 비교 SELECT name, attack, RANK() OVER (ORDER BY attack DESC) AS rank_rank, DENSE_RANK() OVER (ORDER BY..
[3주차] SQL: WHERE, 문자열 검색, NULL # 데이터베이스 생성 DROP DATABASE IF EXISTS pokemon; CREATE DATABASE pokemon; # 사용할 데이터베이스 지정 USE pokemon; # 테이블 생성 CREATE TABLE mypokemon ( number INT, name VARCHAR(20), type VARCHAR(10), height FLOAT, weight FLOAT, attack FLOAT, defense FLOAT, speed FLOAT ); # 데이터 삽입 INSERT INTO mypokemon (number, name, type, height, weight, attack, defense, speed) VALUES (10, 'caterpie', 'bug', 0.3, 2.9, 30, 35, 45),..
[3주차] SQL: SELECT # 데이터베이스 생성 DROP DATABASE IF EXISTS pokemon; CREATE DATABASE pokemon; # 사용할 데이터베이스 지정 USE pokemon; # 테이블 생성 CREATE TABLE mypokemon ( number INT, name VARCHAR(20), type VARCHAR(10), height FLOAT, weight FLOAT, attack FLOAT, defense FLOAT, speed FLOAT ); # 데이터 삽입 INSERT INTO mypokemon (number, name, type, height, weight, attack, defense, speed) VALUES (10, 'caterpie', 'bug', 0.3, 2.9, 30, 35, 45),..
[3주차] SQL: 데이터베이스 생성, 변경, 삭제 # 모든 데이터베이스 목록 보기 SHOW DATABASES; DROP DATABASE IF EXISTS pokemon; # 데이터베이스 만들기 CREATE DATABASE pokemon; # 사용할 데이터베이스 지정 USE pokemon; # 테이블 만들기 CREATE TABLE mypokemon ( number INT, name VARCHAR(20), type VARCHAR(10) ); # 데이터 삽입 INSERT INTO mypokemon (number, name, type) VALUES(10, 'caterpie', 'bug'), (25, 'pikachu', 'eletric'), (133, 'eevee', 'normal'); # 테이블 만들기2 CREATE TABLE pokemon.mynewpokem..
[2주차] 엑셀: 기초 통계 2, 프로젝트 실습 ④ 시계열 데이터 : 시간의 흐름에 따라 발생한 데이터 : 과거 시계열 데이터 특성 파악 및 미래 데이터 예측 지수평활법(일변량, 정상시계열분석) : 예측값 = 과거 실제 값 * α + 과거 예측값 * (1-α) ** α = 실제값을 반영할 가중치(0~1) 엑셀 함수: FORECAST.ETS : FORECAST.ETS(예측할 날짜, 과거의 실제 값들, 실제 값들의 날짜, [계절주기], [누락데이터처리], [중복시계열처리]) * 계절 주기: 0 - 주기 없다고 가정, 1(디폴트) - 자동 예측, 2 이상 - 해당 주기로 예측 ** 너무 디테일하면 정확도↓ * 누락데이터처리: 0 - 0으로 계산, 1(디폴트) - 평균으로 계산 * 중복데이터처리: 1(디폴트) - 평균, 2~7 엑셀참조,,, ↓ [더보기] 시..
[1주차] 엑셀: 기초 통계 1 1. 통계학 1) 통계학의 개념과 목적 : 표본의 특성으로 모집단의 특성에 대해 추론하는 원리와 방법을 배우는 학문 : 주관적인 감보다는 객관적인 자료 및 수치를 통계적 기법을 활용하여 해석해서 문제 해결에 필요한 인사이트 도출 2) 통계학의 구분 : 기술 통계학과 추론 통계학 ① 기술 통계학(Descriptive Statistics) : 요약 통계량, 그래프, 표 등을 이용해 데이터를 정리, 요약하여 데이터이 전반적인 특성을 파악하는 방법 ② 추론 통계학(Inference Statistics) : 가설 검정 : 데이터가 모집단으로부터 나왔다는 가정하에 모집단으로부터 추출된 표본을 사용하여 모집단의 특성을 파악하는 방법 3) 기초 통계 ① 기초 통계 용어 모집단: 모든 데이터 표본: 모집단의 데이터를 분..
[1주차] 엑셀: 시각화_차트, 조건부서식 6. 데이터 시각화 1) 심화 차트(콤보/거품/폭포형) : 차트는 숫자로 그리는 것 ① 콤보형 차트 : 2개 이상의 정보를 표현 : 데이터 범위 선택 - [막대형 차트]삽입 - 그래프의 막대 선택 - 마우스 우클릭 - [계열 차트 종류 변경] ② 거품형 차트 : 숫자의 크기나 비율을 거품으로 나타냄 : 거품의 위치나 거품의 크기, 거품의 색 등을 활용해 정보를 표현 : 거품형은 먼저 빈 차트를 생성 후 우클릭해서 [데이터 선택] - [추가]에서 데이터를 입력하는 것이 효율적 차트 축이 음수인 것을 바꾸고 싶다면 축에 대고 우클릭 - [축 서식] - 최소값을 0으로 바꿔주면 됨. 버블에 우클릭 - [데이터 계열 서식] - 오른쪽 바에 채우기 - 요소마다 다른 색 사용 체크 ③ 폭포형 차트 :숫자의 중가, ..