[선형회귀] 고객별 연간 지출액 예측하기 - 1
·
✏️ Study/🐍 Python
▶ 강의명▷ [패스트캠퍼스] 파이썬을 활용한 이커머스 데이터 분석 ▶ 주제▷ ch2. 고객별 연간 지출액 예측 (Linear Regression) -- 강의 내용 -- 01. 분석의 목적 선형회귀분석을 통해 고객체류시간 등과 같은 독립변수로 고객별 연간 지출액을 예측하는 모델을 개발한다. 02. 모듈 및 데이터 로딩 import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns >> 선형회귀, 그래프에 라인 그리기, 로데이터 읽어오기 등을 위한 모듈을 불러온다.pd, np 등과 같은 약어는 일반적으로 자주 쓰는 약어이기 때문에 잘 알아두자 data = pd.read_csv('eCommerce.csv') >>..
[패스트캠퍼스] Python을 활용한 이커머스 데이터 분석 - Intro
·
✏️ Study/🐍 Python
▶ 강의명▷ [패스트캠퍼스] 파이썬을 활용한 이커머스 데이터 분석 ▶ 주제▷ ch1. Intro -- 강의 내용 -- 01. 강의 소개 및 Tips02. 머신 러닝이란 ▶ 머신 러닝1. 지도 학습(supervised learning)- 선행적으로 데이터라벨링 수행 2. 비지도 학습(unsupervised learning)- 클러스터링 등 3. 강화 학습(reinforcement learning)- 고난이도의 분석03. Jupyter Notebook 설치 ▶ 주피터 노트북이란?▷ 데이터 분석에 최적화된 파이썬 에디터 (구글 코랩과 비슷)▷ 파이썬 에디터 중에서 파이참이 개발용 에디터라면 주피터 노트북은 데이터 분석용 에디터이다04. Jupyter Notebook 기본 사용법 ▶ 단축키셀 누르고 a 입력 :..
클라우드 시장 세계 1위, 아마존의 AWS(Amazon Web Services)
·
✒️Notes/✈️스크랩
▶ 참고한 영상 https://youtu.be/FjvWHZ9Lkyo ▶ 아마존에 있어 AWS의 중요성 - AWS가 아마존 매출에서 차지하는 비율 : 10% 내외 - but, 아마존 전체 영업이익의 60~70%는 AWS에서 나옴 (2020년) - 즉, AWS는 아마존의 캐시카우 역할을 함. ▶ AWS는 왜 생겨났는가? - 애플은 모바일의 시대를 열었고 아마존의 클라우드의 시대를 열었다. - 아마존 사내 부서들끼리 전부 제각각 개발 인프라를 구축하던 것을 하나로 통합하며 API를 기반으로 네트워크화 - 2006년 시장에 공식 출시, 클라우드라는 개념을 처음 보급하며 클라우드에 컴퓨팅 기능을 얹음. ▶ AWS가 아마존 전체에 차지하는 수익 비중 - AWS의 2018년 영업이익 8조원, 2019년 10조원, 2..
태블로 신병훈련소 6일차 (테이블 계산식, ZN, LOOKUP, BUFFER)
·
🗄️ Archived/🦶 비개발
▶ 목차1. 테이블 계산식 - 차이 ▶ 1. 테이블 계산식 - 차이▷ 주식 데이터를 가지고 전일 대비 종가가 상승했는지 하락했는지 나타내는 차트를 아래와 같이 그려 본다 2019년 종가 그래프전일 대비 상승 -> 주황색전일 대비 하락 -> 빨간색종가가 전일과 동일 -> 파란색  ▷ 그래프 준비1) 종가 측정값을 행 선반에 옮긴다2) 날짜 차원을 열 선반에 옮긴다3) 이중축을 그려주기 위해 종가 측정값을 복사하고, 하나는 원, 하나는 라인으로 설정하고 이중축을 설정해 준다 ▷ 등락 여부에 따라 색상 표현1) 새로운 종가 측정값을 행 선반에 놓고 퀵테이블 계산에서 차이를 설정한다 2) 퀵테이블 계산은 기본적으로 빨간 박스상태로 계산되는데, 이전 일자에 대한 차이를 나타낸다.   ※ 최초 일자(1월2일)는 이..
태블로 신병훈련소 5일차 (커스텀 맵 사용, MAKEPOINT, MAKELINE, BUFFER)
·
🗄️ Archived/🦶 비개발
▶ 목차1. 배경 이미지를 이용한 Custom Map 사용하기2. 공간 테이블 계산을 이용한 맵 활용3. Buffer 함수를 이용한 맵 활용 ▶ 1. 배경 이미지를 이용한 Custom Map 사용하기▷ 수도권 지하철 노선도 위에 평균 승하차승객수를 표시해보자  ▷ 배경 이미지로 지하철 노선도 사용하기1) 메뉴 > 맵 > 배경 이미지 > 해당 데이터 원본 클릭 > 이미지 추가2) X필드 값 선택(데이터의 X좌표값에 해당하는 필드) > 왼쪽~오른쪽 값에 이미지 크기 입력3) Y필드 값 선택(데이터의 Y좌표값에 해당하는 필드) > 아래쪽~위쪽 값에 이미지 크기 입력    예) 배경 이미지 사이즈를 2040 x 1654로 하려는 경우, (왼, 오) = (0, 2040), (아, 위) = (0, 1654)4) 필..
태블로 신병훈련소 4일차 (라인차트, 하이라이트 테이블, 퀵테이블 계산, 덤벨차트, 이중축)
·
🗄️ Archived/🦶 비개발
▶ 목차1. 라인차트2. 하이라이트 테이블3. 테이블 계산식(퀵테이블 계산)을 이용한 시간 분석4. 덤벨차트 ▶ 라인차트▷ 라인차트는 시간의 흐름에 따라 데이터의 패턴과 트렌드를 확인하는데 자주 사용되는 시각화이다 ▷ 월별 미세먼지 평균지수를 라인차트로 확인하면 아래와 같다  - 2010년부터 2020년까지 연속된 형태로 미세먼지 트렌드를 확인할 수 있다.- 계절적으로 봄마다 수치가 높은 패턴을 확인할 수 있다. ※ 열 선반의 월(기준년월)은 연속형으로 설정되어야 끊어지지 않는 연속된 형태로 그려진다(아래 사진을 참고하여 아랫단의 '00년 0월'과 같은 형태가 되어야 한다)  ※ 기준년월이 불연속형인 경우 아래처럼 끊어진 형태의 그래프가 나타날 수 있다  ▷ 이번에는 연도와 상관없이 월별 평균 미세먼지 ..
태블로 신병훈련소 3일차 (매개변수, 측정값 변경)
·
🗄️ Archived/🦶 비개발
▶ 목차1. 매개 변수를 사용하여 측정값 변경하기1 & 마크 색상 표현하기2. 매개 변수를 사용하여 측정값 변경하기23. 대시보드 작업(동작) 적용하기 ▶ 매개 변수 만들기  위의 사진처럼 카테고리별 카페인 함량(측정값의 종류와 수치 선택 가능)을 카페인 함유량에 따라 색상을 표현할 수 있다. 맨 우측에서 측정값 선택, 카페인 함유량 선택과 같은 선택창을 사용하기 위해 매개 변수를 사용한다. 우선 측정값을 지정하는 매개 변수를 만들어준다. - 이름 : 측정값 선택 - 데이터 유형 : 문자열 - 허용 가능한 값 : 목록      - 값 목록 : 칼로리, 카페인, 당류  이제 계산된 필드를 만들어 만들어진 매개 변수를 이용할 수 있도록 한다. 이 계산된 필드(선택한 측정값)는 매개 변수(측정값 선택)에서 지..
태블로 신병훈련소 2일차 (워드클라우드, 박스플롯, 계산된 필드, DATEDIFF 함수)
·
🗄️ Archived/🦶 비개발
▶ 목차1. 워드클라우드2. 박스플롯3. 계산된 필드 만들기4. 필터 적용해보기 ▶ 워드클라우드▷ 워드클라우드를 활용해 가장 칼로리가 높은 스타벅스 메뉴명을 확인해보자  ▷ 방법1. 행 선반에 메뉴명, 열 선반에 칼로리를 추가2. 표현방식 >> 버블 선택3. 마크를 원에서 텍스트로 변경4. 마크 선반 색상에 칼로리 추가 ▶ 박스플롯▷ 카테고리별 메뉴들의 칼로리를 박스플롯으로 표현해보자 (카페인이 높은 메뉴들도 동시에 표현)  ▷ 방법1. 열 선반에 카테고리, 행 선반에 칼로리를 추가2. 마크 선반 세부정보에 메뉴명을 추가    ※ 메뉴별로 세부기준을 잡음3. 표현방식 >> 박스플롯 선택4. 카페인도 함께 표시하기 위해 마크 선반 색상에 카페인을 추가 ▶ 계산된 필드 만들기▷ 측정값 필드에 매출과 수익은 ..