[데이콘 1-2] 따릉이 데이터를 활용한 데이터 분석 입문 (전처리)
·
🤓 기술 학습 & 공부 기록/Python
앞서 EDA를 통해 데이터셋을 전체적으로 살펴보았다.그리고 count값에 크게 영향을 미치는 변수 2가지를 상관계수가 높은 순으로 선정했다. 1. 1시간 전 온도 (상관계수 0.62)2. 1시간 전 풍속 (상관계수 0.48) 이제 본격적인 모델링에 앞서 데이터를 정제하는 전처리를 해본다. 참고로 파이썬에서는 Null 값과 NA 값을 따로 구분하지 않고 NaN이라고 통일하여 결측값으로 표현한다. 먼저 훈련용 데이터의 결측값를 찾아본다. train.isna().sum() isna() 함수는 결측치 확인하여 결측치면 True (1), 아니면 False (0)로 나타내준다.여기에 sum을 사용해서 결측치의 갯수를 확인할 수 있다.  온도와 풍속 데이터에 각각 2개, 9개의 결측값이 있는 것을 확인할 수 있다.이..
[데이콘 1-1] 따릉이 데이터를 활용한 데이터 분석 입문 (EDA)
·
🤓 기술 학습 & 공부 기록/Python
개인적으로 데이터 분석 프로젝트를 해보고 싶어 찾아보던 중에 데이콘이라는 사이트를 알게 되었다. https://dacon.io/ 데이터사이언티스트 AI 컴피티션3만 AI팀이 협업하는 인공지능 플랫폼dacon.io 언젠가 캐글에서 직접 프로젝트를 해보리라 생각했었는데 한국 플랫폼이 있어 쉽게 접근할 수 있을 것 같다. 대회 뿐만 아니라 기초부터 연습할 수 있는 코너도 마련되어 있어서 친숙해보이는 따릉이 관련 주제를 골랐다.  회원가입 후 연습 프로젝트에 참여했고 데이터셋을 다운받았다.  주제는 특정 기간동안의 따릉이 대여 데이터와 기상 데이터를 가지고 1시간 후의 따릉이 대여 수를 예측하는 모델을개발하는 것이다. 다행히도 입문자들을 위한 교육용 유튜브 강의가 제공된다. 1. EDA2. 전처리3. 모델링 이..
온라인 광고 용어 정리
·
📚 기타/마케팅
▶ 매체▷ Owned Media : 기업 소유 미디어예) 브랜드 공식 웹사이트, 공식 SNS 채널 등 ▷ Earned Media : 자발적 확산 미디어예) SNS, 텍스트 및 동영상 콘텐츠 등 ▷ Paid Media : 유료 미디어예) 디스플레이(배너) 광고, 프로모션 및 PPL 등  ▶ 기본▷ 노출 (Impression) : 광고노출횟수 (보장노출수, 예상노출수) 중복 허용 ▷ 클릭 (Click) : 유저가 광고를 클릭(반응)한 횟수 (보장클릭수, 예상클릭수) ▷ CTR (Click Through Rate) : 광고 클릭수 / 노출수 ▷ 조회 (View) : 영상을 일정 초(15초 또는 30초) 이상 조회한 횟수 ▷ VTR (View Through Rate) : 광고영상 조회수 / 노출수 ▷ 순방문자 ..
[SQL 100제#47-53] JOIN, LEFT JOIN, CASE
·
🤓 기술 학습 & 공부 기록/컴퓨터 일반
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 3주차 과제 풀이 (SQL 39~53번 문제) [강의내용] 문제47번) 고객 id별로 고객의 이름 (first_name, last_name), 이메일, 고객의 주소 (address, district), phone, city, country 를 알려주세요. 문제 46번처럼, customer_id 별 주소 이므로 SELECT절에서 맨 앞에 customer_id를 써주는 것을 유의하면 된다. SELECT c.customer_id, c.first_name, c.last_name, c.email, a.address, a.district, a.phone, ci.city, co.country FROM customer c JOIN add..
[SQL 100제#39-46] JOIN, LEFT JOIN
·
🤓 기술 학습 & 공부 기록/컴퓨터 일반
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 3주차 과제 풀이 (SQL 39~53번 문제) [강의내용] 문제39번) 고객의 기본정보인 고객id, 이름, 성, 이메일과 함께 고객의 address, district, postal_code, phone을 함께 보여주세요. 고객id, 이름, 성, 이메일 컬럼은 customer 테이블에 존재한다. 그리고 address를 비롯한 나머지 컬럼들은 address 테이블에 존재한다. 다른 테이블을 한 쿼리에서 사용하기 위해 FROM뒤에 JOIN을 써서 추가할 테이블을 입력해준다. 그리고 ON 뒤에 두 테이블간의 공통 컬럼을 적어준다. SELECT c.customer_id, c.first_name, c.last_name, a.addre..
[SQL 100제#30-38] OR, IN, IS NULL, IS NOT NULL
·
🤓 기술 학습 & 공부 기록/컴퓨터 일반
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 2주차 과제 풀이 (SQL 21~38번 문제) [강의내용] 문제30번) customer 테이블을 이용하여 이름이 Maria, Lisa, Mike에 해당하는 고객의 id, 이름, 성을 확인해주세요. 이름이 3개 중 하나라도 해당되는 고객들의 정보를 출력해야 한다. WHERE ~ IN (문자열 집합)을 사용하면 된다. SELECT customer_id, first_name, last_name FROM customer c WHERE first_name IN ('Maria', 'Lisa', 'Mike'); 문제31번) film 테이블을 이용하여, film의 길이가 100~120 에 해당하거나 rental 대여기간이 3~5일에 해당..