[프로그래머스] SQL 코딩테스트 연습 03. 우유와 요거트가 담긴 장바구니
·
✏️ Study/MySQL
데이터셋 확인은 이전글 참조 2021.08.09 - [SQL/MySQL] - [프로그래머스] SQL 코딩테스트 연습 01. DB 확인 [프로그래머스] SQL 코딩테스트 연습 01. DB 확인 프로그래머스 사이트에서 SQL 문제를 풀어볼 수 있다. https://programmers.co.kr/learn/challenges?tab=sql_practice_kit 코딩테스트 연습 기초부터 차근차근, 직접 코드를 작성해 보세요. programmers.co.kr 프.. ggarden.tistory.com 이번에 풀 문제는 Summer/Winter Coding(2019)의 우유와 요거트가 담긴 장바구니 문제이다. 지난번 문제와 마찬가지로 Level 4에 랭크되어 있지만 구하고자 하는 것이 명확해서 체감난이도는 어렵..
[프로그래머스] SQL 코딩테스트 연습 02. 입양 시각 구하기(2)
·
✏️ Study/MySQL
데이터셋 확인은 이전글 참조 2021.08.09 - [SQL/MySQL] - [프로그래머스] SQL 코딩테스트 연습 01. DB 확인 [프로그래머스] SQL 코딩테스트 연습 01. DB 확인 프로그래머스 사이트에서 SQL 문제를 풀어볼 수 있다. https://programmers.co.kr/learn/challenges?tab=sql_practice_kit 코딩테스트 연습 기초부터 차근차근, 직접 코드를 작성해 보세요. programmers.co.kr 프.. ggarden.tistory.com 프로그래머스 SQL 문제들 중에서 어려웠던 문제들을 리뷰 차원에서 다시 한 번 풀어본다. GROUP BY 카테고리의 입양 시각 구하기(2) 문제이다. 모든 문제들은 레벨1~4까지 있는데 다른 문제들과 다르게 레벨..
[프로그래머스] SQL 코딩테스트 연습 01. DB 확인
·
✏️ Study/MySQL
프로그래머스 사이트에서 SQL 문제를 풀어볼 수 있다. https://programmers.co.kr/learn/challenges?tab=sql_practice_kit 코딩테스트 연습 기초부터 차근차근, 직접 코드를 작성해 보세요. programmers.co.kr 프로그래머스 사이트는 기업에서 개발자 채용시 코딩테스트를 위탁으로 수행하는 곳이라고 들은 적이 있다. 그래서 실제로 출제되는 코딩테스트일 것 같아 실전감각을 키울 수 있겠다는 생각이 들었다. SQL은 아래 사진처럼 6개 영역의 문제를 풀 수 있다. 문제에서 사용하는 테이블은 2가지이다. 1) ANIMAL_INS 테이블 메타데이터를 보면 그리고 데이터셋을 몇 행만 뽑아서 확인해보면 2)ANIMAL_OUTS 테이블 메타데이터는 아래와 같다. 그리..
[SQL 100제#75-80] ALL, ANY, EXISTS, NOT EXISTS
·
✏️ Study/PostgreSQL
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 6주차 과제 풀이 (SQL 75~80번 문제) [강의내용] 문제75번) 매출을 가장 많이 올린 dvd 고객 이름은? (subquery 활용) 서브쿼리를 활용하여 매출이 가장 많은 customer_id를 구하고, 메인쿼리에서 고객 이름을 구한다. SELECT c.first_name, c.last_name, t1.sum FROM customer c JOIN ( SELECT p.customer_id, sum(p.amount) FROM payment p GROUP BY p.customer_id ORDER BY sum DESC LIMIT 1 ) AS t1 ON c.customer_id = t1.customer_id; 문제76번) 대..
[SQL 100제#67-74] UNION, UNION ALL, EXCEPT, IN, NOT IN
·
✏️ Study/PostgreSQL
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 5주차 과제 풀이 (SQL 67~74번 문제) [강의내용] 문제67번) 180분 이상 길이의 영화에 출연하거나, rating이 R인 영화에 출연한 배우에 대해서 배우 ID와 (180분 이상 / R등급 영화)에 대한 Flag컬럼을 알려주세요. - 1) film_actor 테이블과 film 테이블을 이용하세요. - 2) union, unionall, intersect, except 중 상황에 맞게 사용해주세요. - 3) actor_id가 동일한 flag값이 여러개 나오지 않도록 해주세요. WHERE절을 통해 필터링을 쉽게 할 수 있지만 플래그 컬럼을 생성해야하기 때문에 가장 쉬운 방법인 UNION을 쓴다 180분 이상 영화에 ..
[SQL 100제#54-66] SUM, COUNT, ROUND, CASE WHEN, 서브쿼리
·
✏️ Study/PostgreSQL
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 4주차 과제 풀이 (SQL 54~66번 문제) [강의내용] 문제54번) store별로 staff는 몇명이 있는지 확인해주세요. 집계함수인 COUNT를 쓰면, 그룹별 컬럼의 갯수를 셀 수 있다. 집계함수를 쓸 때 주의할 점은 FROM절 뒤에 GROUP BY절을 명시해서 어떻게 그룹지을지를 설정해주어야 한다. SELECT s.store_id, count(st.staff_id) FROM store s JOIN staff st ON s.store_id = st.store_id GROUP BY s.store_id; store_id별로 staff_id의 갯수를 세어주게 된다. 문제55번) 영화등급(rating) 별로 몇개의 영화를 가..
[데이콘 1-3] 따릉이 데이터를 활용한 데이터 분석 입문 (모델링)
·
✏️ Study/🐍 Python
앞서 전처리를 통해 데이터셋의 결측값을 없애 모델링이 가능하도록 만들었다. 이제 본격적으로 모델링을 실습해본다. 모델링은 쉽게 y = ax + b 방정식의 가장 정확한 y값을 예측해낼 수 있는 a, x, b를 찾는 과정이라 할 수 있다. 먼저 몇개의 x를 사용할지 결정해야 한다. count와 상관성이 가장 높은 아래의 3가지 변수를 x1, x2, x3로 사용할 것이다. 1) 시간2) 1시간 전 온도3) 1시간 전 풍속  그리고 변수를 지정해 준다. features = ['hour', 'hour_bef_windspeed', 'hour_bef_windspeed']x_train = train[features]y_train = train['count']x_test = test[features] 데이터의 크기를 ..
[데이콘 1-2] 따릉이 데이터를 활용한 데이터 분석 입문 (전처리)
·
✏️ Study/🐍 Python
앞서 EDA를 통해 데이터셋을 전체적으로 살펴보았다.그리고 count값에 크게 영향을 미치는 변수 2가지를 상관계수가 높은 순으로 선정했다. 1. 1시간 전 온도 (상관계수 0.62)2. 1시간 전 풍속 (상관계수 0.48) 이제 본격적인 모델링에 앞서 데이터를 정제하는 전처리를 해본다. 참고로 파이썬에서는 Null 값과 NA 값을 따로 구분하지 않고 NaN이라고 통일하여 결측값으로 표현한다. 먼저 훈련용 데이터의 결측값를 찾아본다. train.isna().sum() isna() 함수는 결측치 확인하여 결측치면 True (1), 아니면 False (0)로 나타내준다.여기에 sum을 사용해서 결측치의 갯수를 확인할 수 있다.  온도와 풍속 데이터에 각각 2개, 9개의 결측값이 있는 것을 확인할 수 있다.이..