[데이콘 1-1] 따릉이 데이터를 활용한 데이터 분석 입문 (EDA)
·
✏️ Study/🐍 Python
개인적으로 데이터 분석 프로젝트를 해보고 싶어 찾아보던 중에 데이콘이라는 사이트를 알게 되었다. https://dacon.io/ 데이터사이언티스트 AI 컴피티션3만 AI팀이 협업하는 인공지능 플랫폼dacon.io 언젠가 캐글에서 직접 프로젝트를 해보리라 생각했었는데 한국 플랫폼이 있어 쉽게 접근할 수 있을 것 같다. 대회 뿐만 아니라 기초부터 연습할 수 있는 코너도 마련되어 있어서 친숙해보이는 따릉이 관련 주제를 골랐다.  회원가입 후 연습 프로젝트에 참여했고 데이터셋을 다운받았다.  주제는 특정 기간동안의 따릉이 대여 데이터와 기상 데이터를 가지고 1시간 후의 따릉이 대여 수를 예측하는 모델을개발하는 것이다. 다행히도 입문자들을 위한 교육용 유튜브 강의가 제공된다. 1. EDA2. 전처리3. 모델링 이..
[SQL 100제#47-53] JOIN, LEFT JOIN, CASE
·
✏️ Study/PostgreSQL
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 3주차 과제 풀이 (SQL 39~53번 문제) [강의내용] 문제47번) 고객 id별로 고객의 이름 (first_name, last_name), 이메일, 고객의 주소 (address, district), phone, city, country 를 알려주세요. 문제 46번처럼, customer_id 별 주소 이므로 SELECT절에서 맨 앞에 customer_id를 써주는 것을 유의하면 된다. SELECT c.customer_id, c.first_name, c.last_name, c.email, a.address, a.district, a.phone, ci.city, co.country FROM customer c JOIN add..
[SQL 100제#39-46] JOIN, LEFT JOIN
·
✏️ Study/PostgreSQL
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 3주차 과제 풀이 (SQL 39~53번 문제) [강의내용] 문제39번) 고객의 기본정보인 고객id, 이름, 성, 이메일과 함께 고객의 address, district, postal_code, phone을 함께 보여주세요. 고객id, 이름, 성, 이메일 컬럼은 customer 테이블에 존재한다. 그리고 address를 비롯한 나머지 컬럼들은 address 테이블에 존재한다. 다른 테이블을 한 쿼리에서 사용하기 위해 FROM뒤에 JOIN을 써서 추가할 테이블을 입력해준다. 그리고 ON 뒤에 두 테이블간의 공통 컬럼을 적어준다. SELECT c.customer_id, c.first_name, c.last_name, a.addre..
[SQL 100제#30-38] OR, IN, IS NULL, IS NOT NULL
·
✏️ Study/PostgreSQL
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 2주차 과제 풀이 (SQL 21~38번 문제) [강의내용] 문제30번) customer 테이블을 이용하여 이름이 Maria, Lisa, Mike에 해당하는 고객의 id, 이름, 성을 확인해주세요. 이름이 3개 중 하나라도 해당되는 고객들의 정보를 출력해야 한다. WHERE ~ IN (문자열 집합)을 사용하면 된다. SELECT customer_id, first_name, last_name FROM customer c WHERE first_name IN ('Maria', 'Lisa', 'Mike'); 문제31번) film 테이블을 이용하여, film의 길이가 100~120 에 해당하거나 rental 대여기간이 3~5일에 해당..
[SQL 100제#21-29] LIKE, BETWEEN, DATE
·
✏️ Study/PostgreSQL
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 2주차 과제 풀이 (SQL 21~38번 문제) [강의내용] 문제21번) film 테이블을 활용하여, film 테이블의 100개의 row만 확인해보세요. LIMIT 절을 입력하면 행 수를 설정할 수 있다. (참고로 Oracle에서는 LIMIT가 지원되지 않기 때문에 대신 ROWNUM 절을 사용한다) SELECT * FROM film f LIMIT 100; 100개의 행만 출력되는 것을 확인할 수 있다. (쿼리 결과 생략) 문제22번) actor의 성(last_name)이 Jo로 시작하는 사람의 id 값이 가장 낮은 사람 한사람에 대하여, 사람의 id 값과 이름, 성을 알려주세요. 문자열 타입 데이터를 추출하는 조건을 부여하기..
[SQL 100제#11-20] SELECT, WHERE, COUNT, AND, OR, UPPER
·
✏️ Study/PostgreSQL
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 1주차 과제 풀이 (SQL 1~20번 문제) [강의내용] 문제11번) 영화배우의 이름 (이름+' '+성) 에 대해서, 대문자로 이름을 보여주세요. 단 고객의 이름이 동일한 사람이 있다면, 중복 제거하고 알려주세요. 문자열을 연결하기 위해 지난번에 다루었던 || 기호를 사용한다. 그리고 문자열을 대문자로 바꾸기 위해 UPPER 함수를 사용한다. (소문자로 바꾸는 함수는 LOWER() 이다) SELECT DISTINCT upper(first_name ||' '|| last_name) AS fullname FROM actor; 대문자로 잘 변경된 것을 볼 수 있다. 문제12번) 고객 중에서, active 상태가 0인 즉 현재 사..
[SQL 100제#1-10] SELECT, WHERE, MOD, CHAR_LENGTH
·
✏️ Study/PostgreSQL
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 1주차 과제 풀이 (SQL 1~20번 문제) [강의내용] 기본적인 SQL 실습문제들을 풀이한다. dvdrental 데이터셋에 친숙해지기 위한 난이도가 낮은 문제들이 많다.(SQL 문제들을 풀면서 느낀 점은 데이터셋을 면밀히 파악하는 것이 무척 중요하다는 점이었다. 어떤 테이블에 어떤 컬럼들이 있는지 모르면 문제를 푸는데 시간이 정말 오래 걸린다..)예전 강의에서 다뤘던 내용도 포함되어 있고, 수업에서 test로 진행된 문제들은 풀이를 업로드하지 않아서 복습차원에서 종합적으로 업로드를 해보려한다. 문제1번) dvd 렌탈 업체의 dvd 대여가 있었던 날짜를 확인해주세요. 대여가 있었던 날짜들을 구하면 된다. 예를 들어 5/24..
[SQL 3-5강] WITH, CASE, LEFT, COALESCE, EXTRACT
·
✏️ Study/PostgreSQL
[강의명] 패스트캠퍼스 SQL 100제 + 자격증 완성 온라인 완주반 [수강목록] 조건 연산자, WITH문, 트랜잭션 - 05. WITH문의 활용 생각대로 SQL - 9 [강의내용] 조건 연산자, WITH문, 트랜잭션 - 05. WITH문의 활용 WITH문을 활용함으로써 SELECT문의 결과를 임시집합으로 저장해놓고 SQL문에서 마치 테이블처럼 해당 집합을 불러올 수 있다. [실습] WITH문으로 영화시간에 대한 구간을 나눠 영화를 구분해보자 WITH TMP1 AS ( SELECT film_id, title, CASE WHEN length = 30 AND length = 90 THEN 'LONG' END length FROM film ) SELEC..