본문 바로가기

문송충의 코딩하기67

[파이썬] - 공공데이터 API에서 시도별 미세먼지 PM10 데이터를 가져와서 Folium으로 시각화하기 최근 중국에서 난방을 시작하면서 이제는 코로나에 이어서 미세먼지까지 한국으로 들어오고 있다. 현재 상황이 심각한 만큼 오늘 포스팅에서는 미세먼지 특히 PM10 관련 데이터를 공공데이터 API에서 가져와서 Folium으로 시각화하도록 하겠다. 대한민국 어느 지역에서의 미세먼지가 심각한지 지도로 확인해 볼 수 있는 기회가 됐으면 한다. 공공데이터 관련 정보는 아래 링크에서 확인하기 바란다. data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15000581 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(D.. 2020. 11. 28.
[파이썬] - 네이버 파이낸스에서 KT 주가 가져와서 Plotly 반응형 그래프 그리기 이번 포스팅에서는 내가 실제로 포트폴리오에 담고 있는 KT 종목의 주가를 네이버 파이낸스 페이지에서 가져와서 Ploty라는 반응형 그래프를 그리도록 하겠다. 한국거래소 krx.co.kr 사이트에서 국내 상장 종목 전체 가져오기 import pandas as pd stock_code = pd.read_html('http://kind.krx.co.kr/corpgeneral/corpList.do?method=download', header=0)[0] stock_code=stock_code[['회사명','종목코드']] stock_code=stock_code.rename(columns={'회사명':'company','종목코드':'code'}) stock_code['code']=stock_code.code.map(.. 2020. 11. 28.
[파이썬] - 서울 2호선 지하철 역별 승하차 승객 수 Folium으로 시각화 이번 포스팅에서는 서울 열린 데이터 광장에서 제공하는 지하철 역별 승하차 승객 수 데이터를 API로 가져온 다음 Folium으로 시각화해보도록 하겠다. 2호선 어느 역에서 승차 승객 수가 많은 지 지도로 그려보면서 파이썬 시각화 연습을 해보고자 한다. 서울시 지하철 승하차 관련 데이터는 아래 링크에서 확인이 가능하다. 당연한 얘기이겠지만 API 데이터를 사용하려면 API 키 값을 신청해야 한다. data.seoul.go.kr/dataList/OA-12914/S/1/datasetView.do 서울시 지하철호선별 역별 승하차 인원 정보 데이터 이용하기-서울시 지하철호선별 역별 승하차 인원 정보 data.seoul.go.kr 서울 열린 데이터 API에서 데이터 가져오기 하루치 데이터를 가져오면 데이터의 표본이.. 2020. 11. 27.
[파이썬] - 넥슨 카트라이더 API를 활용해서 내 카트라이더 매치 정보 가져오기 #1 이번 포스팅에서는 넥슨에서 제공하고 있는 카트라이더 오픈 API를 통해서 내 최근 카트라이더 10경기 매치 정보를 파이썬으로 가져오도록 하겠다. API 정보는 아래 링크에서 확인할 수 있다. API를 사용하기 위해서는 역시나 해당 사이트에서 API 키 값을 발급을 받아야 한다. 카트라이더 외 피파온라인, 던파, 싸이퍼스 API도 제공하고 있다. developers.nexon.com/kart 개발자센터 카트라이더에서 제공하는 Open API 라이더 정보, 최근 주행 기록 및 상세 정보 등 다양한 데이터를 활용하여 멋진 어플리케이션을 만들어보세요! developers.nexon.com 카트라이더 라이더명으로 내 ID값 가져오기 매치 정보를 가져오기 위해서는 내가 사용하는 카트라이더 ID에 부여된 특정 값이 .. 2020. 11. 25.
[파이썬] - Pykrx 패키지를 통해 국내 상장 종목별 외국인 보유 비중 확인 이번 포스팅에서는 금융 데이터 추출 패키지 Pykrx를 통해 외국인이 투자한 국내 종목 현황을 체크해보도록 하겠다. 코드를 작성하기 앞서서 간단하게 설명해야 될 포인트가 있다. 주식 투자를 하는 분들은 아시겠지만 국내 주식 시장에는 외국인이 종목별로 보유할 수 있는 최대한도가 있다. 외국인이 아무리 많이 투자하더라도 국내 상장 기업의 주식 100%를 제도상 소유할 수는 없다. 외국인 보유 현황 데이터 추출 코스피, 코스닥 종목 전체를 가져오도록 하겠다. from pykrx import stock import pandas as pd kospi = stock.get_exhaustion_rates_of_foreign_investment_by_ticker('20201120', "KOSPI") kosdaq = s.. 2020. 11. 24.
[파이썬] - Pykrx 패키지를 활용한 KOSPI, KOSDAQ 종목별 공매도 잔고 Top 10 기업 추출 이번 포스팅에서도 역시나 내가 가장 좋아하는 금융 데이터 추출 패키지 Pykrx를 활용해서 금융 투자에 있어서 가장 중요한 공매도 관련 분석을 해보고자 한다. 11월 19일 기준으로 해서 KOSPI와 KOSDAQ 종목별 공매도 잔고가 가잔 많은 기업 Top 10을 뽑도록 하겠다. 코드는 굉장히 간단하고 Pykrx 패키지만 "pip install pykrx"를 통해 설치하면 코드 실행을 위한 준비는 다 끝난 것으로 보면 된다. 데이터 추출 Pykrx 패키지를 불러온 다음 해당 패키지에 있는 stock의 get_shorting_balance_top50 함수를 사용하면 공매도 잔고 비중이 가장 높은 Top 50개 기업을 추출해줄 수 있을 것이다. 여기서는 그냥 보고자 하는 데이터의 기준 날짜와 코스피 혹은 코.. 2020. 11. 23.
[파이썬] - Folium 활용하여 서울시 구 기준 인구수 시각화 하기 이번 포스팅에서는 시각화 패키지 Folium을 활용해서 서울시 구 기준으로 인구수를 시각화하도록 하겠다. 인구 데이터는 아래 링크와 같이 국가통계포털에서 가져왔다. 그럼 시각화를 위한 준비는 모두 끝났고, 코드만 아래처럼 따라 하면 된다. 그렇게 어렵지 않다. kosis.kr/statisticsList/statisticsListIndex.do?menuId=M_01_01&vwcd=MT_ZTITLE&parmTabId=M_01_01&statId=1962001&themaId=A#SelectStatsBoxDiv KOSIS 국가통계포털 통계목록검색 통계목록검색 통계목록검색 통계표명검색 검색어입력 검색 전체목록받기 부분목록받기 처리중입니다. 잠시만 기다려 주세요. kosis.kr Python Code Folium을 .. 2020. 11. 22.
[파이썬 데이터 분석] - Kaggle에 있는 넷플릭스 관련 데이터셋 활용한 데이터 분석 Kaggel Datasets - Netflix Movies and TV Shows 이번 포스팅에서는 Kaggle에 있는 넷플릭스 데이터셋을 갖고 분석해보도록 하겠다. 데이터셋이 크게 복잡하지 않고 데이터 컬럼도 그렇게 많지 않아 다루기 어렵지 않다. 지난 포스팅와 같이 간단히 데이터를 가지고 시각화를 하겠다. www.kaggle.com/shivamb/netflix-shows Netflix Movies and TV Shows Movies and TV Shows listings on Netflix www.kaggle.com Datasets 실제 개봉 연도별 콘텐츠 수 넷플릭스에 있는 콘텐츠들은 언제 개봉한 콘텐츠들이 많은지 알아보기 위한 코드다. 확실히 2015년 이후 개봉한 콘텐츠가 넷플릭스에 많이 포함돼.. 2020. 11. 15.
[파이썬] - Youtube API를 활용해서 네고왕 영상 콘멘트 가져오기 지난 포스팅에 이어 광희가 진행하고 있는 Youtube 네고왕 첫 번째 에피소드 영상에 달린 댓글을 가져오도록 하겠다. 아래 포스팅에서 네고왕 영상에 부여된 ID값을 다 갖고 왔기 때문에 바로 추출할 수 있다. 2020/11/14 - [문송충의 코딩하기/파이썬 데이터 분석] - [파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 [파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 [파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 요즘 유튜브에서 가장 핫한 콘텐츠 중에 하나가 바로 네고왕이다. 광희 목소리가 부담스러워서 나는 한 번도 콘 yobro.tistory.com Python Code 코드가 조금 복잡하다. 댓글을.. 2020. 11. 15.
[파이썬 데이터 분석] - Kaggle 구글 플레이 스토어 앱 데이터셋 분석 [파이썬 데이터 분석] - Kaggle 구글 플레이 스토어 앱 데이터셋 분석 www.kaggle.com/lava18/google-play-store-apps Google Play Store Apps Web scraped data of 10k Play Store apps for analysing the Android market. www.kaggle.com 이번 포스팅을 시작으로 캐글에서 제공하고 있는 수 많은 데이터셋을 활용해서 파이썬 데이터 분석 스터디를 해보고자 한다. 아직 머신러닝 단계는 전혀 모르기 때문에 우선은 데이터를 전처리하고 간략히 시각화하는 연습을 시작해보겠다. 이번 포스팅에서는 위 링크에서 나오는 구글 플레이 스토어 App 데이터를 활용하도록 하겠다. Kaggle Google Play .. 2020. 11. 14.
[파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 [파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 요즘 유튜브에서 가장 핫한 콘텐츠 중에 하나가 바로 네고왕이다. 광희 목소리가 부담스러워서 나는 한 번도 콘텐츠를 시청하지 않았지만 주변에 물어보면 네고왕이 굉장히 인기가 많아 보여서 이번 포스팅에서 해당 유튜브 콘텐츠를 분석해보고자 한다. 우선 네고왕 콘텐츠 리스트를 다 가져와서 영상별로 영상 타이틀, 조회, 좋아요, 싫어요, 댓글 수를 가져와서 테이블화 하도록 하겠다. 코드는 크게 어렵지 않다. 우선 유의할 점은 코드를 작성하기 전에 Youtube API를 발급해야 한다. 네고왕 PlayList Id 값 유튜브 채널에는 각 콘텐츠 별로 특정 ID값이 부여가 된다. 네고왕 콘텐츠를 제작하는 달라스튜디오 채널에도 발명왕, 네.. 2020. 11. 14.
[파이썬] - 서울시 열린데이터광장 오픈 API 활용해서 서울시 공영주차장 정보를 알아보자 서울시 공영주차장 Open API 이번 포스팅에서는 서울 열린데이터 광장에서 제공하고 있는 Open API를 통해서 서울시에 위치한 공영주차장 정보를 가져오도록 하겠다. 해당 관련 정보는 아래 링크에서 확인할 수 있고, 파이썬 코드를 작성하기 전에 우선 동일 링크에서 API 키를 신청하기 바란다. data.seoul.go.kr/dataList/OA-13122/S/1/datasetView.do 서울시 공영주차장 안내 정보 데이터 이용하기-서울시 공영주차장 안내 정보 data.seoul.go.kr Python Code 우선 아래 코드를 통해서 서울시 공영 주차장 수를 확인해보겠다. 아래 코드를 돌리면 total_num이라는 변수에 총 14,330개의 데이터가 있다는 점을 볼 수 있다. 즉 서울시에는 무려 1.. 2020. 11. 8.