본문 바로가기

문송충의 코딩하기/파이썬 데이터 분석39

2021년 11월 서울 아파트 평균 평당(㎡) 거래 매매가 with python 공공데이터 국토교통부에서 제공하고 있는 아파트 매매 실거래 데이터를 활용해서 2021년 11월 서울 아파트 평당 평균 매매가를 구해보고 이 수치를 전년도 11월과 비교해보도록 하겠다. https://www.data.go.kr/data/15057511/openapi.do 국토교통부_아파트매매 실거래 상세 자료 부동산 거래신고에 관한 법률에 따라 신고된 주택의 실거래 자료를 제공 www.data.go.kr 우선 데이터를 뽑기 위해서는 서울 지역구별 법정코드가 필요하다. 그래서 아래 코드를 통해서 서울 법정코드를 크롤링해오도록 하겠다. 아래 코드가 문제없이 돌아간다면 25개 서울 지역구 법정코드를 가져올 수 있을 것이다. import pandas as pd import requests url='https://.. 2021. 12. 28.
2021년 5월 ~ 11월 서울 강서구 오피스텔 매매가 데이터 가져오기(공공데이터) with Python 지난 6개월(21년 5월 ~ 11월) 서울 강서구 내 오피스텔 매매가 데이터를 가져오도록 하겠다. 데이터는 공공데이터에서 파이썬으로 가져오도록 하겠다. 데이터 설명은 아래 링크에서 확인할 수 있다. https://www.data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15058452 국토교통부_오피스텔 매매 신고 조회 서비스 부동산 거래신고에 관한 법률에 따라 신고된 주택의 실거래 자료를 제공 www.data.go.kr from urllib.request import urlopen from urllib.parse import urlencode, unquote, quote_plus import urllib import requests import p.. 2021. 12. 27.
KODEX 은행, TIGER 은행 지난 5년간 주가 그래프 파이썬으로 그리기 오늘은 간단하게 내가 최근에 관심 있게 지켜보고 있는 국내 은행주 ETF 주가 차트를 파이썬으로 그려보도록 하겠다. 국내 증시에는 삼성자산운용의 KODEX 은행과 미래에셋자산운용의 TIGER 은행 두 개의 ETF가 있다. 파이썬으로 하나하나 만드는 과정을 간략히 설명하도록 하겠다. 1. 네이버 크롤링 우선 네이버 증권 사이트에서 전체 ETF 종목을 가져온 다음 ETF 종목 이름 중에서 "은행"이라는 단어가 포함된 종목만 추출하도록 하겠다. import requests import json from pandas.io.json import json_normalize url = 'https://finance.naver.com/api/sise/etfItemList.nhn' json_data = json.load.. 2021. 3. 22.
공공데이터 Open API를 통해 국내 주요 은행 현황 분석#1 with Python data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15061304 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase www.data.go.kr 공공데이터 Open API에서 위 링크와 같이 국내 은행과 관련된 데이터를 제공하고 있어 오늘 포스팅을 시작으로 해서 국내 메이저 은행에 대해 분석해보고자 한다. 신한지주에 상당한 돈이 들어간 주주 입장으로서 이번 분석이 꽤 재미있을 것 같아서 시작해보았다. 오늘은 간단하게 국내 은행들의 임직원 수를 알아보도록 하겠다. from urllib.reque.. 2021. 3. 20.
네이버에서 국내 ETF 종목 정보 가져와서 분석 with Python 네이버 증권 페이지에서는 국내 ETF 종목 정보를 제공해주고 있다. 그래서 오늘은 파이썬으로 ETF 종목을 긁어와서 간략히 분석해보도록 하겠다. 아래와 같이 파이썬 몇 줄로 모든 ETF 종목을 가지고 올 수 있다. import requests import json from pandas.io.json import json_normalize url = 'https://finance.naver.com/api/sise/etfItemList.nhn' json_data = json.loads(requests.get(url).text) df = json_normalize(json_data['result']['etfItemList']) df를 출력하면 아래와 같이 증시에 있는 총 474개의 ETF 종목을 확인할 수 있.. 2021. 3. 20.
[파이썬] - 공공데이터 API에서 시도별 미세먼지 PM10 데이터를 가져와서 Folium으로 시각화하기 최근 중국에서 난방을 시작하면서 이제는 코로나에 이어서 미세먼지까지 한국으로 들어오고 있다. 현재 상황이 심각한 만큼 오늘 포스팅에서는 미세먼지 특히 PM10 관련 데이터를 공공데이터 API에서 가져와서 Folium으로 시각화하도록 하겠다. 대한민국 어느 지역에서의 미세먼지가 심각한지 지도로 확인해 볼 수 있는 기회가 됐으면 한다. 공공데이터 관련 정보는 아래 링크에서 확인하기 바란다. data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15000581 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(D.. 2020. 11. 28.
[파이썬] - 네이버 파이낸스에서 KT 주가 가져와서 Plotly 반응형 그래프 그리기 이번 포스팅에서는 내가 실제로 포트폴리오에 담고 있는 KT 종목의 주가를 네이버 파이낸스 페이지에서 가져와서 Ploty라는 반응형 그래프를 그리도록 하겠다. 한국거래소 krx.co.kr 사이트에서 국내 상장 종목 전체 가져오기 import pandas as pd stock_code = pd.read_html('http://kind.krx.co.kr/corpgeneral/corpList.do?method=download', header=0)[0] stock_code=stock_code[['회사명','종목코드']] stock_code=stock_code.rename(columns={'회사명':'company','종목코드':'code'}) stock_code['code']=stock_code.code.map(.. 2020. 11. 28.
[파이썬] - 서울 2호선 지하철 역별 승하차 승객 수 Folium으로 시각화 이번 포스팅에서는 서울 열린 데이터 광장에서 제공하는 지하철 역별 승하차 승객 수 데이터를 API로 가져온 다음 Folium으로 시각화해보도록 하겠다. 2호선 어느 역에서 승차 승객 수가 많은 지 지도로 그려보면서 파이썬 시각화 연습을 해보고자 한다. 서울시 지하철 승하차 관련 데이터는 아래 링크에서 확인이 가능하다. 당연한 얘기이겠지만 API 데이터를 사용하려면 API 키 값을 신청해야 한다. data.seoul.go.kr/dataList/OA-12914/S/1/datasetView.do 서울시 지하철호선별 역별 승하차 인원 정보 데이터 이용하기-서울시 지하철호선별 역별 승하차 인원 정보 data.seoul.go.kr 서울 열린 데이터 API에서 데이터 가져오기 하루치 데이터를 가져오면 데이터의 표본이.. 2020. 11. 27.
[파이썬] - 넥슨 카트라이더 API를 활용해서 내 카트라이더 매치 정보 가져오기 #1 이번 포스팅에서는 넥슨에서 제공하고 있는 카트라이더 오픈 API를 통해서 내 최근 카트라이더 10경기 매치 정보를 파이썬으로 가져오도록 하겠다. API 정보는 아래 링크에서 확인할 수 있다. API를 사용하기 위해서는 역시나 해당 사이트에서 API 키 값을 발급을 받아야 한다. 카트라이더 외 피파온라인, 던파, 싸이퍼스 API도 제공하고 있다. developers.nexon.com/kart 개발자센터 카트라이더에서 제공하는 Open API 라이더 정보, 최근 주행 기록 및 상세 정보 등 다양한 데이터를 활용하여 멋진 어플리케이션을 만들어보세요! developers.nexon.com 카트라이더 라이더명으로 내 ID값 가져오기 매치 정보를 가져오기 위해서는 내가 사용하는 카트라이더 ID에 부여된 특정 값이 .. 2020. 11. 25.
[파이썬] - Pykrx 패키지를 통해 국내 상장 종목별 외국인 보유 비중 확인 이번 포스팅에서는 금융 데이터 추출 패키지 Pykrx를 통해 외국인이 투자한 국내 종목 현황을 체크해보도록 하겠다. 코드를 작성하기 앞서서 간단하게 설명해야 될 포인트가 있다. 주식 투자를 하는 분들은 아시겠지만 국내 주식 시장에는 외국인이 종목별로 보유할 수 있는 최대한도가 있다. 외국인이 아무리 많이 투자하더라도 국내 상장 기업의 주식 100%를 제도상 소유할 수는 없다. 외국인 보유 현황 데이터 추출 코스피, 코스닥 종목 전체를 가져오도록 하겠다. from pykrx import stock import pandas as pd kospi = stock.get_exhaustion_rates_of_foreign_investment_by_ticker('20201120', "KOSPI") kosdaq = s.. 2020. 11. 24.
[파이썬] - Pykrx 패키지를 활용한 KOSPI, KOSDAQ 종목별 공매도 잔고 Top 10 기업 추출 이번 포스팅에서도 역시나 내가 가장 좋아하는 금융 데이터 추출 패키지 Pykrx를 활용해서 금융 투자에 있어서 가장 중요한 공매도 관련 분석을 해보고자 한다. 11월 19일 기준으로 해서 KOSPI와 KOSDAQ 종목별 공매도 잔고가 가잔 많은 기업 Top 10을 뽑도록 하겠다. 코드는 굉장히 간단하고 Pykrx 패키지만 "pip install pykrx"를 통해 설치하면 코드 실행을 위한 준비는 다 끝난 것으로 보면 된다. 데이터 추출 Pykrx 패키지를 불러온 다음 해당 패키지에 있는 stock의 get_shorting_balance_top50 함수를 사용하면 공매도 잔고 비중이 가장 높은 Top 50개 기업을 추출해줄 수 있을 것이다. 여기서는 그냥 보고자 하는 데이터의 기준 날짜와 코스피 혹은 코.. 2020. 11. 23.
[파이썬] - Folium 활용하여 서울시 구 기준 인구수 시각화 하기 이번 포스팅에서는 시각화 패키지 Folium을 활용해서 서울시 구 기준으로 인구수를 시각화하도록 하겠다. 인구 데이터는 아래 링크와 같이 국가통계포털에서 가져왔다. 그럼 시각화를 위한 준비는 모두 끝났고, 코드만 아래처럼 따라 하면 된다. 그렇게 어렵지 않다. kosis.kr/statisticsList/statisticsListIndex.do?menuId=M_01_01&vwcd=MT_ZTITLE&parmTabId=M_01_01&statId=1962001&themaId=A#SelectStatsBoxDiv KOSIS 국가통계포털 통계목록검색 통계목록검색 통계목록검색 통계표명검색 검색어입력 검색 전체목록받기 부분목록받기 처리중입니다. 잠시만 기다려 주세요. kosis.kr Python Code Folium을 .. 2020. 11. 22.