본문 바로가기

데이터 분석22

아파트 파이썬 데이터 분석 시리즈 1 - 4 [2023년 구별 아파트 거래량 & 평당 실거래가 추이] 1. 인천시 아파트 실거래 데이터를 활용해서 23년 1년 동안 월별 거래 추이가 어떤지 확인해보겠음 2. 인천시 아파트 전수 데이터는 이전 포스팅에서 확인할 수 있음 3. 우선 평당 실거래가를 아래 파이썬 코드를 통해 히트맵 형식으로 시각화해봤음 df=pd.DataFrame(data) df=df[df['년']=='2023'] df['전용면적']=df['전용면적'].apply(lambda x:float(x)) df['평수']=df['전용면적'].apply(lambda x:x*0.3025) df['거래금액']=df['거래금액'].apply(lambda x:float(x.replace(',',''))) df1=df[['거래금액','법정동시군구코드','평수','월']] df1=pd.merge(df1,se,how.. 2024. 2. 20.
아파트 파이썬 데이터 분석 시리즈 1 - 2 [2021년 ~ 2023년 인천시 월별 아파트 거래건수 및 평당 실거래가] 1. 지난 포스팅에서 가지고온 인천시 아파트 거래 데이터를 가지고 계속 분석을 해보겠다. 2. 이번에는 지난 3년간 월별 아파트 거래건수와 평당 실거래가를 확인해보겠다. 3. 기존 데이터 전처리를 통해 월별 거래건수와 평당 실거래가를 가지고 왔다. import seaborn as sns from matplotlib.lines import Line2D from matplotlib.patches import Rectangle incheon=pd.DataFrame(data) incheon['거래금액']=incheon['거래금액'].apply(lambda x:int(x.replace(',',''))) inc=incheon.sort_values(by='거래금액',ascending=False)[['거래금액','법정.. 2024. 2. 14.
2021년 5월 ~ 11월 서울 강서구 오피스텔 매매가 데이터 가져오기(공공데이터) with Python 지난 6개월(21년 5월 ~ 11월) 서울 강서구 내 오피스텔 매매가 데이터를 가져오도록 하겠다. 데이터는 공공데이터에서 파이썬으로 가져오도록 하겠다. 데이터 설명은 아래 링크에서 확인할 수 있다. https://www.data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15058452 국토교통부_오피스텔 매매 신고 조회 서비스 부동산 거래신고에 관한 법률에 따라 신고된 주택의 실거래 자료를 제공 www.data.go.kr from urllib.request import urlopen from urllib.parse import urlencode, unquote, quote_plus import urllib import requests import p.. 2021. 12. 27.
[파이썬] 서울시 공공데이터 API를 활용해 서울시 코로나19 확진자 데이터 분석하기 #1 서울 코로나 확진자 데이터 파이썬으로 분석하기 #1 서울시 공공데이터 API에서 제공하고 있는 코로나 19 확진자 데이터를 가져와서 파이썬으로 다뤄보고자 한다. 시간이 늦어서 한 번에 올리지 않고 이번 포스팅에서는 단순히 서울 공공데이터에서 데이터를 어떻게 가져오는지만 코드로 보여주도록 하겠다. 별거 없다. 굉장히 쉽다. 서울시 코로나 확진자 수 데이터셋 URL 아래 링크로 들어가서 사이트 회원가입 후 API 키 신청을 하면 모든 준비가 끝난다. 해당 API에서 사용할 데이터는 코로나 확진 순번, 코로나 확진 날짜, 코로나 접촉 이력, 지역, 현재 상태 데이터이다. data.seoul.go.kr/dataList/OA-20279/S/1/datasetView.do 서울시 코로나19 확진자 현황 데이터 이용하.. 2020. 10. 27.
공공데이터 API를 활용한 국내 대차거래 종목 순위 확인하기 with 파이썬 대차거래란 주식을 장기 보유한 금융 기관이 단기적으로 이를 필요한 타 기관에 수수료를 받고 빌려주는 거래를 의미한다. 주로 주가가 하락이 예상될 때 주식을 빌린 기관에서 매매한 후 나중에 주가가 가격이 하락했을 때 다시 주식을 매수해 차익을 보는 일종 투자 방법이다. 항상 뉴스에서 나오는 공매도가 바로 이러한 투자 방식을 뜻한다. 주식이 없는 상태에서 주식을 빌려 주가 하락에 베팅하여 투자전략이다. 투자를 할 때 대차잔고를 꼭 참고해서 봐야 되는데 그 이유는 특정 종목에 대차 잔고가 많다는 것은 그만큼 금융 기관에서 주가 하락을 전망하는 투자자가 많아졌다는 의미로 풀이가 되기 때문이다. 대차 잔고가 많다고 해서 무조건 공매도로 이어지는 것은 아니지만 그래도 공매도로 사용될 대기자금인 만큼 공매도 선행지표.. 2020. 10. 8.
공공데이터 API 활용해서 2019년 코스피 배당주 리스트 가져오기 With Python 내가 주식 투자를 할 때 가장 먼저 보는 지표가 바로 배당이다. 지금과 같이 저금리 시대에서 배당주 투자는 현재 저금리 시대 저금과 예금을 완벽히 대체할 수 있는 투자 전략이기 때문이다. 그래서 오늘은 배당 관련해서 파이썬으로 뭘 뽑아보고자 한다. 공공데이터를 살펴보니 국내 코스피/코스닥에 상장된 기업들에 대해 배당금을 얼마나 지급했는지를 API로 제공하고 있어서 파이썬으로 이걸 한번 분석? 추출해보고자 한다. 코스피 시장에서 배당금을 지급하는 기업이 어디인지 데이터로 보도록 하겠다. 1. Data Source 공공데이터 회원가입을 한 후 아래 페이지에서 한국 예탁결제원_주식정보서비스 API 활용 신청을 해야 한다. 신청 즉시 API 키 값이 바로 부여가 될 것이다. data.go.kr/tcs/dss/s.. 2020. 9. 29.
EPL 분석 - 오바메양 아스날 이적 후 기록한스텟 파이썬으로 분석하기 아스날이 보유한 유일한 월드 클래스 선수이자 아스날의 캡틴 오바메양 기록에 대해 파이썬으로 분석해보고자 한다. 오바메양이 아스널로 이적한 이후 단순 1차 스텟인 공격 포인트 수치 기록 대신 경기당 효율이 어떤지를 한번 분석해보고자 한다. 오바메양이 이적한 지 2년 반 밖에 안됐기 때문에 데이터는 많지는 않지만 이적 후 오바메양이 보여준 모습을 데이터로 한번 시각화해보고자 이번 글을 작성하게 되었다. Data Source 축구 통계 사이트 FBREF 사이트에서 데이터를 사용했다. fbref.com/en/players/d5dd5f1f/Pierre-Emerick-Aubameyang#all_stats_shooting_dom_lg Pierre-Emerick Aubameyang Stats | FBref.com Ca.. 2020. 9. 24.
Arsenal/아스널 2019-2020 시즌 분석하기 with Python Arsenal in 2019-2020 프리미어리그 출범 이후 아스널 역사상 거의 최악의 시즌이라고 볼 수 있는 2019-2020 시즌 아스널을 파이썬으로 분석해보고자 한다. 감독이 한 시즌 3명이었고, 주장도 쟈카에서 오바메양으로 바뀐 아주 변화무쌍한 시즌이었던 만큼 꽤 의미 있는 분석 내용이 있을 것 같다. 이번에도 FBref 사이트에서 데이터를 가져와 분석할 예정이며, 분석 내용은 아래와 같다. 데이터가 많지 않아 간단한 분석만 하려고 한다. 포메이션 별 경기 수 시즌에 주장 완장을 찬 선수 리스트 홈/어웨이 경기 결과 볼 점유율에 따른 경기 결과 Data Source fbref라는 축구 통계 사이트를 활용하겠다. 아래 코드에서 df 변수를 출력하면 19-20 시즌 전체 경기 결과를 확인할 수 있다... 2020. 9. 20.
파이썬으로 프리미어리그 아스널의 지난 10년 역사 분석하기 EPL Analysis with Python EPL이 개막 함에 따라서 파이썬으로 내가 좋아하는 아스널(Arsenal)의 지난 10년 역사를 분석해보도록 하겠다. 첫 시간인 만큼 간단한 내용만 파이썬으로 분석하고자 한다. 지난 10년간은 아스널의 암흑기여서 기분은 그렇게 좋지는 않다. 지난 10년간 아스날 최종 순위 지난 10년간 아스날 최종 승점 지난 10년간 평균 득점/실점 시즌별 최다 득점자 Data Source 이번 분석에서 사용한 Data Source는 아래 사이트와 같다. 여기 사이트가 데이터 사용이 조금 제한적이라 다른 소스를 찾고 있는데 아마 다음 시간에는 다른 소스를 사용하지 않을까 생각이 든다. fbref.com/ Football Statistics and History | FBref... 2020. 9. 15.
NBA MVP 야니스 아데토쿤보 분석 #2 With Python 야니스 아데토쿤보 분석 With Python 2020/09/09 - [문송충의 코딩하기/NBA 분석 With Python] - NBA MVP 야니스 아데토쿤보의 야투 분석 with Python NBA MVP 야니스 아데토쿤보의 야투 분석 with Python Giannis Antetokounmpo 백투백 MVP가 유력한 야니스 아데토쿤보가 또다시 동부의 벽을 넘지 못했다. 정규 시즌에서는 30개 팀 전체 승률 1위를 기록하는 등 압도적인 경기력을 보인 밀워키 벅스의 모습�� yobro.tistory.com 지난 글에 이어서 NBA MVP이지만 파이널에는 못 가본 크리스 폴 이후 차기 "그그파?(그래서 그분 파이널 진출해보심?)"이 될 가능성이 높은 야니스 아데토쿤보 야투 분석을 파이썬으로 해보도록 하겠다.. 2020. 9. 12.
공공데이터 Open API를 활용한 국내 코로나 확진자 수 가져오기 feat 파이썬 코로나가 다시 미쳐 돌아가고 있다. 거의 끝났다 싶었는데 다시 확진자 수가 폭증하고 있고, 이에 따라 나도 계속해서 재택근무를 하고 있다. 일이 크게 없어서 파이썬으로 코로나 확진자 수가 일별로 어떻게 되는지 공공데이터 API를 통해서 가져와 보도록 하겠다. 뭐 예전 글에서도 공공데이터 갖고 한 분석 내용이 있기 때문에 크게 어려운 점은 없다. 아래 내가 작성한 코드 잘 따라 하면 된다. 1. 공공데이타 API Key 발급 항상 그랫듯이 아래 사이트에 들어간 다음 활용신청을 통해 API 사용할 수 있는 Key 값을 받아야 된다. 발급만 받으면 그 자리에서 바로 활용이 가능하다. 아래 링크에서 신청하기 바란다. https://data.go.kr/tcs/dss/selectApiDataDetailView.do.. 2020. 9. 1.
"스마트 워치" 네이버 쇼핑 결과 가져오기 With Naver API Python 최근에 러닝을 시작해서 그런지 가장 사고 싶은 제품이 바로 스마트 워치이다. 아무래도 갤럭시 노트를 사용하다 보니 애플 워치보다는 이번에 새로 나온 갤럭시 워치 3 나 가격적인 측면에서는 넘사벽인 샤오미 워치에 관심을 갖고 있다. 그래서 이번에 네이버에서 제공하고 있는 쇼핑 API를 통해 네이버에서 스마트 워치를 검색했을 때 나오는 쇼핑 결과들을 파이썬으로 가져와 비교하도록 하겠다. 분석하고자 하는 내용은 간단하다. 스마트 워치에는 어떠한 브랜드들이 있는지, 스마트 워치 중 가장 비싼 제품은 어떤 건지, 브랜드별 평균 가격은 어떤지 보고자 한다. 1. 네이버 오픈 API 신청 API를 사용하려면 항상 그랬듯이 먼저 API를 신청해야 한다. 아래 링크로 API를 신청하면 Client ID, Client S.. 2020. 8. 29.