본문 바로가기

파이썬 분석25

아파트 파이썬 데이터 분석 시리즈 1 - 2 [2021년 ~ 2023년 인천시 월별 아파트 거래건수 및 평당 실거래가] 1. 지난 포스팅에서 가지고온 인천시 아파트 거래 데이터를 가지고 계속 분석을 해보겠다. 2. 이번에는 지난 3년간 월별 아파트 거래건수와 평당 실거래가를 확인해보겠다. 3. 기존 데이터 전처리를 통해 월별 거래건수와 평당 실거래가를 가지고 왔다. import seaborn as sns from matplotlib.lines import Line2D from matplotlib.patches import Rectangle incheon=pd.DataFrame(data) incheon['거래금액']=incheon['거래금액'].apply(lambda x:int(x.replace(',',''))) inc=incheon.sort_values(by='거래금액',ascending=False)[['거래금액','법정.. 2024. 2. 14.
아파트 파이썬 데이터 분석 시리즈 1 - 1 [인천시 실거래가 Top 10 아파트 순위] https://www.data.go.kr/data/15058747/openapi.do 국토교통부_아파트매매 실거래자료 부동산 거래신고에 관한 법률에 따라 신고된 주택의 실거래 자료를 제공 www.data.go.kr 1. 부동산에 관심이 많아 이번 포스팅을 시작으로 전국 부동산 분석은 해보고자 함 2. 우선 가장 중요한 데이터를 가져와야 하는데, 내가 살고 있는 인천 시단위부터 시작하고자 함. 나중에 추후 전국단위로 넓히겠음 3. 데이터는 맨 위 국토교통부_아파트매매 실거래자료 공공데이터 오픈 API에서 가지고 옴 4. API에서 특정 지역 데이터를 가지고 오기 위해서는 우선 인천의 코드가 필요함. 그건 아래 코드에서 추출 import pandas as pd import requests from bs4 i.. 2024. 2. 13.
[파이썬] - 공공데이터 API에서 시도별 미세먼지 PM10 데이터를 가져와서 Folium으로 시각화하기 최근 중국에서 난방을 시작하면서 이제는 코로나에 이어서 미세먼지까지 한국으로 들어오고 있다. 현재 상황이 심각한 만큼 오늘 포스팅에서는 미세먼지 특히 PM10 관련 데이터를 공공데이터 API에서 가져와서 Folium으로 시각화하도록 하겠다. 대한민국 어느 지역에서의 미세먼지가 심각한지 지도로 확인해 볼 수 있는 기회가 됐으면 한다. 공공데이터 관련 정보는 아래 링크에서 확인하기 바란다. data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15000581 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(D.. 2020. 11. 28.
[파이썬] - Pykrx 패키지를 통해 국내 상장 종목별 외국인 보유 비중 확인 이번 포스팅에서는 금융 데이터 추출 패키지 Pykrx를 통해 외국인이 투자한 국내 종목 현황을 체크해보도록 하겠다. 코드를 작성하기 앞서서 간단하게 설명해야 될 포인트가 있다. 주식 투자를 하는 분들은 아시겠지만 국내 주식 시장에는 외국인이 종목별로 보유할 수 있는 최대한도가 있다. 외국인이 아무리 많이 투자하더라도 국내 상장 기업의 주식 100%를 제도상 소유할 수는 없다. 외국인 보유 현황 데이터 추출 코스피, 코스닥 종목 전체를 가져오도록 하겠다. from pykrx import stock import pandas as pd kospi = stock.get_exhaustion_rates_of_foreign_investment_by_ticker('20201120', "KOSPI") kosdaq = s.. 2020. 11. 24.
[파이썬] - Folium 활용하여 서울시 구 기준 인구수 시각화 하기 이번 포스팅에서는 시각화 패키지 Folium을 활용해서 서울시 구 기준으로 인구수를 시각화하도록 하겠다. 인구 데이터는 아래 링크와 같이 국가통계포털에서 가져왔다. 그럼 시각화를 위한 준비는 모두 끝났고, 코드만 아래처럼 따라 하면 된다. 그렇게 어렵지 않다. kosis.kr/statisticsList/statisticsListIndex.do?menuId=M_01_01&vwcd=MT_ZTITLE&parmTabId=M_01_01&statId=1962001&themaId=A#SelectStatsBoxDiv KOSIS 국가통계포털 통계목록검색 통계목록검색 통계목록검색 통계표명검색 검색어입력 검색 전체목록받기 부분목록받기 처리중입니다. 잠시만 기다려 주세요. kosis.kr Python Code Folium을 .. 2020. 11. 22.
[파이썬] - Pykrx 패키지를 통해 국내 상장된 게임 ETF 구성 종목 추출 지난 포스팅에서 Pykrx 패키지를 통해 국내 주요 게임 ETF의 주가와 괴리율을 알아봤다면 이번 시간에는 이어서 분석 대상인 KBSTAR 게임테마, KODEX 게임산업, Tiger K테마 3개 게임 ETF들의 구성 종목을 Pykrx를 통해 추출하도록 하겠다. 2020/11/21 - [주린이의 주식 투자/ETF 공부] - [파이썬] Pykrx 패키지를 활용한 국내 상장된 게임 ETF 분석 [파이썬] Pykrx 패캐지를 활용한 국내 상장된 게임 ETF 분석 Pykrx 이번 포스팅에서는 금융 데이터를 분석해줄 수 있는 파이썬 Pykrx 패키지를 활용해서 국내 상장된 게임 ETF들에 대해 분석하도록 하겠다. 분석에 앞서 당연한 얘기이지만 해당 패키지를 파이 yobro.tistory.com KBSTAR 게임테마.. 2020. 11. 22.
[파이썬 데이터 분석] - Kaggle에 있는 넷플릭스 관련 데이터셋 활용한 데이터 분석 Kaggel Datasets - Netflix Movies and TV Shows 이번 포스팅에서는 Kaggle에 있는 넷플릭스 데이터셋을 갖고 분석해보도록 하겠다. 데이터셋이 크게 복잡하지 않고 데이터 컬럼도 그렇게 많지 않아 다루기 어렵지 않다. 지난 포스팅와 같이 간단히 데이터를 가지고 시각화를 하겠다. www.kaggle.com/shivamb/netflix-shows Netflix Movies and TV Shows Movies and TV Shows listings on Netflix www.kaggle.com Datasets 실제 개봉 연도별 콘텐츠 수 넷플릭스에 있는 콘텐츠들은 언제 개봉한 콘텐츠들이 많은지 알아보기 위한 코드다. 확실히 2015년 이후 개봉한 콘텐츠가 넷플릭스에 많이 포함돼.. 2020. 11. 15.
[파이썬] - Youtube API를 활용해서 네고왕 영상 콘멘트 가져오기 지난 포스팅에 이어 광희가 진행하고 있는 Youtube 네고왕 첫 번째 에피소드 영상에 달린 댓글을 가져오도록 하겠다. 아래 포스팅에서 네고왕 영상에 부여된 ID값을 다 갖고 왔기 때문에 바로 추출할 수 있다. 2020/11/14 - [문송충의 코딩하기/파이썬 데이터 분석] - [파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 [파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 [파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 요즘 유튜브에서 가장 핫한 콘텐츠 중에 하나가 바로 네고왕이다. 광희 목소리가 부담스러워서 나는 한 번도 콘 yobro.tistory.com Python Code 코드가 조금 복잡하다. 댓글을.. 2020. 11. 15.
[파이썬 데이터 분석] - Kaggle 구글 플레이 스토어 앱 데이터셋 분석 [파이썬 데이터 분석] - Kaggle 구글 플레이 스토어 앱 데이터셋 분석 www.kaggle.com/lava18/google-play-store-apps Google Play Store Apps Web scraped data of 10k Play Store apps for analysing the Android market. www.kaggle.com 이번 포스팅을 시작으로 캐글에서 제공하고 있는 수 많은 데이터셋을 활용해서 파이썬 데이터 분석 스터디를 해보고자 한다. 아직 머신러닝 단계는 전혀 모르기 때문에 우선은 데이터를 전처리하고 간략히 시각화하는 연습을 시작해보겠다. 이번 포스팅에서는 위 링크에서 나오는 구글 플레이 스토어 App 데이터를 활용하도록 하겠다. Kaggle Google Play .. 2020. 11. 14.
[파이썬] - 아마존에서 작성된 삼성 QLED TV 고객 리뷰 분석하기 삼성 QLED TV 아마존 고객 리뷰 분석하기 아래에서 추출한 삼성 QLED TV 아마존 리뷰를 갖고 와서 파이썬으로 텍스트 분석해보도록 하겠다. 텍스트 마이닝이 조금 어려운 파트라 파이썬으로 많이 해보지 않았지만 이번 포스팅 작성을 위해 조금 스터디를 했다. 아래 코드를 보시면서 조금 이상하거나 비효율적인 부분이 있더라도 이해해주기 바란다. 2020/11/03 - [문송충의 코딩하기/파이썬 데이터 분석] - [파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 [파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 [파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 이번 포스팅에서는 세계 최대 이커머스 사이트 아마존에서 소비자들이 남긴 제.. 2020. 11. 7.
[장고:분노의 추적자] - 파이썬으로 네이버 영화 리뷰 가져오기 2020/10/10 - [문송충의 코딩하기/파이썬 데이터 분석] - [장고:분노의 추적자] - 네이버 영화 API 통한 영화 정보 분석 with 파이썬 [장고:분노의 추적자] - 네이버 영화 API 통한 영화 정보 분석 with 파이썬 이번 포스팅을 시작으로 네이버에서 제공하고 있는 영화 정보에 대해 파이썬으로 분석해보고자 한다. 우선 네이버 API를 통해 분석하고자 하는 영화 기본 정보를 가져올 수 있는지 알아보고 다�� yobro.tistory.com 위 포스팅에 이어서 내가 좋아하는 장고:분노의 추적자 영화에 사람들이 남긴 리뷰를 네이버 영화 페이지 가져오도록 하겠다. 이번 포스팅에서 평점을 가져온 후 다음 포스팅에서는 텍스트 분석을 해보도록 하겠다. 아래 장고 영화 평점 페이지에서 리뷰 내용을 가.. 2020. 10. 11.
[장고:분노의 추적자] - 네이버 영화 API 통한 영화 정보 분석 with 파이썬 이번 포스팅을 시작으로 네이버에서 제공하고 있는 영화 정보에 대해 파이썬으로 분석해보고자 한다. 우선 네이버 API를 통해 분석하고자 하는 영화 기본 정보를 가져올 수 있는지 알아보고 다음 포스팅에서는 영화 리뷰를 가져와 텍스트 분석하도록 하겠다. 간단하게 내가 가장 좋아하는 영화 쿠엔틴 타란티노 감독이 만든 장고: 분노의 추적자 정보를 우선 API롤 뽑아보도록 하겠다. 네이버 영화 API 관련 내용은 아래 링크에서 확인하기 바란다. 네이버에 로그인해서 API 활용 신청하면 분석을 위한 준비는 끝난 것이다. developers.naver.com/docs/search/movie/ 검색 API 영화 검색 개발가이드 NAVER Developers - 검색 API 영화 검색 개발가이드 developers.nav.. 2020. 10. 10.