본문 바로가기

python42

네이버 증권 페이지에서 현대차 주요 투자 지표 가져오는 법 With Python 오늘은 간단하게 네이버 증권 페이지에서 현대차 주요 투자 지표를 크롤링하는 방법에 대해서 설명하고자 한다. 네이버 증권 사이트에서 특정 종목을 검색하면 오른쪽 상단에 아래와 같이 주요 지표들이 나오는데 오늘은 이것을 파이썬으로 크롤링 해보도록 하겠다. 코드는 어려울 것 하나도 없다. 1. 종목 코드 가져오기 우선 가져오고자 하는 종목의 코드를 갖고 와야되는데 이거는 갓 Pandas의 도움만 있으면 쉽게 해결된다. 판다스로 아래 거래소 링크를 읽으면 국내 상장된 종목들의 정보를 다 데이터 프레임화 돼서 가져오게 된다. import pandas as pd df=pd.read_html('http://kind.krx.co.kr/corpgeneral/corpList.do?method=download',header.. 2020. 7. 25.
공공데이터 API를 활용한 국민연금 분석하기 #1 With Python 이번 시간에는 공공데이터 API를 통해 국민연금 수급 현황에 대해 분석해보고자 한다. 어떤 걸 처음으로 분석할까 고민하다가 첫 시간이다 보니 조금 간단한 내용으로 시작해보겠다. 시도 별로 국민연금 수급 현황을 한 번 API를 뽑아보고 시도 간의 현황이 어떤지 비교해보겠다. 주관적인 생각이지만 보통 60세부터 국민연금을 받기 시작함으로 이번 글에서 뽑고자 하는 결과물은 나이 기준 60세에 시도 별로 국민연금 수급 현황이 어떻게 다른지 한번 분석해보고자 한다. 이번 API에서 요청할 때 시도 코드, 국민연금 수급 연령, 국민연금 종류만 선택해서 뽑도록 하겠다. 1. API KEY 신청 공공데이터 사이트에 "국민연금 수급현황" 를 검색하고 활용 신청하면 모든 준비가 끝났다. 2. Python Code 다음 내.. 2020. 7. 23.
Dart 전자공시시스템 API를 통해 현대자동차 재무 Data 가져오기 With Python #1 - 손익계산서 항상 주식 종목 분석을 할 때 가장 귀찮은 점이 바로 재무지표 확인하는 것이다. Dart, 네이버 증권 사이트 들어가서 하나하나 체크하는 게 너무 번거로웠다, 그런 불편한 부분 때문에 이번 분석 프로젝트를 시작했다. 이번 프로젝트는 조금 장기적으로 가져가려고 한다. 종목코드/회사 명만 입력하면 분석에 필요한 지표/데이터가 포함된 액셀이 자동으로 다운로드할 수 있도록 하는 것이 이번 프로젝트에 최종 목표 결과물이라고 볼 수 있겠다. 종목 분석할 때 다른 거 다 필요 없이 이 액셀만 가지고 할 수 있도록 만들어보겠다. 종목 분석 시 보는 재무 지표가 다양하기 때문에 이번 글에서는 가장 주요한 손익계산서를 Dart 전자 공시 시스템에서 가져와보도록 하겠다. 그리고 간단하게 정리하고 매출액, 영업이익을 가지고 .. 2020. 7. 16.
주가와 검색량(Queries)의 상관 관계 분석 주식 투자를 좋아하는 주린이으로서 이런 분석은 꼭 해보고 싶었다. 바로 주가와 검색량 간의 상관관계이다. 검색이 많이 이루어질수록 주가도 함께 오르지 않을까라는 의문을 갖고 있었는데 이번 기회에 이 것을 입증하고자 한다. 이번 분석 예제로 사용할 기업은 바로 애증의 현대차이다. 현대차 12층에 물려있긴 하지만 언제간 떡상하기를 기도하면서 이번 분석을 시작하고자 한다. 1. 검색량(Queries) 플랫폼 검색량을 추출할 시 사용할 수 있는 플랫폼?은 2곳이 있는데 하나는 바로 구글 트렌드이고 다른 하나는 네이버 데이터랩의 검색량 트렌드이다. 둘 다 내가 자주 사용하는 검색량 툴이긴 하지만 주식 분석에서는 투자자들은 네이버를 더 많이 사용하지 않을까라는 생각에 이번 분석에서는 네이버 데이터랩을 사용하도록 하.. 2020. 7. 13.
Twitter에서 "황희찬"키워드가 포함된 Mention 가져오기 성의없는 코딩 #3 시작한다. 드디어 황희찬 선수가 독일 1부리그 RB라이프치히로 이적을 완료했다. 내년에도 황희찬 선수의 좋은 활약을 기대하며 실제로 트위터에서는 황희찬 선수에 대해 어떤 키워드가 Mention에서 같이 나타나는지 트위터 API를 통해 가져온 후 워드클라우드로 시각화해서 확인해보겠다. 최종 결과물 이번 분석에도 동일하게 Twitter에서 Data를 가져와야 되기 때문에 아래 링크에서 개발자 계정을 발급받아야 된다. https://developer.twitter.com/en Developer Tap into what's happening. Publish and analyze Tweets, optimize ads, and create unique customer experiences. de.. 2020. 7. 11.
Amazon Products Reviews 분석 #1 - 데이터 가져오기 아래 갤럭치 워치 액티브에 있는 소비자 리뷰를 우선 크롤링해보겠다 https://www.amazon.com/Samsung-Active2-Silicon-Aluminum-Bluetooth/dp/B07YNTM7P4/ref=cm_cr_arp_d_product_top?ie=UTF8 결과물: ㄴ 리뷰 날짜, 리뷰 별점, 리뷰 타이틀, 리뷰 내용이 포함된 Raw Data ㄴ 월별 리뷰 평균 별점, 월별 총 리뷰 개수 ㄴ 리뷰 별점 1점~5점 별 리뷰 개수 from selenium import webdriver as wd from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditi.. 2020. 7. 3.