본문 바로가기

문송충의 코딩하기67

Dart 전자공시시스템 API를 통해 현대자동차 재무 Data 가져오기 With Python #1 - 손익계산서 항상 주식 종목 분석을 할 때 가장 귀찮은 점이 바로 재무지표 확인하는 것이다. Dart, 네이버 증권 사이트 들어가서 하나하나 체크하는 게 너무 번거로웠다, 그런 불편한 부분 때문에 이번 분석 프로젝트를 시작했다. 이번 프로젝트는 조금 장기적으로 가져가려고 한다. 종목코드/회사 명만 입력하면 분석에 필요한 지표/데이터가 포함된 액셀이 자동으로 다운로드할 수 있도록 하는 것이 이번 프로젝트에 최종 목표 결과물이라고 볼 수 있겠다. 종목 분석할 때 다른 거 다 필요 없이 이 액셀만 가지고 할 수 있도록 만들어보겠다. 종목 분석 시 보는 재무 지표가 다양하기 때문에 이번 글에서는 가장 주요한 손익계산서를 Dart 전자 공시 시스템에서 가져와보도록 하겠다. 그리고 간단하게 정리하고 매출액, 영업이익을 가지고 .. 2020. 7. 16.
공공데이터 Open API를 통해 삼성전자 주주 구성 분석하기 With Python 주린이로서 오늘도 역시 주식과 관련된 데이타를 분석해보고자 한다. 삼성전자 주식을 갖고 있는 주주들에 대해 간단하게 분석하고 자 하는데 주된 내용은 다음과 같다. 1. 주식 수 기준 주주 수 분포도 2 성별 별 주주 분포 3. 연령 별 주주 분포 위에 있는 내용을 각각 Open API로 추출해서 시각화까지해서 마무리하고자 한다. 별 의미 없는 내용일 수 있지만 나한테는 어느정도 궁금했던 내용이었다. 그럼 바로 시작하겠다. 1. 공공데이터 Open API key 값 받기 오늘 사용할 데이터는 바로 공공데이터이다. 정부에서 운영하는 사이트만큼 다양한 데이터를 제공하고 있다. 추후 분석 프로젝트에서도 해당 사이트를 많이 이용할 예정이다. 오늘 분석에 활용될 데이터는 아래 링크로 확인 바란다. https://d.. 2020. 7. 15.
카카오 API를 활용한 동네 브랜드별 편의점 점포 수 구하기 with Python 저번 Folium을 통해 분석한 것과 비슷한 내용의 분석이다. 이번에는 제목 그대로 내가 살고 있는 주소 반경 30km 내 편의점이 몇개가 있고, 브랜드별로 어떻게 구성이 되어있는지 카카오 지도 API를 통해 살펴보고자 한다. 코드를 보면 굉장히 간단하다. 따로 패키지를 임포트할 것도 없다. 그럼 바로 시작하겠다. 1. 내 주소 위도/경도 구하기 우선 내가 살고 있는 집 주소의 위도/경도를 구해야되는데 이것 또한 마찬가지로 카카오 API를 사용할 것이다. 아래처럼 addr이라는 변수에다가 살고 있는 집 주소를 추가해서 돌리면 주소에 맞는 위도/경도가 나올 것이다. import json import requests import pandas as pd addr='인천시 남동구 운연천로11' url = 'ht.. 2020. 7. 14.
주가와 검색량(Queries)의 상관 관계 분석 주식 투자를 좋아하는 주린이으로서 이런 분석은 꼭 해보고 싶었다. 바로 주가와 검색량 간의 상관관계이다. 검색이 많이 이루어질수록 주가도 함께 오르지 않을까라는 의문을 갖고 있었는데 이번 기회에 이 것을 입증하고자 한다. 이번 분석 예제로 사용할 기업은 바로 애증의 현대차이다. 현대차 12층에 물려있긴 하지만 언제간 떡상하기를 기도하면서 이번 분석을 시작하고자 한다. 1. 검색량(Queries) 플랫폼 검색량을 추출할 시 사용할 수 있는 플랫폼?은 2곳이 있는데 하나는 바로 구글 트렌드이고 다른 하나는 네이버 데이터랩의 검색량 트렌드이다. 둘 다 내가 자주 사용하는 검색량 툴이긴 하지만 주식 분석에서는 투자자들은 네이버를 더 많이 사용하지 않을까라는 생각에 이번 분석에서는 네이버 데이터랩을 사용하도록 하.. 2020. 7. 13.
Twitter에서 "황희찬"키워드가 포함된 Mention 가져오기 성의없는 코딩 #3 시작한다. 드디어 황희찬 선수가 독일 1부리그 RB라이프치히로 이적을 완료했다. 내년에도 황희찬 선수의 좋은 활약을 기대하며 실제로 트위터에서는 황희찬 선수에 대해 어떤 키워드가 Mention에서 같이 나타나는지 트위터 API를 통해 가져온 후 워드클라우드로 시각화해서 확인해보겠다. 최종 결과물 이번 분석에도 동일하게 Twitter에서 Data를 가져와야 되기 때문에 아래 링크에서 개발자 계정을 발급받아야 된다. https://developer.twitter.com/en Developer Tap into what's happening. Publish and analyze Tweets, optimize ads, and create unique customer experiences. de.. 2020. 7. 11.
Folium으로 회사 주변 GS25 위치 지도로 표시#2 이번 프로젝트는 별거 없다. Folium이라는 패키지와 Kakao 지도 API를 통해 아래 첨부 이미지처럼 내 회사 위치인 합정 근처에 GS25가 어디에 있는지 지도로 표시하고자 한다. 이번 분석? 분석이라고 하기도 좀 그렇지만 필요한 것은 다 알겠지만 우선 pip install folium으로 패키지를 우선 임포트해야되며, 또한 kakao 지도 api를 사용할 예정이라 아래 링크에 들어가서 가입해야 된다 https://developers.kakao.com/ 그러면 계정에 API 값이 발급되는데 그걸 사용할 것이다. 어려운거 하나도 없다. 아래 작성한 코드만 봐도 굉장히 간단하다! import requests import folium import pandas as pd #카카오 지도에서 검색하고자하는 위.. 2020. 7. 8.
Amazon Products Reviews 분석 #1 - 데이터 가져오기 아래 갤럭치 워치 액티브에 있는 소비자 리뷰를 우선 크롤링해보겠다 https://www.amazon.com/Samsung-Active2-Silicon-Aluminum-Bluetooth/dp/B07YNTM7P4/ref=cm_cr_arp_d_product_top?ie=UTF8 결과물: ㄴ 리뷰 날짜, 리뷰 별점, 리뷰 타이틀, 리뷰 내용이 포함된 Raw Data ㄴ 월별 리뷰 평균 별점, 월별 총 리뷰 개수 ㄴ 리뷰 별점 1점~5점 별 리뷰 개수 from selenium import webdriver as wd from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditi.. 2020. 7. 3.