본문 바로가기

데이터분석8

패스트캠퍼스 [머신러닝과 데이터분석 A-Z 올인원 패키지 Online] 파이썬 과정 후기 패스트캠퍼스 강의 신청 내역 결론부터 말하자면 패스트캠퍼스에서 머신러닝과 데이터 분석 A-Z 올인원 패키지 온라인 과정을 수강하기로 한 내 결정은 실수였다. 파이썬을 더 딥하게 공부하고자 신청했던 과정인데 어떠한 도움도 되지 못했다. 매달 5천 원씩 1년 치만 지불하면 된다는 광고에 혹해서 구매를 했는데 지금 상황은 거의 한 6개월째 방치 중에 있고, 매달 돈만 통장에서 빠지고 있다. 사람마다 상황이 다르기 때문에 해당 과정이 도움이 될 수 있고, 안될 수가 있다. 이 글은 단순히 내가 그동안 패스트캠퍼스 과정을 들으면서 느낀 점을 솔직하게 후기를 작성한 것이니 그냥 참고차 보시기를 바란다. 패스트캠퍼스 후기를 검색하면 99%가 긍정적인 글일 텐데 그 이유는 패스트캠퍼스를 가보면 알 수 있다. 해당 과정.. 2020. 9. 17.
파이썬으로 국내 성, 연령별 코로나 확진자 수 크롤링 저번 네이버 증권 크롤링에 이어 두 번째 크롤링 시간이다. 이번 시간도 저번과 같이 굉장히 쉽다. 코드 몇 줄이면 우리가 원하는 데이터를 바로 가져올 수 있다. 어떤 데이터를 가져올까라고 고민하던 중 아무래도 관심을 많이 가질만한 주제가 코로나이기 때문에 코로나 상황을 파이썬으로 가져와 간단히 분석하는 코드를 작성해보고자 한다. 데이터를 가져올 소스는 바로 질병관리본부에서 운용하는 "코로나바이러스감염증-19" 사이트이다. 네이버에 코로나 검색할 경우 가장 먼저 나오는 사이트이다.(아래 첫 번째 이미지 참고) 사이트 상단 메뉴바에서 발생동향 -> 국내 발생 동향으로 들어가면 우리가 필요로 하는 다양한 국내 발생 코로나 현황이 나온다.(두 번째 이미지 참고) 1. 코로나 데이터 크롤링 파이썬에서 가장 많이 .. 2020. 7. 27.
Dart 전자공시시스템 API를 통해 현대자동차 Data 가져오기 With Python #2 - 재무상태표 이번 글에서는 저번 시간에 이어서 Dart API를 통해 현대자동차의 재무상태표 데이터를 가져오고, 대표적인 기업 건전성 판단 지표인 유동비율, 부채비율, 자본 유보율을 계산해보도록 하겠다. 저번 손익계산서 부분과 코딩상에서는 큰 차이가 없다. 다만 지표를 하나하나 집계해야 되기에 좀 번거로운 점이 있지만, 크게 어려울 것은 없다. 바로 코드 설명하도록 하겠다. 1. 지난 글과 동일하게 우선 API를 통해 현대자동차의 2014년부터의 재무 상태표를 가져오도록 하겠다. import dart_fss as dart import pandas as pd import matplotlib.pyplot as plt #분석 종목 확인하기 api_key='~' #api_key 입력 dart.set_api_key(api_k.. 2020. 7. 20.
Dart 전자공시시스템 API를 통해 현대자동차 재무 Data 가져오기 With Python #1 - 손익계산서 항상 주식 종목 분석을 할 때 가장 귀찮은 점이 바로 재무지표 확인하는 것이다. Dart, 네이버 증권 사이트 들어가서 하나하나 체크하는 게 너무 번거로웠다, 그런 불편한 부분 때문에 이번 분석 프로젝트를 시작했다. 이번 프로젝트는 조금 장기적으로 가져가려고 한다. 종목코드/회사 명만 입력하면 분석에 필요한 지표/데이터가 포함된 액셀이 자동으로 다운로드할 수 있도록 하는 것이 이번 프로젝트에 최종 목표 결과물이라고 볼 수 있겠다. 종목 분석할 때 다른 거 다 필요 없이 이 액셀만 가지고 할 수 있도록 만들어보겠다. 종목 분석 시 보는 재무 지표가 다양하기 때문에 이번 글에서는 가장 주요한 손익계산서를 Dart 전자 공시 시스템에서 가져와보도록 하겠다. 그리고 간단하게 정리하고 매출액, 영업이익을 가지고 .. 2020. 7. 16.
[알리코제약] - 주린이 동앤트의 국내 기업 분석 및 주식 투자 저번 종목 하나제약에 이어서 두 번째 국내 종목 분석 시간이다. 이번 글에서 소개드리고자 하는 종목은 바로 알리코제약이라는 기업이다. 그렇다... 또 바이오 주식이다. 원래 나도 바이오는 거품이라고 생각해서 투자를 안 했는데, 대한민국의 미래 시장을 본다면 결국 먹거리는 바로 바이오 밖에 없을 것이라는 생각에 요즘 들어 바이오에 대한 투자 비중을 늘리고 있다. 그리고 여기 알리코제약이 바로 하나제약에 이엇 생애 두 번째로 투자한 바이오 기업이다. 평균 매입가 14,200원 아래 빨간색 지점에서 풀매수 했다... 매수 지점에서 조금 떨어지긴 했지만 여의치 않는다. 추가 매수할 수 있는 기회다. 그 많고 많은 재밌는 바이오 주식 중에서 왜 이렇게 차트만 딱 봐도 재미없는 종목만 가져오는지 의문이 들 수 있다.. 2020. 7. 16.
카카오 API를 활용한 동네 브랜드별 편의점 점포 수 구하기 with Python 저번 Folium을 통해 분석한 것과 비슷한 내용의 분석이다. 이번에는 제목 그대로 내가 살고 있는 주소 반경 30km 내 편의점이 몇개가 있고, 브랜드별로 어떻게 구성이 되어있는지 카카오 지도 API를 통해 살펴보고자 한다. 코드를 보면 굉장히 간단하다. 따로 패키지를 임포트할 것도 없다. 그럼 바로 시작하겠다. 1. 내 주소 위도/경도 구하기 우선 내가 살고 있는 집 주소의 위도/경도를 구해야되는데 이것 또한 마찬가지로 카카오 API를 사용할 것이다. 아래처럼 addr이라는 변수에다가 살고 있는 집 주소를 추가해서 돌리면 주소에 맞는 위도/경도가 나올 것이다. import json import requests import pandas as pd addr='인천시 남동구 운연천로11' url = 'ht.. 2020. 7. 14.
Twitter에서 "황희찬"키워드가 포함된 Mention 가져오기 성의없는 코딩 #3 시작한다. 드디어 황희찬 선수가 독일 1부리그 RB라이프치히로 이적을 완료했다. 내년에도 황희찬 선수의 좋은 활약을 기대하며 실제로 트위터에서는 황희찬 선수에 대해 어떤 키워드가 Mention에서 같이 나타나는지 트위터 API를 통해 가져온 후 워드클라우드로 시각화해서 확인해보겠다. 최종 결과물 이번 분석에도 동일하게 Twitter에서 Data를 가져와야 되기 때문에 아래 링크에서 개발자 계정을 발급받아야 된다. https://developer.twitter.com/en Developer Tap into what's happening. Publish and analyze Tweets, optimize ads, and create unique customer experiences. de.. 2020. 7. 11.
Amazon Products Reviews 분석 #1 - 데이터 가져오기 아래 갤럭치 워치 액티브에 있는 소비자 리뷰를 우선 크롤링해보겠다 https://www.amazon.com/Samsung-Active2-Silicon-Aluminum-Bluetooth/dp/B07YNTM7P4/ref=cm_cr_arp_d_product_top?ie=UTF8 결과물: ㄴ 리뷰 날짜, 리뷰 별점, 리뷰 타이틀, 리뷰 내용이 포함된 Raw Data ㄴ 월별 리뷰 평균 별점, 월별 총 리뷰 개수 ㄴ 리뷰 별점 1점~5점 별 리뷰 개수 from selenium import webdriver as wd from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditi.. 2020. 7. 3.