본문 바로가기

문송충의 코딩하기/파이썬 데이터 분석39

[파이썬] - Youtube API를 활용해서 네고왕 영상 콘멘트 가져오기 지난 포스팅에 이어 광희가 진행하고 있는 Youtube 네고왕 첫 번째 에피소드 영상에 달린 댓글을 가져오도록 하겠다. 아래 포스팅에서 네고왕 영상에 부여된 ID값을 다 갖고 왔기 때문에 바로 추출할 수 있다. 2020/11/14 - [문송충의 코딩하기/파이썬 데이터 분석] - [파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 [파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 [파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 요즘 유튜브에서 가장 핫한 콘텐츠 중에 하나가 바로 네고왕이다. 광희 목소리가 부담스러워서 나는 한 번도 콘 yobro.tistory.com Python Code 코드가 조금 복잡하다. 댓글을.. 2020. 11. 15.
[파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 [파이썬] - 유튜브 API를 활용해서 네고왕 조회, 좋아요, 댓글 수 가져오기 요즘 유튜브에서 가장 핫한 콘텐츠 중에 하나가 바로 네고왕이다. 광희 목소리가 부담스러워서 나는 한 번도 콘텐츠를 시청하지 않았지만 주변에 물어보면 네고왕이 굉장히 인기가 많아 보여서 이번 포스팅에서 해당 유튜브 콘텐츠를 분석해보고자 한다. 우선 네고왕 콘텐츠 리스트를 다 가져와서 영상별로 영상 타이틀, 조회, 좋아요, 싫어요, 댓글 수를 가져와서 테이블화 하도록 하겠다. 코드는 크게 어렵지 않다. 우선 유의할 점은 코드를 작성하기 전에 Youtube API를 발급해야 한다. 네고왕 PlayList Id 값 유튜브 채널에는 각 콘텐츠 별로 특정 ID값이 부여가 된다. 네고왕 콘텐츠를 제작하는 달라스튜디오 채널에도 발명왕, 네.. 2020. 11. 14.
[파이썬] - 서울시 열린데이터광장 오픈 API 활용해서 서울시 공영주차장 정보를 알아보자 서울시 공영주차장 Open API 이번 포스팅에서는 서울 열린데이터 광장에서 제공하고 있는 Open API를 통해서 서울시에 위치한 공영주차장 정보를 가져오도록 하겠다. 해당 관련 정보는 아래 링크에서 확인할 수 있고, 파이썬 코드를 작성하기 전에 우선 동일 링크에서 API 키를 신청하기 바란다. data.seoul.go.kr/dataList/OA-13122/S/1/datasetView.do 서울시 공영주차장 안내 정보 데이터 이용하기-서울시 공영주차장 안내 정보 data.seoul.go.kr Python Code 우선 아래 코드를 통해서 서울시 공영 주차장 수를 확인해보겠다. 아래 코드를 돌리면 total_num이라는 변수에 총 14,330개의 데이터가 있다는 점을 볼 수 있다. 즉 서울시에는 무려 1.. 2020. 11. 8.
[파이썬] - 아마존에서 작성된 삼성 QLED TV 고객 리뷰 분석하기 삼성 QLED TV 아마존 고객 리뷰 분석하기 아래에서 추출한 삼성 QLED TV 아마존 리뷰를 갖고 와서 파이썬으로 텍스트 분석해보도록 하겠다. 텍스트 마이닝이 조금 어려운 파트라 파이썬으로 많이 해보지 않았지만 이번 포스팅 작성을 위해 조금 스터디를 했다. 아래 코드를 보시면서 조금 이상하거나 비효율적인 부분이 있더라도 이해해주기 바란다. 2020/11/03 - [문송충의 코딩하기/파이썬 데이터 분석] - [파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 [파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 [파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 이번 포스팅에서는 세계 최대 이커머스 사이트 아마존에서 소비자들이 남긴 제.. 2020. 11. 7.
[파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 [파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 이번 포스팅에서는 세계 최대 이커머스 사이트 아마존에서 소비자들이 남긴 제품 리뷰를 파이썬으로 크롤링해서 가져오고자 한다. 예전 직장에서 많이 했던 작업이라서 굉장히 추억이 많은 코드다. 우선 오늘은 데이터를 어떻게 가져오는지만 해보고 다음 시간에는 추출한 텍스트 데이터를 가져오고 상세한 텍스트 분석을 해보고자 한다. 텍스트 마이닝 분야는 내가 굉장히 약한 분야라서 시간이 조금 오래 걸린다. 여하튼 이번 포스팅에서는 우리가 모두 탑승하고 있는 삼성전자의 QLED TV 제품에 고객들이 남긴 리뷰를 다루겠다. 링크는 아래와 같다. www.amazon.com/product-reviews/B084RGZ3P7/ref=cm_cr_arp_d_.. 2020. 11. 3.
[파이썬] - 서울시 공공시설 테니스장 데이터 가져오기 from 서울 공공데이터 API 서울시 공공시설 테니스장 요즘 축구 다음으로 가장 많이 하는 운동이 테니스다. 아직 레슨을 받는 테린이 단계라 실제 테니스 필드에서 플레이한 적은 별로 없지만 종종 친구와 테니스 게임을 하려고 할 때 가장 짜증 나는 과정이 있다. 바로 테니스장을 예약하는 것이다. 특히 최근에는 코로나로 문 닫는 체육시설도 많고 테니스의 경우에도 동호회에서 테니스장 전체를 예약하는 경우가 있어 예약하기 힘들다. 그래서 이번 포스팅에서는 서울 공공데이터 API를 통해서 서울 공공시설 테니스장의 유료/무료 여부, 예약 URL 그리고 지역 위치를 알아보고자 한다. Python Code Open Api는 아래 링크에서 확인하면 되고, API 키 신청도 마찬가지이다. data.seoul.go.kr/dataList/OA-2266/S.. 2020. 11. 1.
[파이썬] 서울시 공공데이터 API를 활용해 서울시 코로나19 확진자 데이터 분석하기 #1 서울 코로나 확진자 데이터 파이썬으로 분석하기 #1 서울시 공공데이터 API에서 제공하고 있는 코로나 19 확진자 데이터를 가져와서 파이썬으로 다뤄보고자 한다. 시간이 늦어서 한 번에 올리지 않고 이번 포스팅에서는 단순히 서울 공공데이터에서 데이터를 어떻게 가져오는지만 코드로 보여주도록 하겠다. 별거 없다. 굉장히 쉽다. 서울시 코로나 확진자 수 데이터셋 URL 아래 링크로 들어가서 사이트 회원가입 후 API 키 신청을 하면 모든 준비가 끝난다. 해당 API에서 사용할 데이터는 코로나 확진 순번, 코로나 확진 날짜, 코로나 접촉 이력, 지역, 현재 상태 데이터이다. data.seoul.go.kr/dataList/OA-20279/S/1/datasetView.do 서울시 코로나19 확진자 현황 데이터 이용하.. 2020. 10. 27.
[장고:분노의 추적자] - 파이썬으로 네이버 영화 리뷰 가져오기 2020/10/10 - [문송충의 코딩하기/파이썬 데이터 분석] - [장고:분노의 추적자] - 네이버 영화 API 통한 영화 정보 분석 with 파이썬 [장고:분노의 추적자] - 네이버 영화 API 통한 영화 정보 분석 with 파이썬 이번 포스팅을 시작으로 네이버에서 제공하고 있는 영화 정보에 대해 파이썬으로 분석해보고자 한다. 우선 네이버 API를 통해 분석하고자 하는 영화 기본 정보를 가져올 수 있는지 알아보고 다�� yobro.tistory.com 위 포스팅에 이어서 내가 좋아하는 장고:분노의 추적자 영화에 사람들이 남긴 리뷰를 네이버 영화 페이지 가져오도록 하겠다. 이번 포스팅에서 평점을 가져온 후 다음 포스팅에서는 텍스트 분석을 해보도록 하겠다. 아래 장고 영화 평점 페이지에서 리뷰 내용을 가.. 2020. 10. 11.
[장고:분노의 추적자] - 네이버 영화 API 통한 영화 정보 분석 with 파이썬 이번 포스팅을 시작으로 네이버에서 제공하고 있는 영화 정보에 대해 파이썬으로 분석해보고자 한다. 우선 네이버 API를 통해 분석하고자 하는 영화 기본 정보를 가져올 수 있는지 알아보고 다음 포스팅에서는 영화 리뷰를 가져와 텍스트 분석하도록 하겠다. 간단하게 내가 가장 좋아하는 영화 쿠엔틴 타란티노 감독이 만든 장고: 분노의 추적자 정보를 우선 API롤 뽑아보도록 하겠다. 네이버 영화 API 관련 내용은 아래 링크에서 확인하기 바란다. 네이버에 로그인해서 API 활용 신청하면 분석을 위한 준비는 끝난 것이다. developers.naver.com/docs/search/movie/ 검색 API 영화 검색 개발가이드 NAVER Developers - 검색 API 영화 검색 개발가이드 developers.nav.. 2020. 10. 10.
공공데이터 API를 활용한 국내 대차거래 종목 순위 확인하기 with 파이썬 대차거래란 주식을 장기 보유한 금융 기관이 단기적으로 이를 필요한 타 기관에 수수료를 받고 빌려주는 거래를 의미한다. 주로 주가가 하락이 예상될 때 주식을 빌린 기관에서 매매한 후 나중에 주가가 가격이 하락했을 때 다시 주식을 매수해 차익을 보는 일종 투자 방법이다. 항상 뉴스에서 나오는 공매도가 바로 이러한 투자 방식을 뜻한다. 주식이 없는 상태에서 주식을 빌려 주가 하락에 베팅하여 투자전략이다. 투자를 할 때 대차잔고를 꼭 참고해서 봐야 되는데 그 이유는 특정 종목에 대차 잔고가 많다는 것은 그만큼 금융 기관에서 주가 하락을 전망하는 투자자가 많아졌다는 의미로 풀이가 되기 때문이다. 대차 잔고가 많다고 해서 무조건 공매도로 이어지는 것은 아니지만 그래도 공매도로 사용될 대기자금인 만큼 공매도 선행지표.. 2020. 10. 8.
한국 거래소에 있는 코스피 종목 기본 정보 파이썬으로 가져오기 한국 거래소에서 상장된 주식 종목들에 대해 기본 정보를 가져올 수 있는지 찾아봤더니 역시나 나와 같은 고민을 하고 있었던 사람이 있었다. 아래 링크는 바로 파이썬으로 한국 거래소 사이트에 있는 상장 종목 기본 정보를 가져올 수 있는 패키지이다. "pip install pykrx"로 패키지 설치를 먼저 하기를 바란다. 이번 글에서는 아래 패키지를 활용해서 코스피 종목들 기본 정보에 대해 가져와보고 엑셀로 추출해보겠다. 코드는 굉장히 쉽다 github.com/sharebook-kr/pykrx sharebook-kr/pykrx KRX 주식 정보 스크래핑. Contribute to sharebook-kr/pykrx development by creating an account on GitHub. github.c.. 2020. 10. 4.
공공데이터 API 활용해서 2019년 코스피 배당주 리스트 가져오기 With Python 내가 주식 투자를 할 때 가장 먼저 보는 지표가 바로 배당이다. 지금과 같이 저금리 시대에서 배당주 투자는 현재 저금리 시대 저금과 예금을 완벽히 대체할 수 있는 투자 전략이기 때문이다. 그래서 오늘은 배당 관련해서 파이썬으로 뭘 뽑아보고자 한다. 공공데이터를 살펴보니 국내 코스피/코스닥에 상장된 기업들에 대해 배당금을 얼마나 지급했는지를 API로 제공하고 있어서 파이썬으로 이걸 한번 분석? 추출해보고자 한다. 코스피 시장에서 배당금을 지급하는 기업이 어디인지 데이터로 보도록 하겠다. 1. Data Source 공공데이터 회원가입을 한 후 아래 페이지에서 한국 예탁결제원_주식정보서비스 API 활용 신청을 해야 한다. 신청 즉시 API 키 값이 바로 부여가 될 것이다. data.go.kr/tcs/dss/s.. 2020. 9. 29.