본문 바로가기

문송충의 코딩하기67

[파이썬] - 아마존에서 작성된 삼성 QLED TV 고객 리뷰 분석하기 삼성 QLED TV 아마존 고객 리뷰 분석하기 아래에서 추출한 삼성 QLED TV 아마존 리뷰를 갖고 와서 파이썬으로 텍스트 분석해보도록 하겠다. 텍스트 마이닝이 조금 어려운 파트라 파이썬으로 많이 해보지 않았지만 이번 포스팅 작성을 위해 조금 스터디를 했다. 아래 코드를 보시면서 조금 이상하거나 비효율적인 부분이 있더라도 이해해주기 바란다. 2020/11/03 - [문송충의 코딩하기/파이썬 데이터 분석] - [파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 [파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 [파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 이번 포스팅에서는 세계 최대 이커머스 사이트 아마존에서 소비자들이 남긴 제.. 2020. 11. 7.
[파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 [파이썬] - 아마존에서 삼성 QLED TV 고객 리뷰 크롤링해서 가져오기 이번 포스팅에서는 세계 최대 이커머스 사이트 아마존에서 소비자들이 남긴 제품 리뷰를 파이썬으로 크롤링해서 가져오고자 한다. 예전 직장에서 많이 했던 작업이라서 굉장히 추억이 많은 코드다. 우선 오늘은 데이터를 어떻게 가져오는지만 해보고 다음 시간에는 추출한 텍스트 데이터를 가져오고 상세한 텍스트 분석을 해보고자 한다. 텍스트 마이닝 분야는 내가 굉장히 약한 분야라서 시간이 조금 오래 걸린다. 여하튼 이번 포스팅에서는 우리가 모두 탑승하고 있는 삼성전자의 QLED TV 제품에 고객들이 남긴 리뷰를 다루겠다. 링크는 아래와 같다. www.amazon.com/product-reviews/B084RGZ3P7/ref=cm_cr_arp_d_.. 2020. 11. 3.
[파이썬] - 네이버 쇼핑 인사이트 API를 통해 콜라, 사이다, 이온음료 제품 카테고리 검색 클릭량 추이 비교 네이버 쇼핑 인사이트 with Python 이번 포스팅에서는 네이버에서 제공하고 있는 네이버 쇼핑 인사이트 데이터를 한번 다루어보고자 한다. 아래 링크에서도 확인 가능하지만 네이버 쇼핑 인사이트란 네이버 사이트에서 특정 쇼핑 카테고리 분야별 검색 클릭 추이 데이터를 제공함으로써 특정 제품 카테고리에 대한 소비자 관심을 확인할 수 있다. 자세한 내용은 아래 링크에서 확인하기 바라고, 이번 포스팅에서는 내가 가장 좋아하는 콜라, 사이다, 이온음료 제품에 대한 네이버 쇼핑 클릭 추이를 비교해보고자 한다. 당연히 여기서도 파이썬으로 분석할 것이다. 네이버 API 키 값을 신청하고 확인해보고 싶은 특정 제품의 쇼핑 카테고리 값을 네이버 쇼핑 사이트에서 가져오면 분석을 위한 사전 준비는 끝이다! developers.. 2020. 11. 1.
[파이썬] - 서울시 공공시설 테니스장 데이터 가져오기 from 서울 공공데이터 API 서울시 공공시설 테니스장 요즘 축구 다음으로 가장 많이 하는 운동이 테니스다. 아직 레슨을 받는 테린이 단계라 실제 테니스 필드에서 플레이한 적은 별로 없지만 종종 친구와 테니스 게임을 하려고 할 때 가장 짜증 나는 과정이 있다. 바로 테니스장을 예약하는 것이다. 특히 최근에는 코로나로 문 닫는 체육시설도 많고 테니스의 경우에도 동호회에서 테니스장 전체를 예약하는 경우가 있어 예약하기 힘들다. 그래서 이번 포스팅에서는 서울 공공데이터 API를 통해서 서울 공공시설 테니스장의 유료/무료 여부, 예약 URL 그리고 지역 위치를 알아보고자 한다. Python Code Open Api는 아래 링크에서 확인하면 되고, API 키 신청도 마찬가지이다. data.seoul.go.kr/dataList/OA-2266/S.. 2020. 11. 1.
[파이썬] - 네이버 데이터랩 API를 활용해서 마켓컬리 네이버 검색량을 알아보자 2020/10/28 - [문송충의 코딩하기/네이버 API] - [파이썬] - "마켓컬리" 키워드가 포함된 네이버 블로그 포스팅 수 확인해보자 with 네이버 API [파이썬] - "마켓컬리" 키워드가 포함된 네이버 블로그 포스팅 수 확인해보자 with 네이버 API 마켓컬리 최근에 마켓컬리 인사이트라는 책을 재밌게 읽었다. 마켓컬리라는 서비스를 한 번도 사용하지 않았지만 현재 이커머스 업계에서는 마켓컬리 만큼 가장 소비자로부터 관심을 받는 플 yobro.tistory.com 위 포스팅에 이어서 마켓컬리에 대해 계속해서 파이썬으로 다루고자 한다. 이번 포스팅에도 역시나 네이버 API를 통해 마켓컬리에 대해 심층 분석하고자 한다. 네이버 API에서 다양한 데이터를 제공하고 있는데 여기서는 네이버 데이터랩 즉.. 2020. 10. 29.
[파이썬] - "마켓컬리" 키워드가 포함된 네이버 블로그 포스팅 수 확인해보자 with 네이버 API 마켓컬리 최근에 마켓컬리 인사이트라는 책을 재밌게 읽었다. 마켓컬리라는 서비스를 한 번도 사용하지 않았지만 현재 이커머스 업계에서는 마켓컬리 만큼 가장 소비자로부터 관심을 받는 플랫폼이 없기 때문에 이번 포스팅의 주제로 잡았다. 마켓컬리가 물론 샛별뱃송이라는 획기적인 배송 서비스와 전지현이 출현한 광고로 많은 이름을 알렸지만 내가 보기에는 소비자가 실제 사용하고 남긴 후기들이야말로 마켓컬리의 현재를 만들었다고 본다. 그래서 이번 포스팅에서는 우선 간략히 네이버 검색 블로그 API를 활용해서 실제로 마켓컬리 관련 블로그 포스팅 개수가 실제로 많이 증가했는지 파이썬을 활용해서 시계열 분석을 해보고자 한다. 마켓컬리가 아직 상장은 안했지만 지금부터 천천히 분석해서 나중에 상장했을 때 투자에 참고하고자 한다. .. 2020. 10. 28.
[파이썬] 서울시 공공데이터 API를 활용해 서울시 코로나19 확진자 데이터 분석하기 #1 서울 코로나 확진자 데이터 파이썬으로 분석하기 #1 서울시 공공데이터 API에서 제공하고 있는 코로나 19 확진자 데이터를 가져와서 파이썬으로 다뤄보고자 한다. 시간이 늦어서 한 번에 올리지 않고 이번 포스팅에서는 단순히 서울 공공데이터에서 데이터를 어떻게 가져오는지만 코드로 보여주도록 하겠다. 별거 없다. 굉장히 쉽다. 서울시 코로나 확진자 수 데이터셋 URL 아래 링크로 들어가서 사이트 회원가입 후 API 키 신청을 하면 모든 준비가 끝난다. 해당 API에서 사용할 데이터는 코로나 확진 순번, 코로나 확진 날짜, 코로나 접촉 이력, 지역, 현재 상태 데이터이다. data.seoul.go.kr/dataList/OA-20279/S/1/datasetView.do 서울시 코로나19 확진자 현황 데이터 이용하.. 2020. 10. 27.
[장고:분노의 추적자] - 파이썬으로 네이버 영화 리뷰 가져오기 2020/10/10 - [문송충의 코딩하기/파이썬 데이터 분석] - [장고:분노의 추적자] - 네이버 영화 API 통한 영화 정보 분석 with 파이썬 [장고:분노의 추적자] - 네이버 영화 API 통한 영화 정보 분석 with 파이썬 이번 포스팅을 시작으로 네이버에서 제공하고 있는 영화 정보에 대해 파이썬으로 분석해보고자 한다. 우선 네이버 API를 통해 분석하고자 하는 영화 기본 정보를 가져올 수 있는지 알아보고 다�� yobro.tistory.com 위 포스팅에 이어서 내가 좋아하는 장고:분노의 추적자 영화에 사람들이 남긴 리뷰를 네이버 영화 페이지 가져오도록 하겠다. 이번 포스팅에서 평점을 가져온 후 다음 포스팅에서는 텍스트 분석을 해보도록 하겠다. 아래 장고 영화 평점 페이지에서 리뷰 내용을 가.. 2020. 10. 11.
[장고:분노의 추적자] - 네이버 영화 API 통한 영화 정보 분석 with 파이썬 이번 포스팅을 시작으로 네이버에서 제공하고 있는 영화 정보에 대해 파이썬으로 분석해보고자 한다. 우선 네이버 API를 통해 분석하고자 하는 영화 기본 정보를 가져올 수 있는지 알아보고 다음 포스팅에서는 영화 리뷰를 가져와 텍스트 분석하도록 하겠다. 간단하게 내가 가장 좋아하는 영화 쿠엔틴 타란티노 감독이 만든 장고: 분노의 추적자 정보를 우선 API롤 뽑아보도록 하겠다. 네이버 영화 API 관련 내용은 아래 링크에서 확인하기 바란다. 네이버에 로그인해서 API 활용 신청하면 분석을 위한 준비는 끝난 것이다. developers.naver.com/docs/search/movie/ 검색 API 영화 검색 개발가이드 NAVER Developers - 검색 API 영화 검색 개발가이드 developers.nav.. 2020. 10. 10.
손흥민 선수 EPL 시즌별 퍼포먼스를 알아보자 with 파이썬 우리흥 손흥민 선수가 요즘 대세이다 보니 나도 손흥민 선수 관련 콘텐츠를 놓칠 수가 없었다. 아스날 팬으로서 토트넘이 잘 나가기를 바라지는 않지만 그래도 손흥민만큼은 같은 한국인으로서 그래도 잘해줬으면 한다. 여하튼 이번 글에서는 손흥민이 이피엘 진출 후 시즌별로 어떠한 스텟을 쌓았는지 파이썬으로 데이터를 가져와보고 시각화해보도록 하겠다. 밑에서 분석한 데이터는 모두 EPL 경기에 한정돼 있다는 점 참고 바란다. 데이터 소스 이번 분석에는 ESPN EPL 사이트에서 데이터를 가져오도록 하겠다. 단순히 공격 포인트 말고 상세 스텟을 분석해보고 싶은데 그런 데이터를 파이썬으로 쉽게 크롤링할 수 있는 사이트를 아직 찾지 못했다. 그래서 이번에는 ESPN 사이트에서 단순 공격 포인트를 가져오도록 하겠다. www.. 2020. 10. 8.
공공데이터 API를 활용한 국내 대차거래 종목 순위 확인하기 with 파이썬 대차거래란 주식을 장기 보유한 금융 기관이 단기적으로 이를 필요한 타 기관에 수수료를 받고 빌려주는 거래를 의미한다. 주로 주가가 하락이 예상될 때 주식을 빌린 기관에서 매매한 후 나중에 주가가 가격이 하락했을 때 다시 주식을 매수해 차익을 보는 일종 투자 방법이다. 항상 뉴스에서 나오는 공매도가 바로 이러한 투자 방식을 뜻한다. 주식이 없는 상태에서 주식을 빌려 주가 하락에 베팅하여 투자전략이다. 투자를 할 때 대차잔고를 꼭 참고해서 봐야 되는데 그 이유는 특정 종목에 대차 잔고가 많다는 것은 그만큼 금융 기관에서 주가 하락을 전망하는 투자자가 많아졌다는 의미로 풀이가 되기 때문이다. 대차 잔고가 많다고 해서 무조건 공매도로 이어지는 것은 아니지만 그래도 공매도로 사용될 대기자금인 만큼 공매도 선행지표.. 2020. 10. 8.
한국 거래소에 있는 코스피 종목 기본 정보 파이썬으로 가져오기 한국 거래소에서 상장된 주식 종목들에 대해 기본 정보를 가져올 수 있는지 찾아봤더니 역시나 나와 같은 고민을 하고 있었던 사람이 있었다. 아래 링크는 바로 파이썬으로 한국 거래소 사이트에 있는 상장 종목 기본 정보를 가져올 수 있는 패키지이다. "pip install pykrx"로 패키지 설치를 먼저 하기를 바란다. 이번 글에서는 아래 패키지를 활용해서 코스피 종목들 기본 정보에 대해 가져와보고 엑셀로 추출해보겠다. 코드는 굉장히 쉽다 github.com/sharebook-kr/pykrx sharebook-kr/pykrx KRX 주식 정보 스크래핑. Contribute to sharebook-kr/pykrx development by creating an account on GitHub. github.c.. 2020. 10. 4.