본문 바로가기

크롤링4

파이썬으로 유튜브 슈카월드 검색 결과 가져오기 제곧내다. 파이썬을 활용해서 유튜브에서 "슈카월드"라는 유튜버를 검색했을 때 검색 결과, 즉 어떤 비디오가 나오는지 가져와보도록 하겠다. 이번 크롤링 시간에는 Selenium이나 requests 방식으로는 불가능하고 Youtube에서 제공하고 있는 Youtube API를 통해서 검색 결과를 긁어오겠다. Youtube Search 결과에 대한 가이드 내용은 아래 링크에서 자세히 설명되어 있으니 참고 바란다. https://developers.google.com/youtube/v3/docs/search/list Search: list | YouTube Data API | Google Developers API 요청에 지정된 쿼리 매개변수와 일치하는 검색결과의 모음을 반환합니다. 기본적으로 검색결과의 집합은 .. 2020. 8. 14.
NBA 크리스 폴 선수의 평균 득점/어시스트/스틸 수 추이 분석 With 파이썬 축구 다음으로 좋아하는 스포츠가 농구이고, 그중에서도 NBA 그리고 그중에서도 그 유명한 그그컨(그래서 그분 컨파 진출하심?) 크리스 폴이라는 선수를 좋아한다. NBA 선수에 대해 다양한 분석을 이번 글을 시작으로 해보고자 한다. 아직까지 상세한 데이터를 찾지를 못해서 이번 시간에는 ESPN NBA 스탯 사이트에서 크리스 폴의 데뷔 이후 스텟 기록들을 파이썬 크롤링해서 간단하게 시각화하도록 하겠다. 크리스 폴은 NBA의 대표적인 1번 포인트 가드 포지션으로 중요시하게 보는 지표인 경기당 평균 득점, 어시스트, 스틸을 시즌 별 추이가 어떤지 분석해보겠다. 이번 크롤링에도 pandas 패키지에 있는 read_html 함수를 사용하도록 하겠다. NBA ESPN 사이트에 들어가면 선수 별로 Stats을 보여주는.. 2020. 8. 3.
파이썬으로 국내 성, 연령별 코로나 확진자 수 크롤링 저번 네이버 증권 크롤링에 이어 두 번째 크롤링 시간이다. 이번 시간도 저번과 같이 굉장히 쉽다. 코드 몇 줄이면 우리가 원하는 데이터를 바로 가져올 수 있다. 어떤 데이터를 가져올까라고 고민하던 중 아무래도 관심을 많이 가질만한 주제가 코로나이기 때문에 코로나 상황을 파이썬으로 가져와 간단히 분석하는 코드를 작성해보고자 한다. 데이터를 가져올 소스는 바로 질병관리본부에서 운용하는 "코로나바이러스감염증-19" 사이트이다. 네이버에 코로나 검색할 경우 가장 먼저 나오는 사이트이다.(아래 첫 번째 이미지 참고) 사이트 상단 메뉴바에서 발생동향 -> 국내 발생 동향으로 들어가면 우리가 필요로 하는 다양한 국내 발생 코로나 현황이 나온다.(두 번째 이미지 참고) 1. 코로나 데이터 크롤링 파이썬에서 가장 많이 .. 2020. 7. 27.
네이버 증권 페이지에서 현대차 주요 투자 지표 가져오는 법 With Python 오늘은 간단하게 네이버 증권 페이지에서 현대차 주요 투자 지표를 크롤링하는 방법에 대해서 설명하고자 한다. 네이버 증권 사이트에서 특정 종목을 검색하면 오른쪽 상단에 아래와 같이 주요 지표들이 나오는데 오늘은 이것을 파이썬으로 크롤링 해보도록 하겠다. 코드는 어려울 것 하나도 없다. 1. 종목 코드 가져오기 우선 가져오고자 하는 종목의 코드를 갖고 와야되는데 이거는 갓 Pandas의 도움만 있으면 쉽게 해결된다. 판다스로 아래 거래소 링크를 읽으면 국내 상장된 종목들의 정보를 다 데이터 프레임화 돼서 가져오게 된다. import pandas as pd df=pd.read_html('http://kind.krx.co.kr/corpgeneral/corpList.do?method=download',header.. 2020. 7. 25.