분류 전체보기327 네이버 영화 홈페이지에서 영화의 평점 변화 정리하기 https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=cur&tg=0&date=20200501 위 사이트에서 2020년 5월 1일로부터 100일간의 영화별 기간별 평점을 정리한다. https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=cur&tg=0&date=20200501 링크의 홈페이지는 date={date}로 날짜별로 구분되어 있다. 영화제목은 tit5 클래스 div태그의 내부의 a태그 안에 텍스트로 들어있다 평점은 point클래스 td태그에 텍스트로 들어있다. 홈페이지 주소를 urllib모듈의 urlopen으로 html문서를 page에 넣은 후에 beautifulsoup 객체에 html.parser와 함께 넣어준.. 2020. 8. 11. 시카고 샌드위치 맛집 분석 시카고 샌드위치 맛집 리스트를 정리 https://www.chicagomag.com/Chicago-Magazine/November-2012/Best-Sandwiches-Chicago/ 위 사이트 하단부의 샌드위치집 순위를 csv파일로 정리해서 시각화하는 것 1. 가게이름, 가게 메인메뉴, 가게 리뷰 페이지(링크url)를 정리 2. 추가로 음식점의 주소, 메인메뉴의 가격도 포함 데이터를 인터넷에서 직접 얻어서 사용 홈페이지 하단부의 top50 샌드위치 집이 소개돼 있다. 각 항목마다 시카고 샌드위치 맛집 리스트를 정리 https://www.chicagomag.com/Chicago-Magazine/November-2012/Best-Sandwiches-Chicago/ 위 사이트 하단부의 샌드위치집 순위를 cs.. 2020. 8. 8. BeautifulSoup BeautifulSoup는 인터넷에서 웹 페이지의 내용을 가져오는 모듈이다. html 파일에서 원하는 내용을 어떻게 가져올 수 있는지 알아보자. 추가 from bs4 import BeautifulSoup 예제에 사용할 test_first.html파일의 내용 Happy PinkWink. PinkWink Happy Data Science. Python Data Science is funny. All I need is Love. *prettify html파일을 잘 정리해서 문자열로 만들어준다. html을 그냥 파이썬 내장 open함수로 읽으면 문자열 타입으로 읽어온다. page = open("../data/03. test_first.html",'r').read() page #out: #'\n\n \n \n \.. 2020. 8. 8. folium 지도 시각화 도구 *Map 위도와 경도정보로 지도를 가져온다. 여러 옵션을 지정해줄 수 있다. 지도를 가져오고 그 상태에서 원하는 좌표(위도,경도)에 Marker명령으로 마커를 찍을 수 있다. CircleMarker 명령으론 반경과 색상을 지정하면 원을 그려준다. 미국의 2012년도 state별 실업률을 지도에 시각화하는 예제 json 파일엔 state별 고유 ID, 주 이름, state의 좌표 등의 정보가 있다. 또한 state마다 지도상 경계선의 좌표가 일일이 저장되어있어서 그 선을 따라 그리면 주 경계선이 된다. (choropleth는 지역도라는 뜻) state_geo = '../data/02. folium_us-states.json' map = folium.Map(location=[40,-98],.. 2020. 7. 30. 이전 1 ··· 17 18 19 20 21 22 23 ··· 82 다음