일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 인스타그램
- 해시태그
- 괄호 문제
- Chat-GPT
- string to list
- Crawling
- plotly dash
- 알고리즘
- 플라스크
- Python
- 2164 카드2
- kmeans
- convert to shp
- 셀레니움
- 혁신성장부문
- colab runtime
- geoDataFrame
- 백준
- 코랩 런타임
- 크롤링
- 파이썬
- Merge Repositories
- NLP
- python buildpacks
- clustering
- Selenium
- 웹페이지
- flask
- to shp
- geopandas
Archives
- Today
- Total
목록해시태그 크롤링 (1)
코딩코딩코딩
인스타그램 해시태그 크롤링 및 분석 - 5
이전까지 작성했던 내용들은 인스타그램 게시물을 모두 가져오고 난 후에 데이터프레임 형식으로 변환하여 기간을 설정하려고 했었습니다. 이번에는 코드를 수정하여 기간을 설정하고 난 후에 함수를 실행해 그 기간 사이에 있는 게시물들만 크롤링해오려고 합니다. 기존 selenium에서 page scroll을 통해 모든 게시물의 링크를 가져온 후 링크를 읽어들였는데, 이 방법이 아니라 링크를 가져온 후 하나하나씩 읽어가며 날짜를 비교하는 방식으로 코드를 짰습니다. 최초 스크롤 시 게시물이 33개 읽히며 이후 스크롤마다 12개의 게시물을 읽을 수 있습니다. 이 때 임시 리스트를 만들어서 12개의 게시물을 추가한 후 12개의 게시물 모두 설정 기간 내에 존재하지 않는 글이면 함수를 종료하는 방식입니다. (게시물 중간중간..
파이썬/텍스트마이닝
2020. 7. 29. 18:50