일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 해시태그
- python buildpacks
- 2164 카드2
- colab runtime
- 셀레니움
- 괄호 문제
- 파이썬
- 코랩 런타임
- geoDataFrame
- Merge Repositories
- Selenium
- 플라스크
- NLP
- Python
- 알고리즘
- convert to shp
- plotly dash
- to shp
- kmeans
- geopandas
- Chat-GPT
- 인스타그램
- Crawling
- 백준
- flask
- 혁신성장부문
- 크롤링
- clustering
- string to list
- 웹페이지
- Today
- Total
목록Python (12)
코딩코딩코딩
알고리즘 문제를 풀다보면 입력받은 문자열을 모두 분해해서 리스트로 저장해야 하는 경우가 종종 있다. 이 경우 공백 문자나 구분자가 없으면 split을 사용하기 어렵기 때문에 문자열을 바로 배열로 변환하는 방법에 대해 정리해보았다. 문자열: target = 'HelloWorld" 문자배열: alphabet_list = [] 1. for loop for alphabet in target: alphabet_list.append(alphabet) print(alphabet_list) >>> ['H', 'e', 'l', 'l', 'o', 'W', 'o', 'r', 'l', 'd'] 2. list comprehension alphabet_list = [alphabet for alphabet in target] pr..
sys.stdin.readline() 사용법 큐 관련 문제들은 시간제한을 굉장히 타이트하게 준다. 가장 기본적인 list 풀이도 deque와 굉장히 큰 성능차이를 보이는데, 이러한 문제에서는 입력값을 받는 것에도 신경써야 한다. 입력값을 반복적으로 여러 줄 입력받아야 한다면 input()이 아니라 sys.stdin.readline()을 사용해야 한다. * 다만 readline()은 줄 별로 입력받기 때문에 개행문자가 같이 받아지므로 주의해야 한다. ( int() 사용 ) import sys 1. 한 개의 정수를 한 줄에 입력받을 때 N = int(sys.stdin.readline()) 2. 여러 개의 정수를 한 줄에 입력받을 때 N_list = list(map(int, sys.stdin.readline(..
SettingWithCopyWarning 에러는 원천 DataFrame의 일부로 구성된 파생 DataFrame에 변경을 가하는 경우 발생합니다. 기본적으로 Pandas는 원천 DataFrame을 생성할 때에만 메모리를 할당합니다 이로부터 파생되는 DataFrame은 원천 DataFrame을 이미 적재된 메모리에 접근케 하며 이를 통해 메모리를 절약합니다. 다만 Pandas에서는 파생 DataFrame에 수정을 가하는 것을 권장하지 않습니다. 따라서 copy() 메서드를 통해서 파생 DataFrame에 독립적인 메모리를 부여한 뒤 여기에 수정을 가하도록 유도합니다. 즉, SettintWithCopyWarning은 원천 DataFrame의 일부를 수정하려고 할 때 발생하며, 이 문제는 파생 DataFrame..
https://hansuho113.tistory.com/4 파이썬 네이버 뉴스 일일 기사 크롤링 - 2 지난번 크롤링 했던 내용들을 바탕으로 기사 간 클러스터링 진행 제목 + 요약내용 리스트를 Konlpy 를 통해 명사화 시킨 후 클러스터링을 진행할 예정입니다. TitDesc_okt = [] for item in TitDesc_list: item_n hansuho113.tistory.com 이전 글에 이어서 클러스터별 대표 기사를 추출하는 작업을 진행할 예정 * 크롤링 날짜를 바꾸고 실행해서 클러스터링 기사 내용이 조금 다릅니다. cluster_centers = km_cluster.cluster_centers_ print('cluster_centers shape : ', cluster_centers.sh..
지난번 크롤링 했던 내용들을 바탕으로 기사 간 클러스터링 진행 제목 + 요약내용 리스트를 Konlpy 를 통해 명사화 시킨 후 클러스터링을 진행할 예정입니다. TitDesc_okt = [] for item in TitDesc_list: item_nouns = ' '.join(okt.nouns(item)) TitDesc_okt.append(item_nouns) tfidf_vectorizer = TfidfVectorizer() tfidf_matrix_okt = tfidf_vectorizer.fit_transform(TitDesc_okt) TitDesc_okt[:3] #Vectorization okt, komoran, kkma, Hannanum등의 tokenizing 모델들이 있지만 개인적으로 모두 진행해본 ..
https://tfhub.dev/google/faster_rcnn/openimages_v4/inception_resnet_v2/1 TensorFlow Hub tfhub.dev def display_image(image): fig = plt.figure(figsize=(20, 15)) plt.grid(False) plt.imshow(image) def download_and_resize_image(url, new_width=256, new_height=256, display=False): _, filename = tempfile.mkstemp(suffix=".jpg") response = urlopen(url) image_data = response.read() image_data = BytesIO(ima..