import matplotlib.pyplot as plt
from wordcloud import WordCloud
import pandas as pd
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
# 텍스트 파일을 읽어옵니다.
with open('input.txt', 'r', encoding='utf-8') as file:
text = file.read()
# 불용어(stop words)를 로드합니다.
stop_words = set(stopwords.words('english')) # 원하는 언어로 변경 가능
# 텍스트를 토큰화하고 불용어를 제거합니다.
words = word_tokenize(text)
filtered_words = [word for word in words if word.lower() not in stop_words]
# 단어 빈도를 계산합니다.
word_freq = nltk.FreqDist(filtered_words)
# 워드 클라우드를 생성합니다.
wordcloud = WordCloud(width=800, height=400, background_color='white').generate_from_frequencies(word_freq)
# 워드 클라우드를 표시합니다.
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
# 워드 클라우드를 이미지 파일로 저장합니다.
wordcloud.to_file('wordcloud.png')
# 워드 클라우드 데이터를 데이터프레임으로 변환합니다.
wordcloud_data = pd.DataFrame.from_dict(word_freq, orient='index', columns=['Frequency'])
# 워드 클라우드 데이터를 엑셀 파일로 저장합니다.
wordcloud_data.to_excel('wordcloud_data.xlsx')
# 결과를 표시합니다.
plt.show()
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import pandas as pd
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
# 텍스트 파일을 읽어옵니다.
with open('input.txt', 'r', encoding='utf-8') as file:
text = file.read()
# 불용어(stop words)를 로드합니다.
stop_words = set(stopwords.words('english')) # 원하는 언어로 변경 가능
# 텍스트를 토큰화하고 불용어를 제거합니다.
words = word_tokenize(text)
filtered_words = [word for word in words if word.lower() not in stop_words]
# 단어 빈도를 계산합니다.
word_freq = nltk.FreqDist(filtered_words)
# 워드 클라우드를 생성합니다.
wordcloud = WordCloud(width=800, height=400, background_color='white').generate_from_frequencies(word_freq)
# 워드 클라우드를 표시합니다.
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
# 워드 클라우드를 이미지 파일로 저장합니다.
wordcloud.to_file('wordcloud.png')
# 워드 클라우드 데이터를 데이터프레임으로 변환합니다.
wordcloud_data = pd.DataFrame.from_dict(word_freq, orient='index', columns=['Frequency'])
# 워드 클라우드 데이터를 엑셀 파일로 저장합니다.
wordcloud_data.to_excel('wordcloud_data.xlsx')
# 결과를 표시합니다.
plt.show()
from selenium.webdriver.common.keys import Keys (0) | 2023.08.29 |
---|---|
import matplotlib.pyplot as plt (0) | 2023.08.28 |
soup = BeautifulSoup(response.text, 'html.parser') (0) | 2023.08.26 |
with open(file_path, 'r', encoding='utf-8') as file: (0) | 2023.08.26 |
def generate_random_matrix(): (0) | 2023.08.26 |
단 1채로도 5억 시세차익! 동탄 줍줍 청약의 주인공이 되어보세요!
챗GPT 무료 와 챗GPT 유료 차이점과 GPT-4 무료 사용법
챗GPT 어플, 안드로이드 앱 설치와 사용법, GPT-4o 음성 대화, 무료 사용법
AI 기반 검색 엔진, ChatGPT의 SearchGPT와 구글의 비교
챗GPT로 하루 100통 이메일 자동 작성하는 비법 공개
경제 지표 시계열 분석을 통한 정책 제언, 파이썬을 활용한 GDP 성장률 예측과 그 활용법