from wordcloud import WordCloud
import matplotlib.pyplot as plt from wordcloud import WordCloud import pandas as pd from nltk.corpus import stopwords from nltk.tokenize import word_tokenize # 텍스트 파일을 읽어옵니다. with open('input.txt', 'r', encoding='utf-8') as file: text = file.read() # 불용어(stop words)를 로드합니다. stop_words = set(stopwords.words('english')) # 원하는 언어로 변경 가능 # 텍스트를 토큰화하고 불용어를 제거합니다. words = word_tokenize(text) filtered_..
시사경제지식
2023. 8. 28. 09:22