상세 컨텐츠

본문 제목

from wordcloud import WordCloud

시사경제지식

by 브로마리 2023. 8. 28. 09:22

본문

반응형

 

 

 

import matplotlib.pyplot as plt
from wordcloud import WordCloud
import pandas as pd
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize

# 텍스트 파일을 읽어옵니다.
with open('input.txt', 'r', encoding='utf-8') as file:
    text = file.read()

# 불용어(stop words)를 로드합니다.
stop_words = set(stopwords.words('english'))  # 원하는 언어로 변경 가능

# 텍스트를 토큰화하고 불용어를 제거합니다.
words = word_tokenize(text)
filtered_words = [word for word in words if word.lower() not in stop_words]

# 단어 빈도를 계산합니다.
word_freq = nltk.FreqDist(filtered_words)

# 워드 클라우드를 생성합니다.
wordcloud = WordCloud(width=800, height=400, background_color='white').generate_from_frequencies(word_freq)

# 워드 클라우드를 표시합니다.
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')

# 워드 클라우드를 이미지 파일로 저장합니다.
wordcloud.to_file('wordcloud.png')

# 워드 클라우드 데이터를 데이터프레임으로 변환합니다.
wordcloud_data = pd.DataFrame.from_dict(word_freq, orient='index', columns=['Frequency'])

# 워드 클라우드 데이터를 엑셀 파일로 저장합니다.
wordcloud_data.to_excel('wordcloud_data.xlsx')

# 결과를 표시합니다.
plt.show()

 

 

 

 

import matplotlib.pyplot as plt
from wordcloud import WordCloud
import pandas as pd
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize

# 텍스트 파일을 읽어옵니다.
with open('input.txt', 'r', encoding='utf-8') as file:
    text = file.read()

# 불용어(stop words)를 로드합니다.
stop_words = set(stopwords.words('english'))  # 원하는 언어로 변경 가능

# 텍스트를 토큰화하고 불용어를 제거합니다.
words = word_tokenize(text)
filtered_words = [word for word in words if word.lower() not in stop_words]

# 단어 빈도를 계산합니다.
word_freq = nltk.FreqDist(filtered_words)

# 워드 클라우드를 생성합니다.
wordcloud = WordCloud(width=800, height=400, background_color='white').generate_from_frequencies(word_freq)

# 워드 클라우드를 표시합니다.
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')

# 워드 클라우드를 이미지 파일로 저장합니다.
wordcloud.to_file('wordcloud.png')

# 워드 클라우드 데이터를 데이터프레임으로 변환합니다.
wordcloud_data = pd.DataFrame.from_dict(word_freq, orient='index', columns=['Frequency'])

# 워드 클라우드 데이터를 엑셀 파일로 저장합니다.
wordcloud_data.to_excel('wordcloud_data.xlsx')

# 결과를 표시합니다.
plt.show()

반응형

ai 핫토픽

단 1채로도 5억 시세차익! 동탄 줍줍 청약의 주인공이 되어보세요!

챗GPT 한국어 설정, 챗GPT 한글 사용법

챗GPT 무료 와 챗GPT 유료 차이점과 GPT-4 무료 사용법

챗GPT 어플, 안드로이드 앱 설치와 사용법, GPT-4o 음성 대화, 무료 사용법

GPT-5와 의료 분야, AI의 역할 재정립

AI 기반 검색 엔진, ChatGPT의 SearchGPT와 구글의 비교

챗GPT로 하루 100통 이메일 자동 작성하는 비법 공개

경제 지표 시계열 분석을 통한 정책 제언, 파이썬을 활용한 GDP 성장률 예측과 그 활용법


챗GPT GPT-4o 무료로 그림 그리기



관련글 더보기