这个非常简单,主要分为3步,先提取qq聊天记录信息,然后进行jieba分词,最后再绘制词云就行,下面我简单介绍一下实现过程,感兴趣的朋友可以自己尝试一下:
1.首先,导出qq聊天记录,这个直接在消息管理器中导出就行,如下,为了后面方便程序处理,这里建议导出为txt格式:
2.接着就是提取qq聊天记录信息,这个直接使用open函数打开文件读取就行,如下,这里我去掉了时间、==、图片、表情等无用信息,以防止这些信息对分词结果产生影响:
3.然后就是使用jieba分词模块进行中文分词(这里你也可以使用snownlp等中文分词模块),安装的话,直接输入命令“pip install jieba”就行,测试代码如下,非常简单,直接使用cut函数切分就行,这里为了结果更准确,你也可以使用停用词进行过滤:
4.接着就是根据分词结果绘制词云,这里主要用到wordcloud这个模块,专门用于绘制词云图,安装的话,输入命令“pip install wordcloud”就行,测试代码如下,根据上一步的分词结果,直接生成词云就行,这里需要设置一下字体,不然会出现中文乱码:
5.最后再在main函数中依次调用上面3个函数,就会在本地生成一个词云图片:
成功绘制出的qq聊天记录词云图如下,看着还是非常不错的:
至此,我们就完成了利用python来绘制qq聊天记录词云图。总的来说,整个过程非常简单,只要你有一定的python基础,熟悉一下上面的代码,多调试几遍程序,很快就能掌握的,网上也有相关教程和资料,介绍的非常详细,感兴趣的话,可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言进行补充。
第一步:准备好词云数据
数据可以是csv文件,也可以从excel中直接复制过去。如果数据量大可以采用csv,少的话,就直接复制就可以。
第二步:准备好中文字体
这个网站只只支持英文字体,如果中文的话需要自己上传字体。
中文字体可以去一些字体网站上下载,但其实我们电脑上有自带的字体文件,就在控制面板->外观与个性化->字体中
第三步:生成词云图
点击visuliaze,就可以生成词云图啦
第四步:个性化定制
生成的词云图形状、形状、颜色、大小都可以根据你的需求进行更改!如果你有进一步的需求可以自己在页面探索一下
在Excel中制作词频云的步骤如下:
1. 首先,将需要分析的内容粘贴到Excel表格中,整理成关键词与词频的格式。
2. 接着,用鼠标点击D1单元格,然后插入→获取加载项→应用商店→搜索“E2D3”→添加→继续→找到“Word cloud”→Visualize。
3. 在弹出的窗口中,修改字段名称为name、value,然后Ctrl+A全选数据,点击“Reset data area”,即可生成默认的词云图。
4. 如果需要对词频进行分析,还可以导出词频分析的Excel报告。
相关标签: # 如何制作关键词云图模板图片
最新留言