WordCloud-安装与应用

配置pip 镜像源

# 临时下载镜像
pip install 【替换为所需要安装库名称】 -i https://pypi.douban.com/simple/
# 永久设置(python版本需高于3.5+) 链接地址可替换
pip config set global.index-url https://pypi.douban.com/simple/

# 可选择如下镜像链接以提高下载速度
# 阿里云
http://mirrors.aliyun.com/pypi/simple/

# 清华大学
https://pypi.tuna.tsinghua.edu.cn/simple/

# 中国科技大学
https://pypi.mirrors.ustc.edu.cn/simple/

# 中国科学技术大学
http://pypi.mirrors.ustc.edu.cn/simple/

# 豆瓣
https://pypi.douban.com/simple/

确认安装python 版本

安装版本确定,尽可能选择高版本(`python3.5` 不支持`config` 参数)

`wordcloud`

wordcloud

1 2	# 由于版本问题直接安装报错,可痛过如下地址下载 wheel https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

选择对应版本下载	下载为`python3.9`,放在需要启动的项目处

wheel

1 2	# wheel 是 Python生态系统的一个组件，它有助于使包的安装工作正常进行。它们允许更快的安装和更稳定的包分发过程。 pip install wheel

`wheel`

打开一个项目(启动时会随机启动虚拟环境或者是运行环境,安装在当前运行环境下,wordcloud 将可用)

`wordcloud` 安装

使用测试

`wordcloud` 使用

词云图(原始素材图需要为png)

词云分析结果

jieba

安装jieba 库

1	pip install jieba

`jieba` 库安装

jieba.cut 方法接受三个输入参数: 需要分词的字符串；cut_all 参数用来控制是否采用全模式；HMM 参数用来控制是否使用 HMM 模型
jieba.cut_for_search 方法接受两个参数：需要分词的字符串；是否使用 HMM 模型。该方法适合用于搜索引擎构建倒排索引的分词，粒度比较细
待分词的字符串可以是 unicode 或 UTF-8 字符串、GBK 字符串。注意：不建议直接输入 GBK 字符串，可能无法预料地错误解码成 UTF-8
jieba.cut 以及 jieba.cut_for_search 返回的结构都是一个可迭代的 generator，可以使用 for 循环来获得分词后得到的每一个词语(unicode)，或者用
jieba.lcut 以及 jieba.lcut_for_search 直接返回 list
jieba.Tokenizer(dictionary=DEFAULT_DICT) 新建自定义分词器，可用于同时使用不同词典。jieba.dt 为默认分词器，所有全局分词相关函数都是该分词器的映射。