开发者社区> autofelix> 正文

python 特效之词云制作

简介: 数据可视化这样处理可不要太秀
+关注继续查看

什么是 词云


词云 其实就是就是对网络文本中出现频率较高的〝关键词〞予以视觉上的突出,形成〝关键词云层〞或〝关键词渲染〞从而过滤掉大量的文本信息


词云 也是数据可视化的一种形式。给出一段文本,根据关键词的出现频率而生成的一幅图像,人们只要扫一眼就能够明白其文章主旨。


一、特效预览

word_cloud.jpg

词云图


二、程序原理

  • 从给出的文本中,进行分词处理,然后将每个词出现的的频率进行统计
  • 从给出的背景图片上,读出图片信息
  • 将文本按照出现的频率进行画图,出现频率越高,字体设置越大

dance.gif

你听懂了吗


三、程序源码

  • jieba 模块:用来进行分词处理
  • PIL 模块:用来进行图片处理
  • wordcloud 模块:用来进行生成词云
#!/usr/bin/env python
# encoding: utf-8

import jieba
import numpy as np
import PIL.Image as Image
from wordcloud import WordCloud

class wordCloud:
    '''
     This is a main Class, the file contains all documents.
     One document contains paragraphs that have several sentences
     It loads the original file and converts the original file to new content
     Then the new content will be saved by this class
    '''
    def __init__(self):
        self.bg_img = 'assets/picture.jpeg'
        self.word_path = 'assets/word.txt'

    def hello(self):
        '''
        This is a welcome speech
        :return: self
        '''
        print('*' * 50)
        print(' ' * 20 + '词云制作')
        print(' ' * 5 + 'Author: autofelix  Date: 2022-01-15 13:14')
        print('*' * 50)
        return self

    def run(self):
        '''
        The program entry
        '''
        with open(self.word_path, 'r') as f:
            word = f.read()

        cut_word = ' '.join(jieba.cut(word))
        color_mask = np.array(Image.open(self.bg_img))

        word_cloud = WordCloud(
            # 设置字体,不指定就会出现乱码
            font_path='/System/Library/Fonts/PingFang.ttc',
            # 设置背景色
            background_color='white',
            # 词云形状
            mask=color_mask,
            # 允许最大词汇
            max_words=120,
            # 最大号字体
            max_font_size=2000
        ).generate(cut_word)

        word_cloud.to_file('word_cloud.jpg')
        im = word_cloud.to_image()
        im.show()


if __name__ == '__main__':
    wordCloud().hello().run()

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,大概有三种登录方式:
9126 0
使用SSH远程登录阿里云ECS服务器
远程连接服务器以及配置环境
12552 0
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
19772 0
腾讯云服务器 设置ngxin + fastdfs +tomcat 开机自启动
在tomcat中新建一个可以启动的 .sh 脚本文件 /usr/local/tomcat7/bin/ export JAVA_HOME=/usr/local/java/jdk7 export PATH=$JAVA_HOME/bin/:$PATH export CLASSPATH=.
13464 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的,?mysql的 3306,?mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建. ? have?fun! ?将编程看作是一门艺术,而不单单是个技术。
18026 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,云吞铺子总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系统盘、创建快照、配置安全组等操作如何登录ECS云服务器控制台? 1、先登录到阿里云ECS服务器控制台 2、点击顶部的“控制台” 3、通过左侧栏,切换到“云服务器ECS”即可,如下图所示 通过ECS控制台的远程连接来登录到云服务器 阿里云ECS云服务器自带远程连接功能,使用该功能可以登录到云服务器,简单且方便,如下图:点击“远程连接”,第一次连接会自动生成6位数字密码,输入密码即可登录到云服务器上。
32803 0
使用NAT网关轻松为单台云服务器设置多个公网IP
在应用中,有时会遇到用户询问如何使单台云服务器具备多个公网IP的问题。 具体如何操作呢,有了NAT网关这个也不是难题。
34605 0
阿里云服务器安全组设置内网互通的方法
虽然0.0.0.0/0使用非常方便,但是发现很多同学使用它来做内网互通,这是有安全风险的,实例有可能会在经典网络被内网IP访问到。下面介绍一下四种安全的内网互联设置方法。 购买前请先:领取阿里云幸运券,有很多优惠,可到下文中领取。
18661 0
+关注
autofelix
关注我,一起零基础学编程~
62
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
OceanBase 入门到实战教程
立即下载
阿里云图数据库GDB,加速开启“图智”未来.ppt
立即下载
实时数仓Hologres技术实战一本通2.0版(下)
立即下载
http://www.vxiaotou.com