当前位置:网站首页>【科学文献计量】关键词的挖掘与可视化
【科学文献计量】关键词的挖掘与可视化
2022-07-20 04:46:00 【百木从森】
1 外文文献关键词词频统计与可视化
在前一章节介绍知识单元完整频次统计中已经对关键词ID和DE字段进行词频统计。在回顾知识点的基础上,进一步进行可视化操作。可以新建一个ipynb文件,在导入功能库和文件后,为了查阅方便,只显示前两条记录。
直接把前面封装好的multi_element_count()函数复制粘贴过来,进行多元素字段的词频统计。
可将上述的频数统计结果,借用词云图可视化结果输出。首先需要将多元素字段频数统计的结果进行处理,形成绘制词云图的DataFrame数据格式,即第一列为标签字段中多元素的分类名称,第二列就为各类名称出现的频数统计。然后在将两列的数据合并,组成分类名称和频数一一对应的列表,即words变量(词云图的核心就是在于words变量的构造),如果有需求可以对图形的标题进行注解,比如这里将NAME赋值为ID,就是表明当前展示的词云图结果来自于ID字段。
ID字段的多元素词频统计结果词云可视化输出如下。元素的频数统计值越大,在词云图中的文字越大。通过滑动鼠标,放置在元素上,会自动显示对应的频数。
边栏推荐
- 力扣(LeetCode)200. 岛屿数量(2022.07.19)
- Lombok详细介绍
- [Android开发学iOS系列] 语言篇: Swift vs Kotlin
- EF Core学习笔记:额外的外键属性 / 单项导航属性
- Dictionary preface - company naming
- Love to learn blog - life is short, only good classes!
- 老域名建站有什么优势?
- 无密码身份验证如何保障用户隐私安全?
- Swift used smamb2 package, and the sad process of repacking
- Alibaba cloud international account registration FAQ summary
猜你喜欢
How should enterprise users choose aiops or APM?
使用renren-generator逆向生成CRUD代码
Swagger重点配置项
swift 使用SMAMB2包,重新打包的心酸历程
[disadvantages of select and poll, and advantages of epoll]
How to delete headers, footers and horizontal lines in word documents
Jenkins Automated Deployment
An interesting example to illustrate the difference of emplace_ back() and push_ back()
How to choose data application development language and environment
With high concurrency, ratelimiter and semaphore are used to limit the flow of access resources
随机推荐
Silicon Valley classroom notes (Part 1)
Difi: a go as you pay Wi Fi access system intensive reading notes (III)
excel怎么选取特定数字求和?excel选中特定数字求和的方法
An interesting example to illustrate the difference of emplace_ back() and push_ back()
[Muduo socket] InetAddress encapsulates the socket address type
开发中常见环境配置名词-dev、sit、pro、fac等
Technical dry goods | mindspire self-developed high-order optimizer source code analysis and practical application
Operation of STL Vector
How do independent website sellers use Facebook homepage for social media marketing?
PPT柱状图如何增加柱子
Reverse generation of crud code using Renren generator
【MUDUO 日志系统1】Logger输出
DNS域名解析过程剖析
国外域名能注册吗?
【 微信小程序请求封装】【进阶版】处理401请求token过期--重新登录--重新发起刚才过期的请求
Returns the string representation of the last date in a given date month
Qualcomm and MTK customized modification method for national WiFi channel
Difi: a go as you pay Wi Fi access system intensive reading notes (II)
STL list構造函數、大小
Technical dry goods | average surface distance of image segmentation based on mindspire