【首页】 【期刊简介】 【编委会】 【投稿指南】 【过刊浏览】 【期刊订阅】 【联系我们】

今天是:
刘爱琴,马小宁.基于概率主题模型的短文本自动分类系统构建[J].国家图书馆学刊,2020,(6):
基于概率主题模型的短文本自动分类系统构建
  
中文关键词:  文本分类 主题发现 LDA模型
英文关键词:
基金项目:
作者单位
刘爱琴 山西大学 
马小宁 南京邮电大学现代邮政学院物流工程与管理专业2020级硕士研究生 
摘要点击次数: 26
全文下载次数: 9
中文摘要:
      互联网平台的蓬勃发展产生了以新兴媒体为承载的数字资源,如何从中有效实现知识检索、知识发现成为信息管理领域和互联网技术领域的一个重要课题。本文以《中国分类主题词表》为主题词受控表,首先从词的粒度层面对语料数据进行短文本信息挖掘,其次基于隐含狄利克雷分布(LDA)模型切分文本内容,最后依据词频统计实现主题词的提取、聚类,并通过共现矩阵构建短文本自动分类系统。该系统一方面有效地实现了知识的快速聚类和关联自动分类,另一方面为用户提供了满意度更高的知识发现服务及相关扩展服务。图8。表5。参考文献16。
英文摘要:
      
查看全文   下载PDF阅读器
关闭

版权所有:国家图书馆学刊 【您是本站第 1326538 位访问者】

主管:中华人民共和国文化和旅游部  主办:中国国家图书馆  出版:《国家图书馆学刊》编辑部
地址:北京市中关村南大街33号 邮编:100081 电话:010-88545737
本系统由北京勤云科技发展有限公司设计