【首页】 【期刊简介】 【编委会】 【投稿指南】 【过刊浏览】 【期刊订阅】 【联系我们】

今天是:
王瑞云,贾君枝.基于外部ID的中文实体对齐分析——以中国科学院院士Wikidata数据子集为例[J].国家图书馆学刊,2020,29(2):
基于外部ID的中文实体对齐分析——以中国科学院院士Wikidata数据子集为例
  
中文关键词:  外部ID Wikidata VIAF 命名实体对齐
英文关键词:
基金项目:本文系国家社会科学基金项目“中文学术领域命名实体的知识图谱构建研究”(项目编号:18BTQ072)的研究成果之一。
作者单位
王瑞云 山西大学经济与管理学院 
贾君枝 中国人民大学信息资源管理学院 
摘要点击次数: 151
全文下载次数: 298
中文摘要:
      本文尝试解决中文学者命名实体与外部知识库的实体对齐短缺的问题。通过SPARQL语义查询抽取维基数据子图——中国科学院院士的知识图谱子图,初步构建国内知识库的中文院士实体与Wikidata实体的对齐以及与外部ID对应的知识库的实体对齐。对院士实体的三个数量型特征对齐的外部ID个数(ids)、不同语种的Wikipedia站点个数(sites)、实体的全部陈述个数(states)与目标分类(有无VIAF实体对齐)的相关分析发现,目标分类与ids特征正向相关最强,直接VIAF实体对齐只存在ids高区的院士,占比偏低。因此,提出利用 LC、ISNI等外部ID,应用VIAF对重要来源库的重定向功能,构建间接的VIAF实体对齐的方法。本文为中文知识库进行外部实体对齐提供了可行的初步方案,提出的实验方法显著地提高了较小ids值(1-7)的院士拥有VIAF实体对齐的个数,最终通过实体对齐的VIAF信息集成增加了院士实体的ids数量,丰富了中文学者与外部知识库的实体对齐信息。图4。表5。参考文献19。
英文摘要:
      
查看全文   下载PDF阅读器
关闭

版权所有:国家图书馆学刊 【您是本站第 1962014 位访问者】

主管:中华人民共和国文化和旅游部  主办:中国国家图书馆  出版:《国家图书馆学刊》编辑部
地址:北京市中关村南大街33号 邮编:100081 电话:010-88545737
本系统由北京勤云科技发展有限公司设计