基于科研人员本体的知识产出自动获取方法与技术研究结题报告 | |
卢利农 | |
2013-12 | |
学科主题 | 信息组织与服务 ; 信息技术 |
关键词 | 自动获取 人名消歧 科研人员本体 语义网 |
中文摘要 | 本项目通过构建科研人员本体,对机器采集获取到的知识产出与其作者主体之间建立可靠的对应关系,增强学术产出自动获取过程中的机器理解能力,降低人名二义性,实现名称消歧,可靠聚集作者的学术产出。 首先对科研领域的各种人物实体进行抽象分析,选取与人物属性相关的重要概念,设计形成了科研人员本体的概念集和属性集。通过对科研人员、知识产出、所属机构三者实体关系进行语义层次上的描述和关联表示,结合对vivo、foaf、prism等本体的学习复用,最终研究构建了科研人员本体。 项目通过WOS等知识资源库中的Web Service接口实现批量采集元数据,设计创造了“首条存储语义实例——循环语义匹配——差异实例化——相似度赋值”技术路径,对采集到的所有元数据进行了作者语义匹配和相似度赋值,并结合Jena等技术实现作者批量实例化。 最后,对整体方案进行了检验。实验结果表明,本项目的方法较好的实现了对同名作者的唯一辨识,相比传统的人工匹配,大大减轻了系统管理人员的负担,且具有较高的准确率与召回率。对同名作者的匹配,既支持将匹配度较高的作者自动合并,同时对匹配度较低作者间相似值进行保存,为管理人员人工识别提供接口。 |
产权排序 | 1 |
内容类型 | 研究报告 |
源URL | [http://ir.las.ac.cn/handle/12502/6539] |
专题 | 文献情报中心_中国科学院兰州文献情报中心_信息系统部 |
推荐引用方式 GB/T 7714 | 卢利农. 基于科研人员本体的知识产出自动获取方法与技术研究结题报告. 2013. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论