CORC  > 上海财经大学  > 上海财经大学
条件随机场与领域本体元素集相结合的未登录词识别研究
段宇锋; 朱雯晶; 陈巧; 刘伟; 刘凤红
刊名现代图书情报技术
2015-04-25
期号2015年04期页码:41-49
关键词条件随机场 领域本体 未登录词识别
ISSN号1003-3513
英文摘要【目的】建立未登录词识别模型,提升发现自然科学领域文本中未登录词的能力,同时降低人工干预成本。【方法】在假设的基础上,构建条件随机场(CRFs)与领域本体元素集相结合的未登录词识别模型。以生物多样性文本为样本,通过比较不同模型性能的差异,检验假设,验证模型的合理性。【结果】实验结果表明,CRFs模型选择单纯的字、字词混合序列、字词混合序列及默认词性、字词混合序列及含自定义语义功能标记的词性为特征时,未登录词识别能力依次提升。该结果证明研究假设为真,本文建立的模型科学、合理。【局限】模型标注未登录词的准确性有待提升。【结论】该模型具有更强的未登录词识别能力,同时可以极大地降低人工建立训练集的成本。
URL标识查看原文
语种中文
内容类型期刊论文
源URL[http://10.2.47.112/handle/2XS4QKH4/14876]  
专题上海财经大学
作者单位1.华东师范大学商学院
2.上海图书馆
3.上海财经大学公共经济与管理学院
4.中国科学院植物研究所
推荐引用方式
GB/T 7714
段宇锋,朱雯晶,陈巧,等. 条件随机场与领域本体元素集相结合的未登录词识别研究[J]. 现代图书情报技术,2015(2015年04期):41-49.
APA 段宇锋,朱雯晶,陈巧,刘伟,&刘凤红.(2015).条件随机场与领域本体元素集相结合的未登录词识别研究.现代图书情报技术(2015年04期),41-49.
MLA 段宇锋,et al."条件随机场与领域本体元素集相结合的未登录词识别研究".现代图书情报技术 .2015年04期(2015):41-49.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace