条件随机场与领域本体元素集相结合的未登录词识别研究 | |
段宇锋; 朱雯晶; 陈巧; 刘伟; 刘凤红 | |
刊名 | 现代图书情报技术 |
2015-04-25 | |
期号 | 2015年04期页码:41-49 |
关键词 | 条件随机场 领域本体 未登录词识别 |
ISSN号 | 1003-3513 |
英文摘要 | 【目的】建立未登录词识别模型,提升发现自然科学领域文本中未登录词的能力,同时降低人工干预成本。【方法】在假设的基础上,构建条件随机场(CRFs)与领域本体元素集相结合的未登录词识别模型。以生物多样性文本为样本,通过比较不同模型性能的差异,检验假设,验证模型的合理性。【结果】实验结果表明,CRFs模型选择单纯的字、字词混合序列、字词混合序列及默认词性、字词混合序列及含自定义语义功能标记的词性为特征时,未登录词识别能力依次提升。该结果证明研究假设为真,本文建立的模型科学、合理。【局限】模型标注未登录词的准确性有待提升。【结论】该模型具有更强的未登录词识别能力,同时可以极大地降低人工建立训练集的成本。 |
URL标识 | 查看原文 |
语种 | 中文 |
内容类型 | 期刊论文 |
源URL | [http://10.2.47.112/handle/2XS4QKH4/14876] |
专题 | 上海财经大学 |
作者单位 | 1.华东师范大学商学院 2.上海图书馆 3.上海财经大学公共经济与管理学院 4.中国科学院植物研究所 |
推荐引用方式 GB/T 7714 | 段宇锋,朱雯晶,陈巧,等. 条件随机场与领域本体元素集相结合的未登录词识别研究[J]. 现代图书情报技术,2015(2015年04期):41-49. |
APA | 段宇锋,朱雯晶,陈巧,刘伟,&刘凤红.(2015).条件随机场与领域本体元素集相结合的未登录词识别研究.现代图书情报技术(2015年04期),41-49. |
MLA | 段宇锋,et al."条件随机场与领域本体元素集相结合的未登录词识别研究".现代图书情报技术 .2015年04期(2015):41-49. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论