CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名基于深度度量学习的甲骨文字识别
作者张颐康
答辩日期2019-12-09
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师杨青
关键词甲骨文字识别 深度度量学习 跨模态 最近邻识别
学位名称工学硕士
学位专业模式识别与智能系统
英文摘要

        甲骨文可以追溯到中国的商朝,是世界上最古老的象形文字之一。甲骨文字的识别对于考古学、古文字学以及历史年代学有着重要的意义。甲骨文字图像分为临摹甲骨文字图像与拓片甲骨文字图像两类,临摹甲骨文字图像为拓片甲骨文字图像经过专家处理后得到的高清图像,修复了拓片甲骨文字图像的残缺、噪声严重问题。本文针对上述两类甲骨文字图像的识别方法进行了研究,主要工作内容分为两部分:

       提出了一种基于深度度量学习的临摹甲骨文识别算法,有效克服了临摹甲骨文字样本量不足、样本类别不均衡以及样本类内差异过大的问题。首先基于卷积神经网络(Convolutional Nerual Network, CNN)将临摹甲骨文字图像映射到一个特征空间,使得特征间的欧式距离可以衡量对应的临摹甲骨文字图像间的差异。继而在该空间内基于最近邻(Nearest Neighbor,NN)法则进行识别。本文提出的算法在已知类分类任务上验证了优于现有算法,同时在未知类别拒识、开放集识别等多个任务上验证了算法的有效性。最后,本文提出了一种原型裁剪算法,有效地缓解了最近邻分类速度慢的问题。

      建立了拓片甲骨文字识别的一个新框架,通过对临摹甲骨文字图像经过深度度量学习得到的特征的有效利用,明显的提升了模型的识别效果。首先,基于域自适应的方式将拓片甲骨文字图像映射到与临摹甲骨文字图像相同的特征空间并使得两者具有相似的分布;接着,通过度量学习的方式对拓片甲骨文字的特征进行调整——增大与异类临摹甲骨文字特征的距离、减小与同类临摹甲骨文字特征的距离;最后,基于最近邻准则对拓片甲骨文字进行识别。实验结果表明,本文提出的算法在拓片甲骨文识别任务上相对于现有算法有明显的提升,同时也实现了拓片甲骨文字的新类别识别。

语种中文
页码66
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/28355]  
专题毕业生_硕士学位论文
通讯作者张颐康
推荐引用方式
GB/T 7714
张颐康. 基于深度度量学习的甲骨文字识别[D]. 中国科学院自动化研究所. 中国科学院大学. 2019.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace