CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名联机手写文档中的笔画分析
作者刘靖宇
答辩日期2023-05-27
文献子类硕士
关键词联机手写文档,笔画分类,相对位置编码,多重笔画状态,Transformer
英文摘要

联机手写文档(文档,流程图,草图等)作为当今一种重要的数字媒体,被广泛运用于人机手写交互、电子平板教学以及智能化办公等领域。联机手写文档由具有书写顺序的笔画构成,对联机手写文档的笔画进行分析,即将笔画划分为不同的语义类别,是联机手写文档分析的基础。联机手写文档笔画分析是一个困难的结构模式识别问题,对笔画间上下文关系的建模是联机手写文档笔画分析的关键,然而先前的方法对上下文信息利用不足,因此笔画分类效果不佳。本文研究并设计了一系列针对联机手写文档高效且实用的笔画结构化分析方法,大幅提高对结构信息的刻画水平,为联机手写文档的分析提供坚实的基础。本文主要研究内容和研究成果如下:

一、提出一种基于Transformer架构的联机手写笔画分类方法(T-OHS)。该方法使用高效的Tranformer架构作为笔画消息传递的基础,同时使用了相对时间位置编码以及相对空间位置编码来建模笔画上下文时空信息。在相对时间位置编码设计中,对每一个相对时间位置赋予可学习的编码,同时使用截断函数减小参数数量。在相对空间编码的设计中,提出了以极坐标为基础的二维空间空间离散化方法,在此基础上设计了由粗到细两个粒度的空间位置编码,从两个角度层次化地探索了笔画间的空间关系。本方法在不同领域(文档,流程图和草图)的多个公开数据集上进行笔画分类实验,均取得了最佳的性能,充分验证了该方法在联机手写文档笔画分析上的有效性和通用性。

二、提出一种基于多重笔画状态的联机手写流式笔画分类方法(MSST)。该方法基于Transformer架构并且采用使用T-OHS的相对编码,通过对笔画设置多重状态,使得该方法能对联机手写文档进行动态实时笔画分类,同时对已预测过笔画具有可修改预测标签的能力;通过设置笔画状态的持续时间,大幅降低计算资源消耗,并且通过对更新算法进行设计,使得模型具有静态训练的能力。该方法在不同领域(文档,流程图和草图)的多个公开数据上进行动态笔画分类实验,在实时分类精度以及延迟修改精度上达到了最优,验证了该方法的有效性。

语种中文
页码80
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/52009]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
刘靖宇. 联机手写文档中的笔画分析[D]. 2023.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace