题名面向人机协作的机器教学方法研究与应用
作者刘智
答辩日期2021-11-19
授予单位中国科学院沈阳自动化研究所
授予地点沈阳
导师郑泽宇
关键词机器教学 机器学习 智能中医 智能辅助诊疗 知识库
学位名称博士
其他题名Human-Machine Cooperation Oriented Research and Application of Machine Teaching
学位专业机械制造及其自动化
英文摘要最近10年,随着并行算力的大力发展和大规模标记数据的获取成为可能,以机器学习为基础的人工智能技术先后在学术界和工业界取得了巨大进步,人工智能技术与各个领域结合产生了许多有价值的实际应用。然而,在这些巨大成就的背后潜藏着以机器学习为基础的人工智能方法逐步显现的发展瓶颈。回顾机器学习的本质,我们可以发现,目前具有实际意义的机器学习模式是以海量标记数据为输入,模型凭借超大规模集群算力从这些海量标记数据中自行学习人类已知或未知的决策边界。这种形式类似人类在教小孩儿学习新事物时,比如学习辨认动物,我们为孩子提供不同种类的动物图片,图片附带动物的种类,在没有任何对孩子进行解释和教授的情况下(唯一的反馈是“对或错”信号),让他/她自行学习分辨动物类别。可想而知这种学习模式是非常低效的,而且学习完成后模型的鲁棒性较差。为了改善现有机器学习遭遇的瓶颈问题,需要一种新的学习模式对其进行补充和完善。机器教学是一个与机器学习相反的研究问题,它旨在已知机器学习模型的情况下,找到能够训练该机器学习模型完成特定任务的最优训练集(教学集)。在本文的研究中,我们深入研究了机器教学研究的问题,并提出了一个一般性的以机器教学为指导的机器学习框架性方案。为了验证以机器教学为指导的机器学习模式的可行性,我们选择了人类专业化知识系统性和完整性较好的医学领域,并选择了以文本形式存在的、知识丰富的中医智能化相关任务作为研究对象;并将该一般性的以机器教学为指导的机器学习框架性方案具象化,为该研究领域设计了一个具体可行的研究框架和思路。为了确保以机器教学为指导的机器学习方法在中医领域的研究顺利开展,我们首先完成了中医相关的基础数据准备工作,这其中包括:构建中医术语库、可以直接用于模型训练的中医临床病例数据集、以文本形式存在的非结构化中医学知识以及结构化中医学规则。在构建基础数据的过程中,为了提高基础库和数据的质量和效率,我们构建了一个融合词语义和字-词语义关系的中医命名实体识别模块,该模块是一个“即插即用”单元,可以与不同的命名实体识别模型结合。实验结果表明,我们设计的中医命名实体识别模块在中医命名实体任务中性能较好。此外,为了训练本文提出的中医命名实体识别模块,我们收集并构建了一个中医命名实体识别数据集,名为PubMed。该数据集包含了中医书籍和中医临床病例两类医学实体内容,填补了中医命名实体识别综合数据集缺乏这一空白。针对中医中药方剂自主生成任务,在机器教学思路的指导下,我们针对不同的中医临床场景设计了两类不同的中药方剂生成模型:AttentiveHerb和TCMBERT。这两个模型以不同数据组成为基础,适应不同的中医临床场景;其中,AttentiveHerb适用于常见病诊疗,TCMBERT则适用于罕见病的中药方剂自主生成。尤其对于罕见病来而言,可用的/可获取的中医临床病例(标记数据)少之又少。相反,治疗罕见病的中医学知识和中医学原则相对而言较为丰富。这种场景下,TCMBERT以中医学知识和中医学原则为教学资源,先进行知识学习;然后,以少量临床病例为实验对象,在特定任务上定向训练。实验证明,AttentiveHerb在常规场景下具有较好的鲁棒性和性能表现。TCMBERT在罕见病场景中优势非常明显,其性能由于常规机器学习模型。针对中医证候诊断任务,在中药方剂的机器教学研究基础上,我们尝试了另一种教学模式。该教学模式以我们自主构建的中医知识库为“教师”角色,以机器学习模型为“学生”角色,在模型训练过程中遭遇收敛瓶颈时,根据样本误差由“教师”为模型提供与样本相关的中医知识,这些知识将在接下来的迭代过程中帮助模型训练。实验证明,在罕见病的中医证候诊断任务中,本文提出的基于机器教学指导的模型性能明显优于传统机器学习模型,甚至优于以TCMBERT为基础构建的证候诊断模型。这表明了,这种以中医知识库为“教师”的机器教学模式的优越性。
语种中文
产权排序1
页码138页
内容类型学位论文
源URL[http://ir.sia.cn/handle/173321/30063]  
专题沈阳自动化研究所_数字工厂研究室
作者单位中国科学院沈阳自动化研究所
推荐引用方式
GB/T 7714
刘智. 面向人机协作的机器教学方法研究与应用[D]. 沈阳. 中国科学院沈阳自动化研究所. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace