题名 | 图卷积网络算法与应用研究 |
作者 | 于劭炜 |
答辩日期 | 2020-05 |
文献子类 | 硕士 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 自动化大厦 |
导师 | 张文生 |
关键词 | 图卷积网络 先验知识 半监督节点分类 关键词抽取 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 由于图可以建模系统中的个体以及彼此之间的关系,具有强大的表示能力,对于图的分析和应用一直以来都是数据挖掘、模式识别领域的热点,吸引着越来越多的学者通过机器学习方法进行研究。然而,目前的图算法对于图中蕴含的高阶结构信息的利用并不充分,这也是提出图卷积网络模型的动机。 本论文从图卷积网络的原理和特性出发,提出了将先验知识融入图卷积网络的改进方法,并将图卷积网络应用于异构的句法图中以提升关键词抽取的性能。论文的创新点和主要贡献归纳如下:
图卷积网络在半监督节点分类问题上表现除了非常好的性能。然而,类似多数卷积神经网络,训练一个比较好的图卷积网络需要进行在验证集上进行大量实验调整模型参数,充分地挖掘和利用图的结构特征仍然是一项挑战。为了增强图神经网络的泛化性能,我们提出了先验知识增强的图卷积网络,包含了更多图的本质特征和内在结构,提高了半监督节点分类的准确率。在半监督节点分类问题的标准数据集上的实验结果表明,无需修改原始模型的基本网络结构,先验知识增强的图卷积网络可以在原始模型的基础上进一步提升分类准确率,并且不增加时间复杂度。
关键词抽取任务的目的是从文本中抽取一个短语集合从而更好地概括文本内容。在实际应用中由于大量的文本属于无标注数据,无监督算法更为常用。传统无监督算法按照词的统计特征对词进行重要度排序,但是没有考虑到在抽取过程中词的多样性问题。基于表示学习的方法依赖于通过预训练得到的词向量词典,对于不属于词典中的新词无法得到很好的表示,导致准确率不高。基于以上缺点,我们提出基于图卷积网络的关键词抽取算法。本算法结合了基于图的算法和基于表示学习的方法,将句法分析的先验知识通过图卷积网络模型融合到词预训练的过程中,进行特定任务的词向量学习,从而得到更好的袋外词表示和文本表示。同时利用贪心选择机制,在保证关键词与文本的相关性的同时,提高关键词的多样性,从而提升抽取的准确率。实验证明了本算法优于其他对比的无监督关键词提取算法以及关键模块的有效性。 |
语种 | 中文 |
页码 | 59 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/39723] |
专题 | 精密感知与控制研究中心_人工智能与机器学习 |
推荐引用方式 GB/T 7714 | 于劭炜. 图卷积网络算法与应用研究[D]. 自动化大厦. 中国科学院自动化研究所. 2020. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论