CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名基于层次化异质图神经网络的企业信用评级技术研究
作者冯博 靖
答辩日期2022-05-21
文献子类硕士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师薛文芳
关键词图神经网络 异质图网络 企业信用评级
学位专业计算机技术
英文摘要

       目前我国独立信用评级机构的评级方法仍以打分卡为主,难以处理中小企
业信用评级中存在的“小样本、多属性、不完备、不均衡”问题,严重制约了国
内机构评级结果的准确度、公信力和话语权。随着“一带一路”倡议的快速推进,中国企业跨境投资的体量越来越大,风险越来越高,尽早解决智能评级模型设计的卡脖子技术非常必要,非常迫切,非常有意义。
      本论文首先从传统的统计学习模型,基于经典机器学习的评级模型和最新
基于神经网络的评级模型三个层面,深入调研了当前主流的信用评级模型方法。
针对企业信用评级研究过程中遇到的建模层级不完整、图关系数据利用单一以
及海量无标签数据无法利用等问题,提出了新颖的层次化异质图网络模型。重点
设计了模型的数据处理模块、特征图网络模块、企业异质图网络模块和下游任务
模块。特征图网络模块和企业异质图网络模块分别从特征和企业角度建模获取
特征间和企业间的交互信息,缓解了建模层级不完整的问题,体现了新模型的层
次性特点;企业异质图网络模块利用注意力机制综合使用多种异质关系缓解了
图数据利用单一的问题,体现了新模型的异质性;为了利用海量的无标签数据,
数据处理模块先给无标签数据打上伪标签,下游任务模块中使用伪标签分类器
来学习,并设计对抗判别器来减少有标签数据和伪标签数据之间的鸿沟,最大限
度利用了所收集到的数据,体现了新模型的对抗性。
      在模型理论研究基础上,我们从中国经济金融数据库等多个渠道收集企业
39 个特征指标,包括盈利能力、运营能力、成长能力、偿债能力、现金流能力
和杜邦指数六大方面;从著名评级公司搜集中国上市公司评级结果,自建了中国
上市公司企业信用评级数据集。接下来,我们选择模型大小、准确率、召回率和
F1-Score 四个评价指标,对比分析了基准评级模型:逻辑回归、支持向量机、多
层感知机、利用残差网络增强的树模型、卷积神经网络、图神经网络、对抗半监
督模型和我们重点设计的层次化异质图网络模型在中国上市公司企业信用评级
数据集上的实验性能。实验分析结果发现:我们提出的层次化异质图网络新模型
在召回率,准确率以及 F1-Score 上都超越了前 7 个基准模型,充分体现了新模
型强大的特征提取和表达能力。另一个特色工作,我们分别从伪标签评级模型,无标签数据量,特征图和企业图网络四个方面进行定量分析实验,探究每个模块
所带来的增益影响,增加了层次化异质图网络新模型的可解释性。

语种中文
页码114
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/48459]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
冯博 靖. 基于层次化异质图神经网络的企业信用评级技术研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace