基于层次化异质图神经网络的企业信用评级技术研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 毕业生 > 硕士学位论文

题名	基于层次化异质图神经网络的企业信用评级技术研究
作者	冯博靖
答辩日期	2022-05-21
文献子类	硕士
授予单位	中国科学院自动化研究所
授予地点	中国科学院自动化研究所
导师	薛文芳
关键词	图神经网络异质图网络企业信用评级
学位专业	计算机技术
英文摘要	目前我国独立信用评级机构的评级方法仍以打分卡为主，难以处理中小企业信用评级中存在的“小样本、多属性、不完备、不均衡”问题，严重制约了国内机构评级结果的准确度、公信力和话语权。随着“一带一路”倡议的快速推进，中国企业跨境投资的体量越来越大，风险越来越高，尽早解决智能评级模型设计的卡脖子技术非常必要，非常迫切，非常有意义。本论文首先从传统的统计学习模型，基于经典机器学习的评级模型和最新基于神经网络的评级模型三个层面，深入调研了当前主流的信用评级模型方法。针对企业信用评级研究过程中遇到的建模层级不完整、图关系数据利用单一以及海量无标签数据无法利用等问题，提出了新颖的层次化异质图网络模型。重点设计了模型的数据处理模块、特征图网络模块、企业异质图网络模块和下游任务模块。特征图网络模块和企业异质图网络模块分别从特征和企业角度建模获取特征间和企业间的交互信息，缓解了建模层级不完整的问题，体现了新模型的层次性特点；企业异质图网络模块利用注意力机制综合使用多种异质关系缓解了图数据利用单一的问题，体现了新模型的异质性；为了利用海量的无标签数据，数据处理模块先给无标签数据打上伪标签，下游任务模块中使用伪标签分类器来学习，并设计对抗判别器来减少有标签数据和伪标签数据之间的鸿沟，最大限度利用了所收集到的数据，体现了新模型的对抗性。在模型理论研究基础上，我们从中国经济金融数据库等多个渠道收集企业 39 个特征指标，包括盈利能力、运营能力、成长能力、偿债能力、现金流能力和杜邦指数六大方面；从著名评级公司搜集中国上市公司评级结果，自建了中国上市公司企业信用评级数据集。接下来，我们选择模型大小、准确率、召回率和 F1-Score 四个评价指标，对比分析了基准评级模型：逻辑回归、支持向量机、多层感知机、利用残差网络增强的树模型、卷积神经网络、图神经网络、对抗半监督模型和我们重点设计的层次化异质图网络模型在中国上市公司企业信用评级数据集上的实验性能。实验分析结果发现：我们提出的层次化异质图网络新模型在召回率，准确率以及 F1-Score 上都超越了前 7 个基准模型，充分体现了新模型强大的特征提取和表达能力。另一个特色工作，我们分别从伪标签评级模型，无标签数据量，特征图和企业图网络四个方面进行定量分析实验，探究每个模块所带来的增益影响，增加了层次化异质图网络新模型的可解释性。
语种	中文
页码	114
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/48459]
专题	毕业生_硕士学位论文
推荐引用方式 GB/T 7714	冯博靖. 基于层次化异质图神经网络的企业信用评级技术研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们