题名基于数据与知识双驱动的智能医疗问答系统研究
作者李文博
答辩日期2021-05-30
文献子类硕士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师李学恩
关键词高血压 问答系统 知识图谱 深度学习 命名实体识别
学位专业计算机技术
英文摘要

高血压是最常见的一种慢性病,《中国心血管健康与疾病报告》显示2019年我国高血压患者的人数已高达2.45亿,并且患病率总体仍呈增高的趋势。高血压还是心脑血管疾病最重要的危险因素,救治不及时甚至会引发猝死。但是,普通患者往往对于高血压缺乏充分的认识,缺乏途径获取相关有效信息,对于一些偏远地区等一些医疗条件受限地区更是如此。基于以上问题,本文以高血压知识图谱为知识源,并结合患者电子病历数据、物联网实时健康生理指标数据,研发了一种基于数据与知识双驱动的高血压医疗问答系统。本文的主要工作和创新点归纳如下:

1. 提出了一种基于深度学习和词典的实体识别方法

实体识别是构建知识图谱和理解用户问句重要的一步,针对高血压实体识别数据集较小的问题,以及对数据源特点、应用目的的分析,本文提出一种启发式算法,该方法融合BERT-BiLSTM-CRF深度学习模型和基于高血压领域词典的双向匹配算法,准确率和查全率分别达到94.692.8,通过对比实验和消融实验验证了所提方法的有效性。

2. 设计并构建了一个高血压知识图谱

对于高血压知识图谱相关研究十分缺乏的问题,本文基于领域知识图谱构建框架,并结合高血压领域知识特点构建了高血压知识图谱构建框架。本文参照斯坦福大学的特定领域本体构建七步法,在医疗专家指导下构建了高血压模式层,然后将高血压数据源分为结构化数据和非结构化数据完成高血压知识图谱的生成,最后基于Neo4j图数据库实现高血压知识图谱的存储、管理及可视化。

3. 搭建了一个基于数据与知识双驱动的高血压医疗问答系统

本文结合患者电子病历数据、物联网可穿戴设备产生的实时健康生理指标数据以及历史数据,并通过实体识别、实体消融和意图识别实现对患者问句的深层次、全面语义理解,在构建完成的高血压知识图谱查询得到所需答案,实现满足用户需求的高血压智能问答系统。

语种中文
页码75
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/44974]  
专题自动化研究所_数字内容技术与服务研究中心
推荐引用方式
GB/T 7714
李文博. 基于数据与知识双驱动的智能医疗问答系统研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace