本发明专利技术公开了一种基于糖尿病知识图谱的问答系统构建方法,方法包括:基于目标数据,预设数据格式,以及实体类别、关系类型和属性类型;根据数据格式,基于实体类别对目标数据进行实体识别;根据实体识别的结果,基于关系类型和属性类型进行知识抽取,得到目标三元组;将目标三元组存储到目标图数据库,完成目标知识图谱的构建;对输入问题进行预处理,确定目标实体和目标关系类型;根据目标实体和目标关系,对目标图数据库进行查询处理,得到目标推荐结果的答案。本发明专利技术能够有效提高目标数据中分布的实体识别的准确性,能够提高问答系统中答案的准确性,可广泛应用于知识图谱技术领域。域。域。
全部详细技术资料下载
【技术实现步骤摘要】
一种基于糖尿病知识图谱的问答系统构建方法
本专利技术涉及知识图谱
,尤其是一种基于糖尿病知识图谱的问答系统构建方法。
技术介绍

目前对于糖尿病领域知识图谱的构建研究较少,构建图谱的数据大部分来源于网络爬虫或相关领域书籍,对处理上述非结构化数据的方法较多,而非结构化数据处理的研究还存在跨句子分布的关系抽取、长度较长的实体提取的困难。往往构建的知识图谱不能准确反应出各类实体及其关系。
此外,对于问题的查找咨询,人们通常依靠各种搜索引擎,然而现有的搜索引擎反馈的内容通常是一些包括相关内容的网页甚至广告,尤其对于专业领域的相关内容,并不能准确反馈搜索对应的要点,而问答系统作为一种新型信息检索技术,能够直接返回给用户精确的答案,从而省去了用户从大量相关网页中寻找所需信息的时间。
因此,如何构建实体及关系准确表示的知识图谱进而搭建检索精确的问题系统是一个亟待解决的问题。
技术实现思路
有鉴于此,本专利技术实施例提供了一种高效的,一种基于糖尿病知识图谱的问答系统
【技术保护点】
【技术特征摘要】

1.一种基于糖尿病知识图谱的问答系统构建方法,其特征在于,包括:基于目标数据,预设数据格式,以及实体类别、关系类型和属性类型;根据所述数据格式,基于所述实体类别对所述目标数据进行实体识别;根据所述实体识别的结果,基于所述关系类型和所述属性类型进行知识抽取,得到目标三元组;将所述目标三元组存储到目标图数据库,完成目标知识图谱的构建;对输入问题进行预处理,确定目标实体和目标关系类型;根据所述目标实体和所述目标关系类型,对所述目标图数据库进行查询处理,得到目标推荐结果的答案。2.根据权利要求1所述的一种基于糖尿病知识图谱的问答系统构建方法,其特征在于,还包括:基于所述实体识别,根据实体名称进行去重处理。3.根据权利要求1所述的一种基于糖尿病知识图谱的问答系统构建方法,其特征在于,所述基于目标数据,预设数据格式,以及实体类别、关系类型和属性类型,包括:基于糖尿病知识图谱中文数据集DiaKG,预设数组结构的数据格式,以及18类实体类别、16种关系类型和属性类型。4.根据权利要求1所述的一种基于糖尿病知识图谱的问答系统构建方法,其特征在于,所述根据所述数据格式,基于所述实体类别对所述目标数据进行实体识别,包括:根据所述数据格式,通过三位标注法对所述目标数据进行跨句标注;基于所述跨句标注,通过BI
LSTM
CRF模型进行实体识别。5.根据权利要求1所述的一种基于糖尿病知识图谱的问答系统构建方法,其特征在于,所述根据所述实体识别的结果,基于所述关系类型和所述属性类型进行知识抽取,得到目标三元组,包括:根据所述实体识别的结果,基于所述关系类型,通过BERT模型进行面向结构化文本的关系抽取,得到关系三元组;和,基于...
【专利技术属性】
技术研发人员:郝天永,兰牧融,周盈盈,

申请(专利权)人:华南师范大学,
类型:发明
国别省市:
全部详细技术资料下载 我是这个专利的主人







