【KG+RAG 论文】医学知识图谱检索增强 LLM 的框架 —— KG-RAG

论文:Biomedical knowledge graph-enhanced prompt generation for large language models
⭐⭐⭐
Code:github.com/BaranziniLab/KG_RAG

文章目录

    • 论文速读
    • 模型效果
    • 总结

论文速读

这篇论文提出了 KG-RAG 的框架,使用医学知识图谱(SPOKE)来对 LLM 进行检索增强。

该框架的运行效果如下图:

运行示例
上图中,黄色部分是用户问题,蓝色部分是 GPT-4 的原生回答,绿色部分是经过 KG-RAG 框架处理后生成的回答。左边的 (A) 是一个关于一跳推理的问题,右边的 (B) 是一个关于两条推理的问题。

可以观察到,KG-RAG 可以解决这个单跳和双跳的问题,并且相比于 GPT-4,可以提供更加简单明了的答案。

工作过程:KG-RAG 框架的基本工作原理如下:

KG-RAG 基本流程

  1. 实体识别与实体链接:根据用户的问题,使用 LLM 做问句中的疾病实体识别,再对识别的结果对 KG 进行实体链接的检索,得到 KG 中相应的节点(即疾病的节点)
  2. 上下文提取(Context pruning):从 KG 中召回与这个实体相关联子图,再基于 embedding 计算语义相似度从子图中过滤出有用的三元组,之后再将这些三元组将其转换为自然语言
  3. 提示组装与文本生成:把上一步得到的自然语言,与 question 拼在一起,组合为 prompt,再加上 SYSTEM_PROMPT,送给 LLM 来回答,从而获得最终答案

模型效果

效果对比

可以看到,在 KG-RAG 框架下,各 LLM 的表现都有提升。

总结

这篇文章提出的框架是一个结合 KG 来做 RAG 的有效方案,但当用于工业落地时,仍会存在很多问题:

  • 实体识别使用了 LLM,之后又做了 entity link,这样的效率肯定不太高。
  • 为了从召回子图过滤出有用的三元组,这里需要专门的 embedding 模型去做
  • 从关联子图 -> 自然语言这一步,也存在很多坑

这篇文章的工作主要是在医学领域结合 KG 来实现 RAG,但在其他领域,需要结合实际的场景去定制具体的策略。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/580832.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

黑马面试篇

课程地址:新版Java面试专题视频教程,java八股文面试全套真题深度详解(含大厂高频面试真题)_哔哩哔哩_bilibili 课程名称:新版Java面试专题视频教程,java八股文面试全套真题深度详解(含大厂高频…

【Protobuf】protobuf详细介绍

protobuf详细介绍 一、前言二、Protobuf简介2.1、核心思想2.2、Protobuf是如何工作的?2.3、如何使用 Protoc 生成代码?2.4 入门命令 一、前言 在以往的项目中进行网络通信和数据交换的应用场景中,最经常使用的技术便是json或xml。随着JSON的…

用户中心 -- 插件使用 插件使用思路

易错注意点 1 5.1启动类 & 入口类 需保持一致 网址: 第一节课,用户管理--后端初始化,项目调通。二次翻工2-CSDN博客 一、 用户管理 框架 网址: 用户管理 --汇总 -- 明细-CSDN博客 1.2 更改路径,并生效 网址…

盘点那些你不知道的“痛”,柯桥俄语培训

首先我们来看一下болеть的五大含义: ①(чем 及无补语) 生病,患病 例: болеть тифом 害伤寒病 болеть воспалением лёгких 得肺炎 ②[只用第3人称] болит,болят 疼痛 例&am…

CDGA|数据治理新视角:清洗数据,让数据质量飞跃提升

在数据治理的新视角下,数据清洗不再是一个孤立的环节,而是与数据收集、存储、分析和应用紧密相连。它涉及到数据的全生命周期,从源头开始就对数据进行严格的把控。在数据收集阶段,通过设定合理的数据规范和校验机制,确…

DFS时间戳

时间戳 这就是树上查询问题 , 是求两个点有什么关系 让我们来看一下样例解释:注意字母旁边的数字就是时间戳, a在先序遍历(遍历顺序 : 左,右,根)是第一个进, 第十六个出…

#ESP32S3R8N8建立工程(VSCODE)点亮LED

1.参考文档 【立创ESP32S3R8N8】IDF入门手册 - 飞书云文档 (feishu.cn)https://lceda001.feishu.cn/wiki/GOIlwwfbIi1SC3k8594cDeFVn8g 2.建立工程 3.运行效果 4.更改配置 5.插播 之前配置的环境是有问题的,就算有自动检测也要仔细检查,必须严格按照以…

Linux内核广泛采用的侵入式数据结构设计

Linux内核广泛采用的侵入式数据结构设计恐怕很难应用到一般程序开发中。基本上是个高维十字链表,一个节点(struct)可以同时位于多个hash/list/tree中。我分享下我的经历,我刚入行时遇到一个好公司和师父,给了我机会,一年时间从3k薪…

一键设置jdk环境脚本

自动化脚本 一、使用方法 创建一个txt文本,放在和jdk存放的同一目录下,复制粘贴进我的代码,利用全局替换,将jdk1.8,改成你自己的jdk包名字,再重新把这个文件保存为.vbs文件。然后运行就行了 MsgBox "Runing s…

邮件SMTP服务的性能怎么做优化?如何配置?

邮件SMTP服务的工作原理?邮件服务器发信的优势特点? 邮件SMTP服务作为信息传递的核心组件,其性能优化显得尤为关键。一个高效稳定的SMTP服务不仅能提升工作效率,还能保障信息安全。那么,邮件SMTP服务的性能怎么做优化…

Web漏扫工具OWASP ZAP安装与使用(非常详细)从零基础入门到精通,看完这一篇就够了。

本文仅用于安全学习使用!切勿非法用途。 一、OWASP ZAP简介 开放式Web应用程序安全项目(OWASP,Open Web Application Security Project)是一个组织,它提供有关计算机和互联网应用程序的公正、实际、有成本效益的信息。…

MySQL数据库基础(数据库的基本操作、常用的数据类型、表的相关操作)

前言 今天我们将介绍数据库的基本操作、常用的数据类型、表的相关操作 一、数据库的基本操作 1.1 显示当前的数据库 操作代码 show databases;1.2 创建数据库 基本语法: 1. //创建数据库 create database examble;2. create database if not exists exist exa…

必应bing广告推广开户时间需要多久?

企业选择合适的平台进行广告投放成为了企业获取竞争优势的关键一步,必应Bing作为全球第二大搜索引擎,凭借其庞大的用户基础和精准的广告定位能力,成为了众多企业海外及国内市场推广的优选渠道。云衔科技以专业、高效的服务,成为企…

JMeter的下载安装与使用(Mac)

1、下载地址​​​​​​https://jmeter.apache.org/download_jmeter.cgi 2、下载Binaries 下的apache-jmeter5.5.tgz 3、解压 4、启动 在bin目录下打开终端,输入sh jmeter 出现jmeter首页界面,即为成功。 5、使用 5.1 语言选择 option选项卡&am…

新装电脑Flutter环境部署坑汇总(持续更新)

1.本地安装,安装fvm的坑 本人电脑使用windows ,安装fvm则一般使用choco安装,那么首先需要安装choco,打开powershell/或者cmd运行以下命令: Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager…

Mycat(二)读写分离(Mysql读写分离->MyCat读写分离)、安装JDK

文章目录 概述搭建 MySQL 数据库主从复制MySQL 主从复制原理主机配置(atguigu01)从机配置(atguigu02)主机、从机重启 MySQL 服务主机从机都关闭防火墙在主机上建立帐户并授权 slave在从机上配置需要复制的主机主机新建库、新建表、insert 记录,从机复制停止从服务复…

Linux基本指令(2)

目录 mv指令: cat: more指令: less指令: head指令: tail指令: mv指令: 说明: mv命令是move的缩写,可以用来移动文件或者文件改名(move(rename)files),是linux系统下…

LMDeploy 量化部署 LLM-VLM 实践 学习笔记

视频链接 https://www.bilibili.com/video/BV1tr421x75B/?vd_sourcea1ce254b4a97f9f687a83e661793cb2c 什么是模型部署 部署指的是已经开发好的大模型投入使用,要把模型部署到服务器或者移动端里,如何在有限的资源里加载大模型? 比如你好不…

2024年信息教育化与语言艺术国际学术会议(IACIELA 2024)

2024年信息教育化与语言艺术国际学术会议(IACIELA 2024) 2024 International Conference on Information Education and Language Art 一、【会议简介】 2024年信息教育化与语言艺术国际学术会议,将探讨教育与语言艺术的结合。 在当今的信息时代,语言艺术…

ElasticSearch批处理

在刚才的新增当中,我们是一次新增一条数据。那么如果你将来的数据库里有数千上万的数据,你一次新增一个,那得多麻烦。所以我们还要学习一下批量导入功能。 也就是说批量的把数据库的数据写入索引库。那这里的需求是,首先利用mybat…
最新文章