跳转到主要内容
🧠

知识图谱

📂 LLM ⏱ 1 min 75 words

知识图谱概述

知识图谱(Knowledge Graph)是以图结构表示实体及其关系的知识库。节点代表实体(人、地、事),边代表实体间的关系。知识图谱提供了结构化的世界知识,与LLM结合可以增强事实性和推理能力。

核心组成

实体

图中的节点,代表具体的概念和对象:

  • 人物、地点、组织
  • 事件、概念
  • 产品、服务

关系

连接实体的边,表示实体间的联系:

  • "张三是李四的同事"
  • "北京是中国的首都"
  • "苹果是一种水果"

属性

实体和关系的附加信息:

  • 实体属性:年龄、类型、描述
  • 关系属性:时间、置信度

构建流程

知识获取

  • 结构化数据:从数据库、表格提取
  • 非结构化数据:从文本中抽取实体和关系
  • 半结构化数据:从网页、知识库提取

知识融合

  • 实体对齐和消歧
  • 关系统一和规范化
  • 冲突检测和解决

知识存储

  • 图数据库:Neo4j、Amazon Neptune
  • 三元组存储:RDF、Triple Store
  • 属性图:Neo4j、TigerGraph

知识图谱 + LLM

增强生成

将知识图谱信息注入LLM生成:

  • 检索相关三元组
  • 构建上下文提示
  • 减少幻觉提升准确性

图谱问答

使用LLM理解自然语言查询并转化为图查询:

  • NL2Cypher/SPARQL
  • 多跳推理
  • 复杂查询理解

图谱构建

利用LLM自动化知识图谱构建:

  • 实体识别和关系抽取
  • 知识验证和补全
  • 模式发现

代表性知识图谱

知识图谱 规模 特点
Wikidata 1亿+实体 开放多语言
Google KG 5000亿+三元组 搜索增强
ConceptNet 通用常识 常识推理
UMLS 医学知识 医疗领域

应用场景

  • 智能问答:精确的事实性问答
  • 推荐系统:基于知识的个性化推荐
  • 风险分析:金融反欺诈、关联分析
  • 药物发现:分子关系和靶点预测

挑战与趋势

知识图谱面临构建成本高、更新困难、质量控制等挑战。LLM的出现为知识图谱的自动化构建和更新提供了新机遇,二者的深度融合是未来发展的重要方向。