知识图谱
知识图谱概述
知识图谱(Knowledge Graph)是以图结构表示实体及其关系的知识库。节点代表实体(人、地、事),边代表实体间的关系。知识图谱提供了结构化的世界知识,与LLM结合可以增强事实性和推理能力。
核心组成
实体
图中的节点,代表具体的概念和对象:
- 人物、地点、组织
- 事件、概念
- 产品、服务
关系
连接实体的边,表示实体间的联系:
- "张三是李四的同事"
- "北京是中国的首都"
- "苹果是一种水果"
属性
实体和关系的附加信息:
- 实体属性:年龄、类型、描述
- 关系属性:时间、置信度
构建流程
知识获取
- 结构化数据:从数据库、表格提取
- 非结构化数据:从文本中抽取实体和关系
- 半结构化数据:从网页、知识库提取
知识融合
- 实体对齐和消歧
- 关系统一和规范化
- 冲突检测和解决
知识存储
- 图数据库:Neo4j、Amazon Neptune
- 三元组存储:RDF、Triple Store
- 属性图:Neo4j、TigerGraph
知识图谱 + LLM
增强生成
将知识图谱信息注入LLM生成:
- 检索相关三元组
- 构建上下文提示
- 减少幻觉提升准确性
图谱问答
使用LLM理解自然语言查询并转化为图查询:
- NL2Cypher/SPARQL
- 多跳推理
- 复杂查询理解
图谱构建
利用LLM自动化知识图谱构建:
- 实体识别和关系抽取
- 知识验证和补全
- 模式发现
代表性知识图谱
| 知识图谱 | 规模 | 特点 |
|---|---|---|
| Wikidata | 1亿+实体 | 开放多语言 |
| Google KG | 5000亿+三元组 | 搜索增强 |
| ConceptNet | 通用常识 | 常识推理 |
| UMLS | 医学知识 | 医疗领域 |
应用场景
- 智能问答:精确的事实性问答
- 推荐系统:基于知识的个性化推荐
- 风险分析:金融反欺诈、关联分析
- 药物发现:分子关系和靶点预测
挑战与趋势
知识图谱面临构建成本高、更新困难、质量控制等挑战。LLM的出现为知识图谱的自动化构建和更新提供了新机遇,二者的深度融合是未来发展的重要方向。