Skip to content

知识图谱可视化与调试指南

以下逐步指南将介绍在使用graphrag构建知识图谱后如何进行可视化。请注意,下文推荐的部分设置基于我们的实践经验,您可以根据需要调整这些设置以获得更好的可视化效果!

1. 运行Pipeline

在构建索引前,请检查您的settings.yaml配置文件并确保已启用graphml快照功能。

snapshots:
  graphml: true
(可选)为了支持其他可视化工具和探索,可以启用以下参数来获取向量嵌入:
embed_graph:
  enabled: true # 将为节点生成node2vec嵌入
umap:
  enabled: true # 将为节点生成UMAP嵌入,为实体表提供可绘制的x/y坐标
对数据运行索引pipeline后,将生成一个输出文件夹(由storage.base_dir设置定义)。

  • 输出文件夹:包含LLM索引过程生成的产物。

2. 定位知识图谱

在输出文件夹中,查找名为graph.graphml的文件。graphml是一种标准文件格式,被多种可视化工具支持。我们推荐使用Gephi

3. 在Gephi中打开图谱

  1. 安装并打开Gephi
  2. 导航至包含各种parquet文件的output文件夹
  3. graph.graphml文件导入Gephi。这将显示一个简单的无向图节点和边的视图

A basic graph visualization by Gephi

4. 安装Leiden算法插件

  1. 前往工具 -> 插件
  2. 搜索"Leiden Algorithm"
  3. 点击安装并重启Gephi

5. 运行统计

  1. 在右侧的统计选项卡中,点击运行以执行平均度数Leiden算法

A view of Gephi's network overview settings

  1. 对于Leiden算法,调整以下设置:
  2. 质量函数:模块度
  3. 分辨率:1

6. 按聚类着色图谱

  1. 前往Gephi左上角的外观面板

A view of Gephi's appearance pane

  1. 选择节点,然后分区,点击右上角的调色板图标
  2. 从下拉菜单中选择聚类
  3. 点击调色板...超链接,然后点击生成...
  4. 取消勾选限制颜色数量,点击生成,然后确定
  5. 点击应用为图谱着色。这将根据Leiden发现的划分对图谱进行着色

7. 按度中心性调整节点大小

  1. 在左上角的外观面板中,选择节点 -> 排序
  2. 点击右上角的尺寸图标
  3. 选择度数并设置:
  4. 最小值:10
  5. 最大值:150
  6. 点击应用

8. 布局图谱

  1. 在左下角的布局选项卡中,选择OpenORD

A view of Gephi's layout pane

  1. 液态扩展阶段设为50,其余设为0
  2. 点击运行并观察进度

9. 运行ForceAtlas2

  1. 在布局选项中选择Force Atlas 2

A view of Gephi's ForceAtlas2 layout pane

  1. 调整以下设置:
  2. 缩放比例:15
  3. 抑制中心节点:勾选
  4. LinLog模式:取消勾选
  5. 防止重叠:勾选
  6. 点击运行并等待
  7. 当图谱节点位置趋于稳定且不再明显变化时,点击停止

10. 添加文本标签(可选)

  1. 在相应部分开启文本标签显示
  2. 根据需要配置和调整标签大小

您的最终图谱现在应该已经视觉组织完成,可以进行分析了! \n