知识图谱可视化与调试指南
以下逐步指南将介绍在使用graphrag构建知识图谱后如何进行可视化。请注意,下文推荐的部分设置基于我们的实践经验,您可以根据需要调整这些设置以获得更好的可视化效果!
1. 运行Pipeline
在构建索引前,请检查您的settings.yaml
配置文件并确保已启用graphml快照功能。
storage.base_dir
设置定义)。
- 输出文件夹:包含LLM索引过程生成的产物。
2. 定位知识图谱
在输出文件夹中,查找名为graph.graphml
的文件。graphml是一种标准文件格式,被多种可视化工具支持。我们推荐使用Gephi。
3. 在Gephi中打开图谱
- 安装并打开Gephi
- 导航至包含各种parquet文件的
output
文件夹 - 将
graph.graphml
文件导入Gephi。这将显示一个简单的无向图节点和边的视图
4. 安装Leiden算法插件
- 前往
工具
->插件
- 搜索"Leiden Algorithm"
- 点击
安装
并重启Gephi
5. 运行统计
- 在右侧的
统计
选项卡中,点击运行
以执行平均度数
和Leiden算法
- 对于Leiden算法,调整以下设置:
- 质量函数:模块度
- 分辨率:1
6. 按聚类着色图谱
- 前往Gephi左上角的
外观
面板
- 选择
节点
,然后分区
,点击右上角的调色板图标 - 从下拉菜单中选择
聚类
- 点击
调色板...
超链接,然后点击生成...
- 取消勾选
限制颜色数量
,点击生成
,然后确定
- 点击
应用
为图谱着色。这将根据Leiden发现的划分对图谱进行着色
7. 按度中心性调整节点大小
- 在左上角的
外观
面板中,选择节点
->排序
- 点击右上角的
尺寸
图标 - 选择
度数
并设置: - 最小值:10
- 最大值:150
- 点击
应用
8. 布局图谱
- 在左下角的
布局
选项卡中,选择OpenORD
- 将
液态
和扩展
阶段设为50,其余设为0 - 点击
运行
并观察进度
9. 运行ForceAtlas2
- 在布局选项中选择
Force Atlas 2
- 调整以下设置:
- 缩放比例:15
- 抑制中心节点:勾选
- LinLog模式:取消勾选
- 防止重叠:勾选
- 点击
运行
并等待 - 当图谱节点位置趋于稳定且不再明显变化时,点击
停止
10. 添加文本标签(可选)
- 在相应部分开启文本标签显示
- 根据需要配置和调整标签大小
您的最终图谱现在应该已经视觉组织完成,可以进行分析了!
\n