GraphRAG 索引 🤖
GraphRAG 索引包是一个数据管道和转换套件,旨在使用LLM从非结构化文本中提取有意义的结构化数据。
索引管道是可配置的。它们由工作流、标准和自定义步骤、提示模板以及输入/输出适配器组成。我们的标准管道设计用于:
- 从原始文本中提取实体、关系和声明
- 在实体中执行社区检测
- 生成不同粒度级别的社区摘要和报告
- 将实体嵌入到图向量空间
- 将文本块嵌入到文本向量空间
管道的输出默认存储为Parquet表,嵌入内容会写入您配置的向量存储中。
入门指南
要求
有关设置开发环境的详细信息,请参阅入门指南中的要求部分。 要配置GraphRAG,请参阅配置文档。 获得配置文件后,您可以使用CLI或Python API运行管道。
使用方法
CLI
Python API
请参阅索引API的python文件,了解直接从Python代码调用的推荐方法。