手动提示调优 ⚙️
GraphRAG索引器默认会运行一组设计用于知识发现广泛场景的提示词。然而,通常需要调整这些提示词以更好地适应您的特定用例。我们通过允许您指定自定义提示文件来提供这种能力,这些文件内部都会使用一系列标记替换。
每个提示词都可以通过编写纯文本自定义提示文件来覆盖。我们使用{token_name}
形式的标记替换,可用标记的描述如下所示。
索引提示词
实体/关系提取
标记
- {input_text} - 待处理的输入文本
- {entity_types} - 实体类型列表
- {tuple_delimiter} - 用于分隔元组内值的分隔符。单个元组用于表示一个实体或关系
- {record_delimiter} - 用于分隔元组实例的分隔符
- {completion_delimiter} - 生成完成时的指示符
实体/关系描述摘要
标记
- {entity_name} - 实体名称或关系的源/目标对
- {description_list} - 实体或关系的描述列表
声明提取
标记
- {input_text} - 待处理的输入文本
- {tuple_delimiter} - 用于分隔元组内值的分隔符。单个元组用于表示一个实体或关系
- {record_delimiter} - 用于分隔元组实例的分隔符
- {completion_delimiter} - 生成完成时的指示符
- {entity_specs} - 实体类型列表
- {claim_description} - 声明应呈现形式的描述。默认为:
"任何可能与信息发现相关的声明或事实。"
有关如何更改此设置的详细信息,请参阅配置文档
生成社区报告
标记
- {input_text} - 用于生成报告的输入文本。这将包含实体和关系的表格
查询提示词
本地搜索
标记
- {response_type} - 描述响应应呈现的形式。我们默认为"多段落"
- {context_data} - 来自GraphRAG索引的数据表格
全局搜索
全局搜索采用映射/归约方法进行摘要。您可以独立调整这些提示词。此搜索还包括调整使用模型训练中获得的一般知识的能力。
标记
- {response_type} - 描述响应应呈现的形式(仅归约提示词)。我们默认为"多段落"
- {context_data} - 来自GraphRAG索引的数据表格
漂移搜索
标记
- {response_type} - 描述响应应呈现的形式。我们默认为"多段落"
- {context_data} - 来自GraphRAG索引的数据表格
- {community_reports} - 摘要中包含的最相关社区报告
- {query} - 注入到上下文中的查询文本