提示词调优

理解智能体回复

每个智能体回复都包含元数据，您可以查看这些数据以了解 Themis 是如何得出答案的。

当 Themis 在对话中使用外部服务时，您会在回复中看到工具调用指示器。这些显示了调用了哪些工具 —— 例如，从 GitHub 获取 PR 差异、从 Metabase 查询数据，或在 Linear 中创建工单。这种透明性帮助您了解智能体使用了哪些数据。

每个回复都显示使用的模型（例如 Claude Sonnet、Claude Opus）。如果您的空间使用双层智能体架构，简单问题可能由更快的一级轻量模型处理，而复杂问题会自动升级到完整的二级模型。

展开任何智能体回复上的推理日志，查看完整的执行追踪：

这对于理解智能体为何给出特定答案以及诊断问题非常有价值。

每个收件箱条目 —— 不仅仅是对话 —— 都可以扩展为完整的聊天。点击任何条目上的对话按钮，即可开始一个加载了原始上下文的对话：

新对话继承完整上下文 —— 您无需重新解释发生了什么。

当自动化表现不佳 —— 产生低质量结果、频繁失败或费用过高 —— 使用调试工作流来改进它。

前往自动化的详情页，查看执行历史：

打开一个已完成或失败的自动化执行
点击对话开始一个包含执行上下文的对话
切换调试模式 —— 这会将完整的推理日志和提示加载到对话中
让 Themis 分析出了什么问题并建议改进：
- “为什么这个自动化失败了？我如何改进提示？”
- “费用太高了。如何让提示更高效？”
- “输出质量不稳定。是什么原因？”
将建议的更改应用到您的自动化提示模板中

这种反馈循环是迭代提升自动化质量的最快方式。智能体可以准确看到运行期间发生了什么 —— 调用了哪些工具、推理在哪里偏离了轨道、最终输出是什么样的 —— 并建议有针对性的提示改进。