跳到内容

可用指标列表

Ragas 提供了一系列评估指标,可用于衡量您的 LLM 应用的性能。这些指标旨在帮助您客观地衡量应用的性能。指标适用于不同的应用和任务,例如 RAG 和 Agentic 工作流。

每个指标本质上都是旨在评估应用特定方面的范例。基于 LLM 的指标可能使用一个或多个 LLM 调用来得出分数或结果。您也可以使用 ragas 修改或编写您自己的指标。

检索增强生成

Nvidia 指标

代理或工具用例

自然语言比较

SQL

通用目的

其他任务