跳转到内容

可用指标列表

Ragas 提供了一套评估指标,可用于衡量您的 LLM 应用程序的性能。这些指标旨在帮助您客观地衡量应用程序的性能。指标适用于不同的应用程序和任务,例如 RAG 和智能体工作流。

每个指标本质上都是为评估应用程序的特定方面而设计的范式。基于 LLM 的指标可能会使用一个或多个 LLM 调用来得出分数或结果。您也可以使用 Ragas 修改或编写自己的指标。

检索增强生成

Nvidia 指标

智能体或工具使用案例

自然语言比较

SQL

通用目的

其他任务