应用 Ragas 实战。展示如何在各种应用和用例中使用 Ragas 来解决构建时可能遇到的问题。 指标 使用追踪调试基于 LLM 的指标 评估多轮对话 评估成本估算 使用 Vertex AI 模型进行评估 测试集生成 单跳查询测试集 基准测试 对 Gemini 模型进行基准测试