✨ 简介

Ragas 是一个帮助您从“感觉良好”的检查转向为您的 AI 应用进行系统化评估循环的库。它提供了增强大型语言模型（LLM）应用评估的工具，使您能够轻松且自信地评估您的 LLM 应用。

为何选择 Ragas？

传统的评估指标无法捕捉 LLM 应用的关键所在。手动评估无法扩展。Ragas 通过将由 LLM 驱动的指标与系统化实验相结合来解决这个问题，从而创建一个持续改进的循环。

在过去的两年里，我们见证并帮助了许多 AI 应用通过评估得到改进。

我们正在将这些知识压缩成一个产品，用评估循环取代感觉检查，这样您就可以专注于构建卓越的 AI 应用。

如果您希望通过评估来改进和扩展您的 AI 应用，🔗 预约一个时段或给我们写信：founders@vibrantlabs.com。