跳过到内容

测试集生成

策划高质量的测试数据集对于评估您的 AI 应用性能至关重要。

理想测试数据集的特征

  • 包含高质量的数据样本
  • 涵盖现实世界中观察到的各种场景。
  • 包含足够的样本数量,以便得出统计学上显著的结论。
  • 持续更新以防止数据漂移

手动策划这样的数据集既耗时又昂贵。Ragas 提供了一套工具来生成用于评估您的 AI 应用的合成测试数据集。