❤️ 社区
"独木不成林;同心可移山。" - 海伦·凯勒 (Helen Keller)
我们的项目依靠社区充满活力的能量、多样化的技能和共同的热情而蓬勃发展。这不仅仅关乎代码;更关乎人们团结一心,创造非凡。这个空间颂扬每一份贡献,无论大小,并展示了促成这一切的杰出人才。
🌟 贡献者
认识一些做出重大贡献的杰出社区成员!
📚 博客与见解
探索由我们的社区成员撰写并为他们而写的富有洞察力的文章、教程和故事。
- Luka Panić 分享了他的工作:
- Ragas Evaluation: In-Depth Insights | PIXION Blog: 对指标及其计算方法的详细解释。
- RAG in practice - Test Set Generation | PIXION Blog: 关于如何使用 Ragas 生成测试集的教程。
- Shanthi Vardhan 分享了他在 Atomicwork 的团队如何使用 ragas 来提高他们的 AI 系统准确识别和检索更精确信息的能力,以增强服务管理。
- Pinecone 关于 RAG 如何增强 LLM 能力的研究,在 "RAG makes LLMs better and equal" 中,使用 ragas 证明上下文检索可以使 LLM 提供显著更好的结果,即使数据量增加到 10 亿。
- Aishwarya Prabhat 在她的综合指南 "Performing, Evaluating & Tracking Advanced RAG (ft. AzureML, LlamaIndex & Ragas)" 中分享了关于高级 RAG 技术的专业知识。
- Leonie (又名 @helloiamleonie) 在详细文章 "Evaluating RAG Applications with RAGAs" 中提供了她的观点。
- Erika Cardenas 和 Connor Shorten 的共同努力体现在他们的合作文章 "An Overview on RAG Evaluation | Weaviate" 以及他们与 Ragas 团队的播客中。
- Erika Cardenas 在她最近使用 Ragas 调整 weaviate alpha 分数的实验中,进一步探讨了 "RAG performance of hybrid search weightings (alpha)"。
- Langchain 关于 RAG Evaluating RAG pipelines with RAGAs and Langsmith 的工作提供了一个完整的教程,说明如何利用这两个工具来评估 RAG pipeline。
- Plaban Nayak 分享了他的工作 Evaluate RAG Pipeline using RAGAS,内容是使用 Langchain 和 RAGAS 构建和评估一个简单的 RAG。
- Stephen Kurniawan 比较了不同的 RAG 元素,例如 Chunk Size (块大小)、Vector Stores: FAISS vs ChromaDB (向量存储:FAISS vs ChromaDB)、Vector Stores 2: Multiple Documents (向量存储 2:多文档),以及 Similarity Searches / Distance Metrics / Index Strategies (相似性搜索 / 距离指标 / 索引策略)。
- 在 Devanshu Brahmbhatt 关于优化 RAG 系统的文章 Enhancing LLM's Accuracy with RAGAS 中探索他的见解。了解 RAG 架构、关键评估指标以及如何使用 RAGAS 分数来提高性能。
- Suzuki 和 Hwang 进行了一项实验,通过比较使用相同内容的日语和英语数据集时的 Ragas 性能(人类标注与 Ragas 分数之间的相关系数),来调查 Ragas 的性能是否依赖于语言。他们撰写了关于实验结果和 Ragas 基本算法的博客。
- Atita Arora 撰写了关于 Evaluating Retrieval Augmented Generation using RAGAS (使用 RAGAS 评估检索增强生成) 的文章,这是一个关于使用 Qdrant 和 Langchain 构建 RAG 并使用 RAGAS 进行评估的端到端教程。
- 奖励内容 : 学习如何创建一个评估数据集,作为评估我们的 RAG pipeline 的参考点,理解 RAGAS 评估指标以及如何理解它们并将它们付诸实践以测试一个朴素 RAG pipeline 并使用 RAGAS 指标衡量其性能。
- 代码演示 : https://github.com/qdrant/qdrant-rag-eval/tree/master/workshop-rag-eval-qdrant-ragas
- 使用 Deepset Haystack 和 Mixedbread.ai 的代码演示 : https://github.com/qdrant/qdrant-rag-eval/tree/master/workshop-rag-eval-qdrant-ragas-haystack
- Minoru Onda 为初学者撰写了关于如何使用 Amazon Bedrock 开始 Ragas v0.2 评估,并与 Langfuse 集成的文章。
- Yunnglin 撰写了一篇指南,关于将 Ragas v0.2 集成到 EvalScope (一个大型模型评估框架) 中,从而利用 ModelScope 生态系统。
📅 活动
了解我们最新的聚会、线下交流和在线网络研讨会。
- OpenAI 工程师分享他们的 RAG 技巧并在 DevDay 上展示 Ragas。
- Langchain 与 Ragas 团队合作举办的 LangChain "RAG Evaluation” 网络研讨会