博客文章从改进 AI 应用的两年中获得的宝贵经验一份关于如何设置评估和改进 AI 系统的分步指南2025年5月7日评估AI将 LLM 作为评判者与人工评估者对齐利用人工反馈对基于 LLM 的评估指标进行对齐和改进2024年12月11日评估LLM关于合成数据生成的一切一篇关于使用 LLM 生成合成数据的深度调研博客2024年11月19日LLM数据宣布 Ragas v0.2宣布 Ragas v0.2 版本发布2024年10月21日发布0.2关于评估大语言模型的一切一篇关于评估 LLM 应用的深度调研博客2024年7月9日LLM评估