Третий в списке, RAGAs был создан для конвейеров RAG. Они предлагают 5 основных метрик:
- Достоверность
- Контекстная релевантность
- Релевантность ответа
- Контекстный отзыв
- Контекстная точность
Эти метрики составляют окончательную оценку RAGAs. DeepEval и RAGAs имеют очень похожие реализации, но метрики RAGAs не являются самообъясняемыми, что значительно усложняет отладку неудовлетворительных результатов.
RAGAs занимает третье место в списке в первую очередь потому, что он также включает в себя последние исследования в своих метриках RAG, прост в использовании, но не выше в списке из-за ограниченных возможностей и негибкости как фреймворка.