Supervised fine-tuning обладает некоторыми общими свойствами с Retrieval Augmented Generation (RAG). Обе методики применимы для специализированной настройки языковых моделей под конкретные области использования. Однако способы достижения этой цели различаются.
RAG делает упор на комбинирование техник поиска и генерации, стремясь внедрить внешнее знание или контекст в генеративные языковые модели, а SFT концентрируется на адаптации предварительно обученных моделей к конкретным сценариям использования.
RAG позволяет модели получать информацию из готовой базы знаний и добавлять её в промт языковой модели. Это работает следующим образом:
- LLM перенаправляет пользовательский промт модели эмбеддингов, где он преобразуется в числовой вид;
- Затем эти промты сравниваются с базами знаний;
- Модель эмбеддинга находит релевантные данные;
- Найденная информация интегрируется в промт большой языковой модели как дополнительный специфический контекст;
- Модель эмбеддингов преобразует данные обратно в удобный для пользователя формат, чтобы добавить эту информацию в ответ LLM;
- Выходные данные, сочетающие в себе и найденную информацию, и исходный промт, передаются пользователю.
В SFT параметры предварительно обученной модели регулируются на основании вычисленных потерь. В Retrieval Augmented Generation (RAG) во время процесса поиска и генерации параметры модели остаются неизменными. Кроме того, в RAG применяется дополнительная внешняя информация, а SFT использует специально отобранные размеченные данные.
Можно с уверенностью сказать, что RAG будет наиболее полезной в ситуациях, когда информация часто эволюционирует или постоянно меняется. Эта методика идеальна для областей применения, в которых для совершенствования ответов модели выполняется доступ к внешним источникам, например, к базам данных, записям или другим репозиториям данных. SFT обеспечивает глубокое согласование с конкретными стилями или областями знания, а RAG в основном делает упор на поиск информации.
Сложно определить, какой подход больше подходит для настройки LLM под конкретные задачи. В некоторых случаях хорошей идеей будет их комбинирование для получения оптимальных результатов. Ниже мы перечислим некоторые аспекты, которые могут помочь вам в выборе методики.
Преимущества SFT- SFT эффективен в задачах, где имеются размеченные данные и желателен прямой контроль за поведением модели;
- Он позволяет выполнять точную настройку параметров модели под целевую задачу, что приводит к тонкой регулировке под требования конкретной задачи;
- SFT позволяет выполнять fine-tuning одной и той же модели под разные задачи.
Аргументы в пользу RAG- RAG не требует размеченных данных, поэтому лучше подходит для случаев, когда размеченных данных недостаточно или они отсутствуют;
- RAG обеспечивает преимущество в задачах, требующих внедрения внешнего знания или контекста;
- Особенно полезен он в случаях, когда данные обновляются очень часто.