3. Мультимодельный мир закрепляется, а ключевым драйвером становится дифференциация, а не коммодитизацияС появлением нескольких высококачественных LLM стало нормой запускать сразу несколько моделей в продакшн-сценариях.
Хотя стремление избежать vendor lock-in остаётся актуальным, главным фактором, по которому компании выбирают модели от разных вендоров, становится именно функциональная дифференциация под конкретные use case’ы.
В этом году 37% респондентов сообщили, что используют 5 и более моделей, по сравнению результатом в 29% год назад.
Хотя по результатам общих бенчмарков некоторые модели могут выглядеть схожими по качеству, на уровне enterprise-использования речь о коммодитизации пока не идёт. Так, например, модели Anthropic давно известны своей
эффективностью в задачах, связанных с программированием — но в действительности ситуация тоньше. Некоторые пользователи отмечают, что Claude лучше справляется с точной автодополнением кода, тогда как Gemini показывает лучшие результаты при проектировании архитектур и систем на более высоком уровне.
В других доменах — например, в текстовых задачах — один клиент заметил: «Anthropic чуть лучше в задачах на генерацию — языковая плавность, написание контента, мозговые штурмы; тогда как модели OpenAI лучше справляются с комплексными вопросами и ответами». Эти различия закрепили практику использования нескольких моделей одновременно, и мы ожидаем, что такая стратегия сохранится: компании продолжают выстраивать стек под нужную производительность, оставаясь при этом максимально независимыми от конкретных поставщиков.