Большие, универсальные инструменты, такие как Midjourney и ChatGPT, привлекли больше всего внимания среди потребителей, которые изучают генеративный ИИ. Но для бизнеса более мелкие, специализированные модели могут оказаться наиболее устойчивыми, поддерживаемыми растущим спросом на ИИ-системы, которые могут удовлетворить узкие требования.
Хотя создание новой модели с нуля - это возможность, это затратное предприятие, которое будет недоступно для многих организаций. Для создания настраиваемого генеративного ИИ большинство организаций вместо этого модифицируют существующие модели ИИ - например, изменяют их архитектуру или доводят до совершенства на наборе данных, специфичном для определенной области. Это может быть дешевле, чем создание новой модели с нуля или использование API для обращения к общедоступной LLM.
"Запросы к GPT-4 как к API, просто в качестве примера, очень дорогие, как с точки зрения стоимости, так и с точки зрения задержки - как долго это может занять возвращение результата", - сказал Шейн Люк, вице-президент по ИИ и машинному обучению в Workday. "Мы много работаем ... над оптимизацией, чтобы у нас были те же возможности, но это очень целенаправленно и специфично. И поэтому может быть использована гораздо меньшая модель, которую проще управлять."
Основное преимущество настраиваемых моделей генеративного ИИ - их способность удовлетворять узкие рынки и потребности пользователей. Подходящие инструменты генеративного ИИ могут быть созданы для практически любого сценария, от поддержки клиентов до управления цепочкой поставок и проверки документов. Это особенно актуально для секторов с высокоспециализированными терминами и практикой, таких как здравоохранение, финансы и юриспруденция.
Во многих бизнес-сценариях использование самых мощных LLM излишне. Хотя ChatGPT может быть наилучшим решением для чат-ботов, предназначенных для взаимодействия с потребителями и решения любых вопросов, "для более мелких предприятий это не самое актуальное решение", - сказал Люк.
Баррингтон ожидает, что предприятия будут исследовать более широкий спектр моделей в следующем году, по мере того как способности разработчиков ИИ начнут сходиться. "Мы ожидаем, что в течение следующего года или двух модели будут иметь гораздо более высокий уровень равенства - и это хорошо," - сказал он.
На меньшем масштабе Люк видел подобную ситуацию в Workday, который предоставляет набор сервисов ИИ для внутреннего экспериментирования команд. Хотя сотрудники в начале использовали в основном услуги OpenAI, по словам Люка, он постепенно видел переход к смешанным моделям от различных поставщиков, включая Google и AWS.
Создание настраиваемой модели вместо использования общедоступного инструмента также часто повышает конфиденциальность и безопасность, поскольку это дает организациям больше контроля над их данными. Люк привел пример создания модели для задач Workday, связанных с обработкой чувствительных персональных данных, таких как статус инвалидности и медицинская история. "Это не то, что мы собираемся отправлять третьей стороне," - сказал он. "Наши клиенты в основном не будут комфортно чувствовать себя в такой ситуации."
В свете этих преимуществ в области конфиденциальности и безопасности строже регулирование ИИ в следующие годы может побудить организации сконцентрировать свои усилия на собственных моделях, пояснила Джиллиан Кроссан, руководитель отдела риск-консалтинга и лидер глобального сектора технологий в Deloitte.
"Это будет поощрять предприятия сконцентрироваться больше на частных моделях, которые являются собственностью компании и специфичны для области, а не на этих крупных языковых моделях, которые обучены данными со всего интернета и все, что с этим связано," - сказала она.