Эти ограничения мешают ИИ-проектам переходить из стадии пилота в стадию промышленной эксплуатации. Об этом на конференции Data Fusion рассказал заместитель руководителя технологического блока ВТБ Сергей Безбогов.
Несмотря на высокий интерес к технологиям искусственного интеллекта, в том числе большим языковым моделям (LLM), лишь ограниченное число проектов достигает стадии промышленного внедрения. Ситуация с полномасштабным запуском ИИ-проектов после пилота характерна как для российского, так и для международного рынка.
Барьерами являются следующие причины:
Первая причина — экономическая. ВТБ придерживается принципа «бережливого ИИ» и ориентируется на показатель возврата инвестиций (ROI). Экономическая целесообразность запуска проектов с ИИ оценивается по единым критериям со всеми другими проектами технологической трансформации — в банке установлен срок окупаемости таких инвестиций и приоритеты зависят от этого срока. ИИ и генеративные модели требуют значительных вычислительных мощностей, поэтому даже пилоты могут требовать высоких начальных затрат. Это отсеивает дорогие решения, эффект по которым сложно оценить без пилотирования.
Вторая причина вытекает из первой — высокая стоимость инфраструктуры. Разработка и масштабирование решений на базе LLM требует значительных вычислительных ресурсов и специализированных ИТ-кластеров. В ряде случаев даже использование высокоэффективных моделей оказывается экономически нецелесообразным из-за стоимости необходимого для неё «железа». Дефицит средств производства, в том числе видеокарт и процессоров, также сдерживает развитие рынка.
Третья причина — галлюцинации. Модели с генеративным ИИ, который самостоятельно создает контент, могут выдавать вымышленные факты, несуществующие ссылки или некорректные ответы, то есть «галлюционировать». Такие ошибки создают финансовые и репутационные риски для бизнеса. Для минимизации этих рисков требуются сложные каскадные решения и системы детекции, которые требуют отдельной разработки и настройки под каждую предметную область — универсальных решений пока нет.
Четвертая причина — дефицит качественных данных. На рынке наблюдается нехватка качественных данных для обучения ИИ-моделей. Создание качественных выборок требует дорогостоящей фильтрации и экспертной проверки данных на достоверность. При этом внутри одной отрасли, например, банковской, наборы данных часто идентичны, что ограничивает развитие уникальных моделей. Эта проблема может быть решена межотраслевым обменом данных, но строгие правила передачи и обработки некоторых чувствительных категорий данных на законодательном уровне ограничивают свободный обмен информацией между компаниями.
Пятая причина — нехватка кадров с новыми компетенциями. Для промышленной эксплуатации нужны не просто разработчики, а появление в штате полутехнологических команд — специалистов по разметке данных и промпт-инженеров, способных правильно формулировать задачи для нейросетей. Также важна осознанность пользователей при взаимодействовии с нейросетью — от них требуется по возможности более четко формулировать вопрос и критически относиться к ответу, не перекладывая ответственность за финальное решение на ИИ.