Собственная мультимодальная модель A-Vision определяет характеристики вещи и формирует название и описание товара. Во время раннего тестирования пользователи опубликовали через новый сценарий более 100 тыс. объявлений — примерно в половине случаев, не изменив ни одного параметра.
Ранее искусственный интеллект на «Авито» составлял только текстовое описание на основе данных, которые пользователь указывал самостоятельно. В новом сценарии «Разберём гардероб» технология A-Vision анализирует фотографию и формирует готовую карточку товара с категорией, характеристиками, названием и описанием. Все данные выводятся на одном экране, где их можно проверить и скорректировать перед публикацией. Во время тестирования это позволило примерно на 40 % сократить количество отдельных экранов при создании объявления со смартфона.
Функция также помогает определить стоимость вещи. Внутренняя ML-система оценки стоимости товаров анализирует актуальные цены на аналогичные предложения на платформе и рекомендует цену.
«Наша задача — сделать так, чтобы для начала продажи пользователю было достаточно фотографии. Мы ожидаем, что к 2 030 году таким способом будет публиковаться больше половины объявлений по продаже одежды и обуви», — рассказывает директор бизнес-направления Lifestyle компании «Авито» Алексей Гевлич.
Для запуска функции команда платформы дообучила A-Vision с помощью LoRA-адаптеров — метода, который позволяет настроить большую модель под конкретную задачу без её полного переобучения. Модель адаптировали к фотографиям частных продавцов: вещи могут быть сняты при бытовом освещении на смартфон, на разном фоне, на полу, диване или вешалке.
«Разберём гардероб» ориентирован на частных продавцов и доступен в мобильном приложении «Авито» в разделе «Мои объявления» во вкладке «Можно продать». В данный момент функция доступна для продажи товаров из категории взрослой и детской одежды.