Нейросеть A-Vibe от Авито заняла первое место среди облегчённых моделей (до 10 млрд параметров) в независимом российском бенчмарке MERA, сообщили в компании.
Языковая модель A-Vibe обошла международные аналоги от OpenAI, Google и Anthropic: она лучше понимает запросы, генерирует код и поддерживает осмысленный диалог.
Технология уже работает в сервисах платформы: с её помощью продавцы могут быстрее составлять продающие описания и быстрее договариваться о сделке в мессенджере.
Компания планирует до конца года добавить в модель 20 новых сценариев, а в будущем может открыть код для всех.
“
"Первое место доказывает, что оптимизированная архитектура и качественные данные могут обеспечить отличные результаты даже при небольшом размере модели. A-Vibe создавалось оптимальной по соотношению между качеством, скоростью работы и затратой ресурсов. Такой баланс позволяет обеспечивать быструю обработку запросов даже в периоды пиковой нагрузки и масштабировать технологию на всю аудиторию платформы. Именно обучение небольшой модели под наши нужды позволяет нам закладывать окупаемость инвестиций: Авито планирует вложить в GenAI около 12 млрд рублей, а заработать более 21 млрд рублей к 2028 году", — отметил старший директор по данным и аналитике Авито Андрей Рыбинцев.
Бенчмарк MERA — российский стандарт оценки языковых моделей, в рамках которого тестируется понимание русского языка и культурного контекста. Независимые тесты показали, при генерации кода A-Vibe на 25% лучше Gemini 1.5 (с 8 млрд параметров), при ведении диалога — на 32% точнее Llama 3.1 (с 405 млрд параметров), а с точки зрения способности анализировать смысл текста — на 23% точнее Claude 3.5 Haiku.
A-Vibe также обошла GPT-4o mini, Gemma 3 27B, Mistral Large и другие популярные небольшие нейросети.
Собственную генеративную модель A-Vibe в Авито разработали, обучая на открытой модели с ограничениями в работе с русским языком: он составлял менее 1% от общего объёма данных, из-за чего модель плохо понимала и генерировала текст на русском.
Разработчики модифицировали и провели "русификацию" модели, заменив стандартный токенизатор на собственный, умеющий работать с русским языком, что ускорило её работу и повысило качество: модель обрабатывает русский текст почти в 2 раза быстрее по сравнению с оригинальной моделью, а понимание и генерация текста на русском становятся значительно лучше.
Кроме того, A-Vibe может одновременно обрабатывать до 32 тыс. текстовых фрагментов (токенов), что позволяет ей эффективно работать с объёмными текстами.
“
"Мы рассматриваем возможность выпуска модели в открытый доступ, что станет нашим вкладом в развитие российского рынка ИИ. Это поможет малому бизнесу внедрять передовые технологии без значительных инвестиций, образовательным учреждениям создавать прикладные программы, а независимым разработчикам строить современные сервисы на базе отечественных технологий. Для нас это возможность получить ценную обратную связь от рынка и улучшить наши модели", — отметила руководитель разработки больших языковых моделей Авито Анастасия Рысьмятова.
В конце марта в Авито представили новую стратегию внедрения генеративного искусственного интеллекта GenAI. Первые запуски продуктов с применением GenAI в 2024 году уже обеспечили компании 670 млн рублей.
Сервисы на основе искусственного интеллекта (ИИ) всё прочнее закрепляются в жизни рядового пользователя. Нейросети повсеместно используются бизнесом, в том числе для стратегического развития компаний. "Деловой Петербург" писал, как предприятия внедряют искусственный интеллект для повышения эффективности работы.