«Яндекс» запустил нейросеть YandexART, создающую изображения по запросам пользователей и понимающую российский культурный код, сообщили в компании.
«Яндекс представил диффузионную нейросеть Yandex AI Rendering Technology (YandexART), которая создает изображения и анимацию в ответ на текстовые запросы пользователей. Она понимает российский культурный код — знает известные места и города страны, выдающихся личностей разных эпох и знакомых с детства персонажей мультфильмов и сказок. Например, Чебурашку, богатырей и Бабу-Ягу», — сказано в сообщении.
Отмечается, что изображения генерируются методом каскадной диффузии, то есть нейросеть генерирует картинки и кадры в соответствии с запросом пользователя, а затем поэтапно увеличивает их разрешение, насыщая деталями. По данным компании, YandexART создает более реалистичную и детализированную графику по сравнению с предшествующей моделью, которая использовалась в приложении «Шедеврум».
«Для улучшения качества работы нейросети разработчики увеличили размер обучающего набора данных в 1,5 раза… Для обучения YandexART используются самые эстетичные картинки — они отбираются при помощи трех режимов фильтрации. Новый алгоритм распознавания текстов помогает нейросети лучше понимать пожелания пользователей», — рассказали в «Яндексе».
YandexART уже используется в приложении «Шедеврум» для генерации фото и видео, а также при создании рекламных объявлений в «Яндекс Бизнесе». Компания планирует добавить нейросеть в «Яндекс Клавиатуру», с помощью нее можно будет сгенерировать картинку по текстовому описанию и установить ее в качестве фона.
«Яндекс» представил «Шедеврум» в апреле 2023 года. Сразу после запуска приложение попало на первые строчки российских топов App Store и Google Play, и с тех пор его установили 5,8 миллиона пользователей iOS и Android. Нейросеть «Шедеврума» содержит 5 миллиардов параметров и обучалась на 330 миллионах примеров пар картинок с текстовым описанием, добавили в пресс-службе.