rss Twitter Добавить виджет на Яндекс
Реклама:
     
 

Нейросеть ruDALL-E теперь может генерировать картинки по описанию на иностранных языках

Сайт открытой нейронной сети ruDALL-E, генерирующей изображения на основе текстового описания, теперь может работать с текстами не только на русском, но и на других языках. В мобильном приложении Салют и на устройствах Sber создать картинку можно даже по голосовому запросу, перевод на английский получил и демо-сайт, на котором можно попробовать модель. Об этом сообщил СТО Сбербанк Груп, исполнительный вице-президент Давид Рафаловский во время международной конференции AI Journey 2021.

За неделю с момента релиза ruDALL-E пользователи по всему миру уже сгенерировали более 3 млн изображений при помощи ruDALL-E, используя для формирования русскоязычных запросов различные системы машинного перевода, а теперь смогут делать запросы на английском и других языках. При вводе текста модель самостоятельно определяет язык ввода и генерирует соответствующее изображение. 

Прототипом для создания ruDALL-E стала нейросеть DALL-E для английского языка, которая была впервые представлена OpenAI в 2021 году. При этом исследователи из американской компании не стали выкладывать модель в открытый доступ, ограничившись общим описанием архитектуры и впечатляющим набором примеров работы модели, отобранных вручную. На основе публикации OpenAI команды SberDevices и Sber AI при содействии SberCloud создали аналогичное решение и запустили обучение нейросети на платформе ML Space на базе суперкомпьютера Christofari, получив аналогичный результат для русского языка, а позднее и мультиязычный вариант. 

Модель существует в двух вариантах: ruDALL-E XL, содержащая 1,3 миллиарда параметров, и ruDALL-E XXL с 12 миллиардами параметров. Возможностями меньшей можно воспользоваться бесплатно, загрузив её с сервиса Github  и Hugging Face. Обе модели также можно найти в ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud. 

Большая модель может послужить для создания вариантов дизайна интерьера, стоковых изображений или векторных иллюстраций, материалов для рекламы, копирайтинга, в то время, как уменьшенный вариант в приложении Салют и на демо-сайте призван скорее развлечь пользователей и показать им возможности нейросети. Чтобы создать изображение на устройствах Sber или в приложении Салют достаточно сказать: «Открой Далли» или «Запусти художника». 

Давид Рафаловский, СТО Сбербанк Груп, исполнительный вице-президент: 

«После запуска ruDALL-E мы увидели большой интерес к модели со стороны аудитории. Поэтому мы решили создать мультиязычный вариант сервиса, который упростит пользователю путь к созданию изображения. Сейчас моделью может воспользоваться практически любой желающий по всему миру. Поставить задачу нейросети можно и голосом, вызвав его в приложении Салют и на устройствах Sber».

Редактор раздела: Александр Авдеенко (info@mskit.ru)

Рубрики: Web

наверх
 
 
     

А знаете ли Вы что?

     
 

NNIT.RU: последние новости Нижнего Новгорода и Поволжья

25.11.2021 Библиотечное настоящее: есть ли место технологиям

18.11.2021 Приручить беспилотники

11.11.2021 AI Journey: ИИ и немного этики

10.11.2021 Блокчейн позволит сэкономить 10 миллиардов долларов на трансграничных платежах

25.10.2021 Документооборот на пути цифровой трансформации

20.10.2021 Спасительный лайфхак для классического ретейла

14.10.2021 Schneider Electric намерен ускорить декарбонизацию

12.10.2021 Mail.ru натянул VK на глобус

MSKIT.RU: последние новости Москвы и Центра

ITSZ.RU: последние новости Петербурга

03.12.2021 Билайн подвел итоги развития сети в Петербурге и Ленинградской области

25.11.2021 Библиотечное настоящее: есть ли место технологиям

18.11.2021 Приручить беспилотники

11.11.2021 AI Journey: ИИ и немного этики

10.11.2021 Блокчейн позволит сэкономить 10 миллиардов долларов на трансграничных платежах

25.10.2021 Документооборот на пути цифровой трансформации

20.10.2021 Спасительный лайфхак для классического ретейла

14.10.2021 Schneider Electric намерен ускорить декарбонизацию