Форум Протвино


Яндекс.Метрика

Написать Админу: protvino-forum@mail.ru
 
Вернуться   Форум города Протвино > Протвино - город > Наука
Регистрация Справка Пользователи Календарь Поиск Сообщения за день Все разделы прочитаны

Наука О науке в городе и за его пределами

Ответ
 
Опции темы Опции просмотра
  #1  
Старый 19.06.2022, 07:46
Аватар для Владимир Аникеев
Владимир Аникеев Владимир Аникеев вне форума
ce est moi
(офицер)
 
Регистрация: 11.06.2008
Сообщения: 4,587
Вес репутации: 3432
Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть
Kandinsky — модель генерации изображений по текстовому описанию на русском языке


Пресс-релиз | 15.06.2022
Cбер представил самую большую на данный момент модель генерации изображений по текстовому описанию на русском языке — Kandinsky. Это улучшенная версия мультимодальной нейросети ruDALL-E, которая генерирует картинки по описанию на русском языке. Использовать её можно для создания любых видов изображений — иллюстраций, материалов для рекламы, архитектурного и промышленного дизайна и даже дизайна в области цифрового искусства.

Цитата:
В ноябре была выпущена модель ruDALL-E XL, содержащая 1,3 млрд параметров. Её параметры и код были выложены в открытый доступ, и был разработан сервис генерации изображений. За полгода этим сервисом воспользовались 2 млн уникальных пользователей, которые суммарно сгенерировали 125 млн изображений. Также в ноябре была анонсирована, а в декабе опубликована в маркетплейсе AI Services платформы SberCloud ML Space эксклюзивная модель ruDALL-E XXL c 12 миллиардами параметров.

В этом году команды Sber AI и SberDevices смогли существенно улучшить качество работы этой модели, дообучив её на 179 млн изображений, снабжённых текстовыми описаниями, с помощью платформы SberCloud ML Space и суперкомпьютера Christofari Neo. Дообученная модель Kandinsky умеет генерировать изображения с произвольным соотношением сторон, а также может использовать новый способ повышения разрешения сгенерированных картинок на основе диффузионного процесса для изображений с соотношением сторон 1:1 (помимо стандартного подхода с использованием Real-ESRGAN). Теперь модель значительно лучше справляется с созданием реалистичных изображений, качественно передавая различные текстуры, тени и отражения.

Создание изображений при помощи модели Kandinsky происходит в три этапа. Сначала одна нейросеть (непосредственно Kandinsky), используя текстовое описание, генерирует заданное число изображений. Затем вторая (ruCLIP Large) выбирает наиболее удачные и максимально соответствующие заданному текстовому описанию картинки, а потом третья увеличивает их в размере (доступны как диффузионная модель, так и генеративно-состязательная модель Real-ESRGAN). Итогом работы модели является набор сгенерированных изображений высокого качества. Отличительным преимуществом модели Kandinsky по сравнению с предыдущими версиями является более высокая степень детализации создаваемых изображений.

Модель доступна в мобильном приложении «Салют», на умных устройствах Sber по запросу «Включи художника».

Александр Ведяхин, первый заместитель председателя правления Сбербанка, отметил: «Мы продолжаем развивать нейронные сети, которые следуют принципам трёх М — мультимодальности, мультизадачности и мультиязычности. Kandinsky — это мощный прорыв в этой сфере. Она способна точнее сравнивать и анализировать различные изображения, чтобы создавать настоящие живописные картины. Автоматическая генерация изображений открывает новые возможности для бизнеса, который и станет одним из главных бенефициаров новой технологии».
Неплохо было бы прикладывать к таким заметкам ролик или хотя бы фотографии. Как-то сходу не понять, сколько символов текста могут описать картинку, скажем, 1200 на 800 пикселей. Скорее всего речь идёт о поиске в огромной базе данных.

Результаты см. на https://www.ixbt.com/news/2022/06/14...a-russkom.html и меня пока не впечатляют...
__________________
Бритва Хэнлона: Никогда не приписывайте злому умыслу то, что вполне можно объяснить глупостью.
(англ. Hanlon's Razor «Never attribute to malice that which can be adequately explained by stupidity»).
Ответить с цитированием
Ответ


Здесь присутствуют: 1 (пользователей - 0 , гостей - 1)
 
Опции темы
Опции просмотра

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход

Праздники сегодня

 

Реклама на форуме

 

 
Часовой пояс GMT +3, время: 07:56.


vBulletin v3.6.2, Copyright ©2000-2022, Jelsoft Enterprises Ltd.
Русский перевод: zCarot, Vovan & Co
Администрация форума не несет ответственности за содержание сообщений на форуме.