Сбербанк выпустил новое улучшение для модели Kandinsky Image, предназначенной для создания изображений по текстовому описанию. По информации пресс-службы, теперь модель способна генерировать изображения с кириллицей.
В Сбере подчеркнули:
Не просто надпись на фоне изображения, а гармонично интегрированный элемент: начерченный на стене, вырезанный из дерева, отлит из металла, вышитый, сплетенный или созданный из лепестков роз.
Для улучшения распознавания букв, разработчики провели дополнительное обучение нейросети, использовав коллекцию из более чем 10 миллионов изображений с русским текстом, выполненным различными способами. Это позволило модели научиться отличать печатные, рукописные и другие типы букв.
В будущем разработчики намерены улучшить стабильность при создании длинных текстовых фрагментов и надписей, сочетающих кириллические и латинские символы, а также на основе подробных описаний. Возможность протестировать работу Kandinsky Image доступна в Telegram-боте Kandinsky и во всех ботах GigaChat (Telegram, «ВКонтакте», «Одноклассники», Max), а также в веб-версии.
