Менее чем за неделю сервисом воспользовались около двух миллионов уникальных пользователей.
Бесплатная генеративная модель Kandinsky 2.1, разработанная Сбером, стала одним из самых быстрорастущих сервисов искусственного интеллекта в мире. Всего за четыре дня российская нейросеть достигла отметки в один миллион уникальных пользователей, оперелив сервисы ChatGPT от OpenAI, которым потребовалось на это пять дней.
С момента выхода Kandinsky 2.1 было сгенерировано более десяти миллионов изображений, а количество уникальных пользователей достигло двух миллионов. Кроме того, на прошлой неделе сервис попал в ТОП-5 трендов мировых репозиториев по версии крупнейшего веб-сервиса GitHub.
Kandinsky 2.1 способна за несколько секунд генерировать изображения по их текстовому описанию на естественном языке. Модель знает 101 язык и открывает новые возможности для творчества: может смешать несколько рисунков, дорисовать изображение, создать картину в режиме бесконечного полотна (inpainting/outpainting). Нейросеть разработали и обучили исследователи Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI на объединенном датасете Sber AI и компании SberDevices.
Нейросеть унаследовала веса предыдущей версии, обученной на один миллиард пар «текст — изображение», и была дополнительно обучена на 170 млн пар «текст — изображение» высокого разрешения. Затем она дообучалась на отдельно собранном датасете из двух миллионов пар качественных изображений. В данный сет попали картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей. Нейросеть также была усовершенствована за счёт новой обученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений. Это кардинально улучшило генерацию изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 млрд параметров вместо двух миллиардов в Kandinsky 2.0.