Прощай, Sora? Сбер выпустил бесплатную ИИ-модель Kandinsky для создания видео
Сбер выложил в открытый доступ две ключевые генеративные ИИ-модели, используемые в GigaChat. Речь идёт о Kandinsky Video Lite для создания коротких видео и Giga-Embeddings для создания векторных изображений. Обе модели доступны бесплатно и могут использоваться в коммерческих проектах.
Kandinsky Video Lite генерирует ролики длительностью до 10 секунд в SD- или HD- качестве по текстовому запросу. Несмотря на компактные размеры — всего два миллиарда параметров, — по внутренним тестам она обходит более «тяжёлые» системы вроде Wan 2.1 и даже сравнима по качеству с моделью Wan 2.2 A14B, которая больше в 13–14 раз.
Сбер подчёркивает, что особое внимание при обучении уделили «культурному коду»: в датасет вошёл миллион изображений и видео, отобранных с участием художников и дизайнеров, чтобы модель лучше понимала российский визуальный контекст. Дополнительно доступна ускоренная версия Kandinsky Video Lite Flash, работающая в шесть раз быстрее.
«Научная команда Сбера активно публикует различные модели генеративного искусственного интеллекта. Так, в открытый доступ выложены все модели линейки Kandinsky, семейство акустических моделей для русского языка GigaAM, которые находятся “под капотом” нашего сервиса GigaChat», — Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» СберБанка.
Вторая модель — Giga-Embeddings, преобразовывает промт в векторные изображения. Она занимает первое место в рейтинге ruMTEB с результатом 74,1 и значительно опережает другие доступные решения. По словам разработчиков, Giga-Embeddings позволяет строить надёжные RAG-системы, которые обеспечивают точность ответов искусственного интеллекта. Это может пригодиться в поисковых сервисах, чат-ботах и корпоративных инструментах для работы с документами.
Сбер позиционирует открытие доступа к своим моделям как вклад в международное сообщество open-source и возможность ускорить исследования в области ИИ. Обе модели доступны бесплатно и могут использоваться в коммерческих проектах. Скачать их можно на различных площадках:
- Kandinsky Video Lite — Hugging Face, GitVerse, GitHub.
- GigaEmbeddings — Hugging Face, GitVerse.