Исследователи предлагают не считать ИИ-генераторы видео «мировыми моделями»
Международная группа ученых представила OpenWorldLib и доказала, что популярные видеогенераторы вроде Sora лишены ключевых свойств моделей мира.
Текст/изображение → видео, нативный звук в Veo 3, доступ через Gemini и Vertex AI; Veo 2 в Vertex AI тарифицируется посекундно.
Международная группа ученых представила OpenWorldLib и доказала, что популярные видеогенераторы вроде Sora лишены ключевых свойств моделей мира.
Стартап CraftStory от создателей OpenCV представил технологию генерации видео до 5 минут, используя параллельную диффузионную архитектуру вместо традиционных последовательных методов.
ElevenLabs расширяет свою платформу, добавляя инструменты для создания изображений и видео с ИИ. Новая функция объединяет ведущие модели визуального контента с голосовыми технологиями компании.
Together AI расширяет платформу 40+ моделями для генерации изображений и видео, включая Sora 2, Google Veo 3.0 и ByteDance Seedance. Единые API для текста, изображений и видео упрощают разработку мультимодальных приложений.
Google AI Studio получил обновление с автоматической сборкой приложений через текстовые запросы. Система позволяет создавать работающие веб-приложения за минуты без навыков программирования.
Google DeepMind представила Veo 3.1 с поддержкой аудио и расширенными функциями редактирования видео, включая создание сцен из референсов и длинных непрерывных роликов.
Google DeepMind заявляет, что видео-модели типа Veo 3 могут стать универсальным решением для компьютерного зрения, аналогичным тому, как LLM стали революцией в сфере обработки текста.
YouTube анонсировал набор AI-инструментов для создания Shorts, включая кастомную версию Veo 3, ремикширование аудио и автоматизацию монтажа.
Технологии генерации видео ИИ развиваются от диффузионных моделей к сложным пространственно-временным архитектурам, но сталкиваются с проблемами временной согласованности.
Google обновил Veo 3: добавлена поддержка вертикального видео 9:16 и разрешения 1080p, а цены снижены на 50%. Адаптация под мобильный контент и соцсети.