Компания OpenAI представила новую нейросеть, способную создавать реалистичные видео на основе текстовых описаний. Эта разработка, получившая название Sora в честь японского слова "небо", отличается от существующих аналогов тем, что она генерирует полные видеоролики целиком, а не собирает их покадрово. Пользователи смогут создавать видео в высоком разрешении до 1080p, длительностью до 20 секунд и в различных форматах: широкоформатном, вертикальном или квадратном, сообщает The Verge.
Представители OpenAI отметили, что при создании контента Sora учитывает физические свойства объектов и их взаимодействие, что позволяет получать естественные видео с плавной анимацией. Интересно, что чем более детализированными будут подсказки от пользователя, тем выше будет уровень реализма итогового видео.
Важно подчеркнуть, что данный инструмент был запущен не в рамках ChatGPT – платформы для чат-ботов OpenAI, а на отдельном сайте. Пока представлена только платная подписка, и на данный момент отсутствует бесплатная версия, предлагаются два тарифа, которые фактически являются подписками на ChatGPT.
Доступ к Sora будет открыт для пользователей в самое ближайшее время, и уже сейчас некоторые из них могут начать тестирование.
Sora – не первый проект, создающий видео на основе текстовых запросов. Летом 2023 года разработчики Stable Diffusion выпустили свою нейросеть Gen-2, которая также генерирует видеоконтент на основании текстов, серий изображений или другого видео. Однако качество и детализация таких видео пока остаются на достаточно низком уровне.
На днях OpenAI также анонсировала самую мощную и дорогую версию ChatGPT. Она работает медленнее, чем предыдущие модели, но и выдаёт более точные и детализированные ответы, благодаря чему способна на более глубокое "рассуждение".