O Google объявила во вторник (14) о своей новейшей модели генерации видео Veo, которая является частью инструмента VideoFX. Новая функция позволит создавать видеоролики на основе текстовых подсказок и станет конкурентом Сора da OpenAI.
Инструмент был анонсирован в прямом эфире во время Google I / O 2024. Помимо создания контента, платформа позволит взаимодействовать с другими технологиями компании, такими как инструмент для создания музыки с использованием искусственного интеллекта.
Что такое Вео
Во время презентации новейшего искусственного интеллекта, разработанного Google для создания видео, был подчеркнут ключевой момент: Veo выходит за рамки типичной продолжительности в одну минуту, предлагая результаты в разрешении 1080p и возможность исследовать различные кинематографические стили и визуальные эффекты.
По заявлению компании, этот ИИ обладает передовыми знаниями как в естественном языке, так и в визуальной семантике, что позволяет обеспечить более точный рендеринг даже при использовании более длинных и подробных команд.
Google утверждает, что Veo способен генерировать последовательный и связный контент, в котором люди, животные и объекты реалистично перемещаются на протяжении всего видео. Кроме того, инструмент способен понимать определенные термины из кинематографической вселенной, такие как «таймлапс» и «аэросъемка пейзажа», что обеспечивает больший творческий контроль над желаемыми результатами.
Презентация нового ИИ была ориентирована на группу кинематографистов и авторов, которые имели возможность опробовать модель и оставить отзыв компании, способствуя возможным будущим улучшениям.
Google также объявила, что некоторые функции Veo будут постепенно интегрированы в YouTube Shorts и другие продукты компании, хотя и не уточнила дату этого.
ВидеоFX
VideoFX — это портал, доступ к которому осуществляется через сам браузер, позволяющий использовать Veo, генеративную модель, созданную компанией для конкуренции с Sora от OpenAI. На данный момент новинка доступна в экспериментальной стадии только в США.
Новые функции позволяют создавать и редактировать видеоролики продолжительностью более 60 секунд в различных визуальных стилях, используя всего лишь текстовую, графическую или видеоподсказку, позволяя пользователю исследовать самые разные идеи.
По данным Google, инструмент также предлагает некоторые возможности редактирования, такие как режим раскадровки для работы с сгенерированными сценами, в дополнение к включению музыки и звуковых эффектов.
Жители США могут получить доступ к инструменту через лист ожидания. На данный момент прогнозов по запуску в Бразилии и других странах нет.
ИмиджFX
Google также анонсировала Image 3, доступный в ImageFX от Google Labs. С его помощью можно создавать совершенно новые изображения на основе текстовой подсказки, что-то очень похожее на то, что мы видим, например, в MidJourney.
Google обещает, что в третьем поколении пользователи будут получать изображения, которые будут одинаково реалистичны благодаря улучшениям качества и точности генерации изображений.
По словам гиганта из Маунтин-Вью, Imagem 3 даже сможет размещать слова и фразы в изображениях, что до сих пор создает некоторые проблемы на платформах с аналогичными предложениями.
МузыкаFX
Google также анонсировала еще один генеративный инструмент искусственного интеллекта для создания музыки — MusicFX with AI Sandbox. Новая функция, появившаяся в сотрудничестве с YouTube, будет напрямую конкурировать с такими компаниями, как Moises.ai, которые используют искусственный интеллект для разделения треков одной и той же песни.
Эти инструменты призваны открыть новую площадку для творчества, позволяя людям создавать новые инструментальные секции с нуля, преобразовывать звук новыми способами и многое другое.«, заявил Google во время презентации.
УзнатьLM
Наконец, Google представила свое новое семейство генеративных моделей искусственного интеллекта, настроенных на обучение. LearnLM разработан, чтобы направлять студентов в «разговорном» виде по различным предметам.
LearnLM основан на исследованиях в области образования, что делает обучение более личным и увлекательным.— объяснил Джеймс Маньика, старший вице-президент по исследованиям, технологиям и обществу Google Research, на конференции Google I/O во вторник.
В настоящее время LearnLM использует функции продуктов Google, включая YouTube, приложения Google Gemini, Google Search и Google Classroom.
Например, в приложениях Gemini в ближайшие месяцы можно будет создавать персонализированных чат-ботов, которые смогут выступать в качестве экспертов по различным темам. Чат-боты будут предоставлять рекомендации по учебе и практические занятия, такие как викторины и игры, с учетом индивидуальных предпочтений каждого учащегося.
См. также:
источник: Google.
Узнайте больше о Showmetech
Подпишитесь, чтобы получать наши последние новости по электронной почте.