O Google heeft deze dinsdag (14) zijn nieuwste videogeneratieve model aangekondigd, Veo, dat deel uitmaakt van de VideoFX-tool. De nieuwe functie maakt het mogelijk video's te maken op basis van tekstprompts en komt als concurrent aan Sora da OpenAI.
De tool werd aangekondigd in een live-uitzending tijdens de Google I / O 2024. Naast het mogelijk maken van inhoud, zal het platform interactie mogelijk maken met de andere technologieën van het bedrijf, zoals de tool voor het maken van muziek met behulp van AI.
Wat is Veo
Tijdens de onthulling van de nieuwste kunstmatige intelligentie, ontwikkeld door Google voor het maken van video's, werd een belangrijk punt benadrukt: Veo gaat verder dan de typische lengte van één minuut en biedt resultaten in een resolutie van 1080p en de mogelijkheid om een verscheidenheid aan filmische stijlen en beelden te verkennen.
Volgens het bedrijf beschikt deze AI over geavanceerde kennis van zowel natuurlijke taal als visuele semantiek, waardoor een nauwkeurigere weergave mogelijk is, zelfs met langere en gedetailleerdere opdrachten.
Google beweert dat Veo in staat is om consistente en samenhangende inhoud te genereren, waarin mensen, dieren en objecten realistisch door de video's bewegen. Bovendien is de tool in staat specifieke termen uit het filmische universum te begrijpen, zoals ‘timelapse’ en ‘luchtopname van een landschap’, waardoor een grotere creatieve controle over de gewenste resultaten wordt geboden.
De presentatie van de nieuwe AI was gericht op een groep filmmakers en makers, die de kans kregen om het model uit te proberen en feedback te geven aan het bedrijf, om bij te dragen aan mogelijke toekomstige verbeteringen.
Google heeft ook aangekondigd dat sommige Veo-functies geleidelijk zullen worden geïntegreerd in YouTube Shorts en andere bedrijfsproducten, zij het zonder hiervoor een datum te specificeren.
VideoFX
VideoFX is een portal die via de browser zelf toegankelijk is om Veo te gebruiken, een generatief model gemaakt door het bedrijf om te concurreren met Sora, van OpenAI. Momenteel is de nieuwigheid alleen in de Verenigde Staten in een experimentele fase verkrijgbaar.
Met slechts een tekst-, afbeelding- of videoprompt kunt u met de nieuwe functies video's van meer dan 60 seconden in verschillende visuele stijlen maken en bewerken, waardoor de gebruiker de meest verschillende ideeën kan verkennen.
Volgens Google biedt de tool naast het opnemen van muziek en geluidseffecten ook enkele bewerkingsopties, zoals de Storyboard-modus om aan de gegenereerde scènes te werken.
Inwoners van de Verenigde Staten hebben toegang tot de tool via een wachtlijst. Op dit moment is er geen voorspelling voor lancering in Brazilië en andere landen.
AfbeeldingFX
Google heeft ook Image 3 aangekondigd, beschikbaar in ImageFX van Google Labs. Hiermee is het mogelijk om compleet nieuwe afbeeldingen te maken op basis van een tekstprompt, iets dat erg lijkt op wat we bijvoorbeeld in MidJourney zien.
Met de derde generatie belooft Google dat gebruikers afbeeldingen zullen hebben die even getrouw zijn aan de werkelijkheid, dankzij verbeteringen in de kwaliteit en betrouwbaarheid van het genereren van afbeeldingen.
Volgens de Mountain View-gigant zal Imagem 3 zelfs woorden en zinnen in afbeeldingen kunnen plaatsen, iets dat nog steeds voor problemen zorgt op platforms met vergelijkbare voorstellen.
Musicfx
Google heeft ook nog een andere generatieve AI-tool aangekondigd voor het maken van muziek, MusicFX met AI Sandbox. De nieuwe functie, die in samenwerking met YouTube beschikbaar komt, zal rechtstreeks concurreren met bedrijven als Moises.ai, dat AI gebruikt om nummers van hetzelfde nummer te scheiden.
"Deze tools zijn ontworpen om een nieuwe speeltuin van creativiteit te openen, waardoor mensen vanaf het begin nieuwe instrumentale secties kunnen creëren, geluid op nieuwe manieren kunnen transformeren en nog veel meer.“, aldus Google tijdens de presentatie.
LeerLM
Ten slotte onthulde Google zijn nieuwe familie van generatieve AI-modellen die zijn afgestemd op leren. LearnLM is ontworpen om studenten op een “conversationele” manier te begeleiden over een verscheidenheid aan onderwerpen.
"LearnLM is gebaseerd op onderwijsonderzoek, waardoor leerervaringen persoonlijker en boeiender worden”, legde James Manyika, senior vice-president van onderzoek, technologie en samenleving bij Google Research, dinsdag uit bij Google I/O.
LearnLM wordt momenteel mogelijk gemaakt door functies in Google-producten, waaronder YouTube, de Gemini-apps van Google, Google Zoeken en Google Classroom.
In de Gemini-applicaties is het de komende maanden bijvoorbeeld mogelijk om gepersonaliseerde chatbots te creëren die als expert kunnen optreden over verschillende onderwerpen. Chatbots zorgen voor studiebegeleiding en praktische activiteiten, zoals quizzen en spelletjes, waarbij rekening wordt gehouden met de individuele voorkeuren van elke student.
Zie ook:
Bron: Google.
Ontdek meer over Showmetech
Meld u aan om ons laatste nieuws per e-mail te ontvangen.