Bilder laget av Googles AI

Imagen, Googles AI, lager bilder fra tekst

victor pacheco avatar
Imagen er et verktøy som klarer å generere et bilde med kun tekstbeskrivelsen, uansett hvor tilfeldig det måtte være

Du skriver en tekst med detaljer, venter en stund og så genereres et bilde som aldri er sett på internett basert på den skriftlige beskrivelsen. Slik kan vi forklare Bilde, ny AI Google som ble annonsert av selskapet som et interessant alternativ og som burde hjelpe industrien til å forstå mer om maskinlæring (maskinlæring). 

Nyheten føyer seg sammen med andre alternativer for kunstig intelligens som allerede gjør den samme jobben, men nettleserselskapets fremskritt er større og resultatet er virkelig imponerende. Sjekk ut de første detaljene som er delt akkurat nå. 

Maskinlæring avansert

Basert på kunstig intelligens-systemer Google Research, forskningsarm av Google, presenterte de første resultatene som ble opprettet – fortsatt i prototypefasen – med Bilde. Når du skriver tekst, er det bare å vente på at verktøyet skal lage et bilde fra bunnen av, uten å måtte sende en grafisk referanse. Tanken er å la verktøyet, gjennom kunstig intelligens-ressurser, få bilder av høy kvalitet bare ved å bruke tekstskriving som grunnlag.

Eksempelbilde laget av google imagen
Arbeid fra Google Research resulterte i den første prototypen av Google Image
(Skjermbilde: Victor Pacheco/Showmetech)

I tester utført med "konkurrenter" som f.eks DALL-E, VQ-WIN+CLIP e Latent diffusjonsmodellen Google påpekte at Bilde klarte å levere bedre resultater, noe som setter verktøyet i søkelyset, i hvert fall foreløpig. Googles AI-arbeid foregår i 4 trinn, alt fra bildeskaping til tilpasning til høyere oppløsning. 

Tekst til bilde AI-bildeopprettingsprosess
Bilder lages i fire trinn for å oppnå det endelige resultatet
(Foto: Reproduksjon/Google)

Resultatene er imponerende, siden testene ble utført med tilfeldige ord som "Bamse svømmer i de olympiske leker 400 m sommerfugl". Noen tester gikk videre og det var mulig å se at utviklerne hadde det gøy i testene med Imagen, sjekk ut noen flere genererte bilder: 

  • Bilde generert av google tekst til bilde AI
  • En hjerne som kjører på en rakett på vei mot månen.
  • Hundebilde generert av google image
  • En forkrommet and med gullnebb krangler med en sint skilpadde i en skog.

 

 

O Google er et av selskapene som har investert mest i kunstig intelligens-løsninger de siste årene og se bare på utviklingen innen Google Assistant for å få en liten forhåndsvisning. Mer enn et enkelt verktøy som aktiverer eller deaktiverer funksjoner på smarttelefonen din, den personlige assistenten er allerede i stand til å ringe i en naturlig tone, så vel som på noen enheter, det er ikke lenger nødvendig å si "Ok Google" for å fortsette en samtale med assistenten. 

Under Google I / O 2022, en nyhet som tok navnet Pathways språkmodell (PALM) klarte å løse matematiske problemer med tekst, levere resultatet og forklaring på hvordan informasjonen ble innhentet. 

google palm
Google presenterte AI-funksjon som kan løse matematiske problemer i begynnelsen av mai
(Foto: Reproduksjon/Google)

Selskapet forventer at PALM kan brukes i forskjellige felt og gjennom maskinlæring, til og med å lære nye språk som ikke har høy flyt. 

hvem kan bruke Bilde?

For nå, bruken av Googles AI den blir ikke offentliggjort på grunn av at selskapet har noen bekymringer om hvordan resultatene vil bli brukt. Siden dataene for å lage bilder ble hentet fra "en ukuratert nettskala", ifølge selskapet selv, er det en risiko for at tekst-til-bilde AI vil ende opp med å levere resultater som kan være støtende for noen minoriteter, enda mer. hvis du blir bedt om å lage bilder med folk. I de publiserte resultatene er det ingen bilder med personer, så vi vet fortsatt ikke hvordan dette ville skje i praksis. 

Eksempel på bilde laget av google imagen
Verktøyet vil ikke bli utgitt for offentligheten, i hvert fall i dette første øyeblikket
(Foto: Reproduksjon/Google)

Samtidig er Google Research påpeker at treningsfiltrene ble filtrert for upassende støy og innhold, som pornografi, rasistiske fornærmelser og sosiale stereotypier. Med andre ord: Ettersom opplæringen i kunstig intelligens ble utført basert på det som finnes på internett, frykter Google at Bilde brukes til å lage bilder som utløser angst eller andre problemer. 

Eksempel på bilde laget av google imagen
Selskapet er bekymret for hvordan AI kan brukes til å generere ubehagelige bilder
(Foto: Reproduksjon/Google)

I publikasjonen som ga ut AI-resultatene, sendte Google også en melding til sine konkurrenter om å ta den samme forsiktighet når de trener deres kunstige intelligens for å lage bilder med mennesker. 

Hva synes du om de første publiserte resultatene? Fortell oss Kommentar

Se også 

Sjekk ut alle detaljene om nye Google-produkter som ble vist frem under Google I/O 2022

Kilder: Google Research l CNET l Google Blog


Oppdag mer om Showmetech

Registrer deg for å motta siste nytt på e-post.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Relaterte innlegg