Du skriver en tekst med detaljer, venter en stund og så genereres et bilde som aldri er sett på internett basert på den skriftlige beskrivelsen. Slik kan vi forklare Bilde, ny AI Google som ble annonsert av selskapet som et interessant alternativ og som burde hjelpe industrien til å forstå mer om maskinlæring (maskinlæring).
Nyheten føyer seg sammen med andre alternativer for kunstig intelligens som allerede gjør den samme jobben, men nettleserselskapets fremskritt er større og resultatet er virkelig imponerende. Sjekk ut de første detaljene som er delt akkurat nå.
Maskinlæring avansert
Basert på kunstig intelligens-systemer Google Research, forskningsarm av Google, presenterte de første resultatene som ble opprettet – fortsatt i prototypefasen – med Bilde. Når du skriver tekst, er det bare å vente på at verktøyet skal lage et bilde fra bunnen av, uten å måtte sende en grafisk referanse. Tanken er å la verktøyet, gjennom kunstig intelligens-ressurser, få bilder av høy kvalitet bare ved å bruke tekstskriving som grunnlag.
I tester utført med "konkurrenter" som f.eks DALL-E, VQ-WIN+CLIP e Latent diffusjonsmodellen Google påpekte at Bilde klarte å levere bedre resultater, noe som setter verktøyet i søkelyset, i hvert fall foreløpig. Googles AI-arbeid foregår i 4 trinn, alt fra bildeskaping til tilpasning til høyere oppløsning.
Resultatene er imponerende, siden testene ble utført med tilfeldige ord som "Bamse svømmer i de olympiske leker 400 m sommerfugl". Noen tester gikk videre og det var mulig å se at utviklerne hadde det gøy i testene med Imagen, sjekk ut noen flere genererte bilder:
O Google er et av selskapene som har investert mest i kunstig intelligens-løsninger de siste årene og se bare på utviklingen innen Google Assistant for å få en liten forhåndsvisning. Mer enn et enkelt verktøy som aktiverer eller deaktiverer funksjoner på smarttelefonen din, den personlige assistenten er allerede i stand til å ringe i en naturlig tone, så vel som på noen enheter, det er ikke lenger nødvendig å si "Ok Google" for å fortsette en samtale med assistenten.
Under Google I / O 2022, en nyhet som tok navnet Pathways språkmodell (PALM) klarte å løse matematiske problemer med tekst, levere resultatet og forklaring på hvordan informasjonen ble innhentet.
Selskapet forventer at PALM kan brukes i forskjellige felt og gjennom maskinlæring, til og med å lære nye språk som ikke har høy flyt.
hvem kan bruke Bilde?
For nå, bruken av Googles AI den blir ikke offentliggjort på grunn av at selskapet har noen bekymringer om hvordan resultatene vil bli brukt. Siden dataene for å lage bilder ble hentet fra "en ukuratert nettskala", ifølge selskapet selv, er det en risiko for at tekst-til-bilde AI vil ende opp med å levere resultater som kan være støtende for noen minoriteter, enda mer. hvis du blir bedt om å lage bilder med folk. I de publiserte resultatene er det ingen bilder med personer, så vi vet fortsatt ikke hvordan dette ville skje i praksis.
Samtidig er Google Research påpeker at treningsfiltrene ble filtrert for upassende støy og innhold, som pornografi, rasistiske fornærmelser og sosiale stereotypier. Med andre ord: Ettersom opplæringen i kunstig intelligens ble utført basert på det som finnes på internett, frykter Google at Bilde brukes til å lage bilder som utløser angst eller andre problemer.
I publikasjonen som ga ut AI-resultatene, sendte Google også en melding til sine konkurrenter om å ta den samme forsiktighet når de trener deres kunstige intelligens for å lage bilder med mennesker.
Hva synes du om de første publiserte resultatene? Fortell oss Kommentar!
Se også
Sjekk ut alle detaljene om nye Google-produkter som ble vist frem under Google I/O 2022
Kilder: Google Research l CNET l Google Blog
Oppdag mer om Showmetech
Registrer deg for å motta siste nytt på e-post.