Gemini 1 pro

Pembaruan Gemini 1.5 Pro membuat AI mendengarkan dan menghasilkan konten

Avatar João Lucas Batista
Dengan pembaruan baru, kecerdasan buatan Google kini memahami dan menganalisis audio. Imagen 2 sekarang dapat menambah dan menghapus elemen gambar dan membuat GIF 4 detik

A Kecerdasan Buatan Google, atau Gemini, menerima pembaruan baru dan inovatif pada Selasa ini, 9 April, selama Google Cloud Selanjutnya. Dengan peningkatan tersebut, Gemini 1.5 Pro, memperoleh kemampuan untuk memahami dan menganalisis jalur audio dan video, menghasilkan konten berdasarkan apa yang dimasukkan ke dalam aplikasi.

Awalnya, fitur baru ini hanya tersedia untuk pengguna Verteks AI, perangkat lunak yang ditujukan Mesin belajar (pembelajaran mesin), digunakan oleh pemrogram dan ilmuwan untuk mengembangkan AI baru.

Apa yang dilakukan Gemini, AI Google?

Pembaruan Gemini 1 pro membuat ia mendengarkan dan menghasilkan konten. Dengan pembaruan baru, kecerdasan buatan Google kini memahami dan menganalisis audio. Imagen 5 sekarang dapat menambah dan menghapus elemen gambar dan membuat gif berdurasi 2 detik
Antarmuka Gemini. Gambar: Lucas Gomes/ Showmetech

O Gemini, Kecerdasan Buatan Google, diluncurkan pada Desember tahun lalu, menggantikan Bard, dan menonjol karena kemampuannya menangani tugas-tugas yang sangat kompleks, mulai dari pengkodean hingga penalaran logis yang halus.

Kecerdasan Buatan memiliki fungsi yang dapat membantu pengguna dalam berbagai tugas, memanipulasi berbagai macam file, dengan tujuan menggabungkan berbagai jenis informasi, selain mengaturnya. Kemampuannya memungkinkan Anda menggunakan berbagai format konten, termasuk:

  • teks;
  • gambar-gambar;
  • audio;
  • video; Dia
  • bahasa pemrograman.

O Gemini Ini memiliki tiga mode operasi, dengan kekhususan berbeda:

  • Gemini Ultra — lebih besar dan lebih mampu untuk melakukan tugas-tugas yang sangat kompleks;
  • GeminiPro — terbaik untuk menskalakan berbagai macam tugas;
  • Kurcaci Gemini — lebih efisien untuk tugas seluler.

Pembaruan Gemini 1.5 Pro dan fungsi barunya

Pembaruan Gemini 1 pro membuat ia mendengarkan dan menghasilkan konten. Dengan pembaruan baru, kecerdasan buatan Google kini memahami dan menganalisis audio. Imagen 5 sekarang dapat menambah dan menghapus elemen gambar dan membuat gif berdurasi 2 detik
Gemini IA. Gambar: rafare/Shutterstock)

Model baru yang dihadirkan oleh raksasa teknologi ini mewakili kemajuan yang signifikan dibandingkan model sebelumnya, dengan peningkatan kinerja dan pemahaman dalam konteks jangka panjang. Gemini 1.5 Pro, yang merupakan versi awal yang tersedia untuk pengujian, dioptimalkan untuk berbagai tugas dan lebih efisien dalam hal komputasi, menjadi versi yang lebih tangguh dan mampu memenuhi persyaratan aktivitas yang lebih kompleks.

Selain itu, Gemini 1.5 Pro berisi sumber daya eksperimental, yang, secara teori, dapat diproses hingga 1 juta token untuk model dasar skala besar, yang akan menjadi revolusioner. Menurut Google, jumlah yang sangat besar ini mewakili 700.000 kata dan 30.000 baris kode, yang setara dengan satu jam video ou 11 jam audio.

Alat baru di Gemini 1.5 Pro memungkinkan aplikasi untuk mempertimbangkan antara gambar (bingkai) dan audio (ucapan) untuk video yang diunggah di Google AI Studio, yang akan memfasilitasi produksi konten. Sesuai informasi resmi, pembaruan AI Google tersedia di lebih dari 180 negara melalui Gemini API (Application Programming Interface, dalam bahasa Portugis), dengan kemampuan asli yang belum pernah ada sebelumnya untuk memahami audio dan API baru yang memfasilitasi penanganan file.

Rilis ini juga dilengkapi instruksi sistem dan fitur mode baru. JSON (format data ringan untuk pertukaran informasi antar sistem komputer). Percaya pada potensi pembaruan baru, Google berjanji bahwa model penyematan teks mengungguli pesaing dengan fungsi serupa.

O Gemini 1.5 Pro saat ini hanya tersedia melalui Verteks AI.

Gambar 2 dapat membuat GIF

selama acara Google Cloud Selanjutnya, pengumuman penting lainnya dibuat oleh Google: model AI Gambar 2, yang dapat menghasilkan gambar dan video pendek meminta teks. Dengan ini, dimungkinkan untuk membuat GIF hingga empat detik dari sudut kamera berbeda dan juga menunjukkan gerakan.

Perbedaannya dengan alat ini justru pada kemungkinan penjelajahannya sudut yang berbeda, dengan lebih banyak dinamisme dalam adegan, jauh melampaui video AI yang dihasilkan dengan foto statis dan gerakan terbatas.

Contoh kreasi dari Imagen 2 di Vertex IA. Video: Google Cloud/ YouTube

O Gambar 2 memiliki kemampuan menghasilkan klip video, juga dikenal sebagai gambar langsung, dengan resolusi rendah X 640 360. Selain itu, Google menggunakan tekniknya SynthID untuk menerapkan a tanda air yang tidak terlihat dalam klip dan gambar yang dihasilkan AI. Perusahaan mengklaim bahwa SynthID dapat mendukung pengeditan dan bahkan kompresi, tindakan yang bertujuan untuk mempromosikan keamanan data.

Sampai saat ini, sumber daya Gambar 2 hanya tersedia melalui Verteks AI, yang kini mencakup dukungan untuk pengecatan internal dan eksternal, serta kemampuan untuk mengedit gambar menggunakan AI, memungkinkan Anda memperluas batas atau menambah/menghapus bagian tertentu dari gambar. Alat yang ditujukan untuk profesional pemasaran dan pembuatan konten untuk kampanye, di antara iklan dan platform video lainnya.

Verteks AI

Pembaruan Gemini 1 pro membuat ia mendengarkan dan menghasilkan konten. Dengan pembaruan baru, kecerdasan buatan Google kini memahami dan menganalisis audio. Imagen 5 sekarang dapat menambah dan menghapus elemen gambar dan membuat gif berdurasi 2 detik
Platform AI Vertex. Gambar: Google/Reproduksi

O Verteks AI adalah platform Mesin belajar (ML) yang memungkinkan pelatihan dan penerapan alat dan aplikasi AI, termasuk penyesuaian model bahasa besar (LLM) untuk digunakan dalam aplikasi yang didukung AI.

Platform ini mengumpulkan beragam kemampuan dan aplikasi Google, mengintegrasikan rekayasa data, ilmu data, dan alur kerja rekayasa data. Mesin belajar, memungkinkan kolaborasi antar tim melalui seperangkat alat umum, serta menskalakan aplikasi dengan manfaat Google Cloud.

A Verteks AI menawarkan beberapa opsi untuk pelatihan dan penerapan model:

  • ML Otomatis memungkinkan Anda melatih data tabel, gambar, teks, atau video tanpa perlu menulis kode, atau menyiapkan pemisahan data.
  • Pelatihan yang dipersonalisasi memberi Anda kendali penuh atas proses pelatihan, termasuk penggunaan kerangka kode ML pilihan, pengkodean pelatihan sendiri, dan pemilihan opsi penyetelan hyperparameter.
  • taman model Memungkinkan penemuan, pengujian, penyesuaian, dan penerapan model Vertex AI, termasuk pemilihan model dan sumber daya sumber terbuka (OSS).
  • A AI generatif menawarkan akses ke model AI generatif Google yang besar dalam berbagai modalitas (teks, kode, gambar, ucapan). Anda dapat menyesuaikan Google LLM untuk memenuhi kebutuhan Anda dan menerapkannya untuk digunakan dalam aplikasi yang didukung AI.

Sumber: Verge, Google untuk Pengembang, panduan Tom, Beebom, Google Cloud

Lihat juga:

Diperiksa oleh Glaucon Vital pada 10/4/24.

Daftar untuk menerima berita kami:

Tinggalkan komentar

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

Pos terkait