Selama lebih dari setahun, Google telah berlomba untuk membangun teknologi yang dapat menandingi ChatGPT, chatbot pembuka mata yang ditawarkan oleh startup AI San Francisco, OpenAI.
Pada hari Rabu, raksasa teknologi ini mengambil langkah lain dalam perlombaan yang sedang berlangsung, meluncurkan versi baru chatbot-nya, Google Bard. Bot yang diperbarui ini akan segera tersedia bagi penutur bahasa Inggris di lebih dari 170 wilayah dan negara, termasuk AS, dan didukung oleh teknologi AI baru yang disebut Gemini, yang telah dikembangkan perusahaan sejak awal tahun.
“Ini adalah awal dari era Gemini,” kata CEO Google Sundar Pichai dalam sebuah wawancara. “Ini merupakan pemenuhan visi yang kami miliki ketika kami menciptakan Google DeepMind, laboratorium kecerdasan buatan milik perusahaan. Google akan meluncurkan tiga versi teknologi yang berbeda dalam berbagai produk dan layanan dalam beberapa bulan mendatang,” katanya.
Pichai dan Demis Hassabis, yang mengawasi Google DeepMind, mengatakan Gemini lebih kuat daripada teknologi chatbot Google sebelumnya, dan dapat menghasilkan respons yang lebih akurat dan hampir meniru pemikiran manusia dalam beberapa situasi.
“Kami sangat senang dengan kinerja Gemini,” kata Dr. Hassabis.
Ketika OpenAI memukau dunia dengan chatbot ChatGPT yang didukung AI akhir tahun lalu, Google terkejut. Raksasa teknologi ini telah menghabiskan waktu bertahun-tahun untuk mengembangkan teknologi serupa, namun seperti raksasa teknologi lainnya – terutama Meta – enggan merilis teknologi yang dapat menghasilkan informasi yang bias, salah, atau beracun.
Pada bulan Maret, Google meluncurkan chatbotnya, Bard, untuk mendapatkan ulasan rata-rata. Sebulan kemudian, perusahaan mengumumkan bahwa mereka telah menggabungkan dua laboratorium kecerdasan buatannya – Google Brain dan DeepMind – yang menyatukan lebih dari 2.000 peneliti dan insinyur. Dan pada bulan Mei, pada konferensi Google I/O yang inovatif, diumumkan bahwa lab DeepMind Google yang baru telah mulai mengembangkan Gemini.
Setelah mendirikan Brain Lab pada tahun 2011, Google mengakuisisi DeepMind pada tahun 2014, membayar $650 juta untuk startup AI di London. DeepMind sebagian besar beroperasi secara independen dari Brain Lab dan Google lainnya selama satu dekade, dan bahkan mencoba keluar dari perusahaan tersebut pada tahun 2017. Namun ketika Google kesulitan mengejar OpenAI, Mr. Pichai menggabungkan kedua lab tersebut di bawah Dr. Hassabis, sebuah ahli saraf yang ikut mendirikan DeepMind.
Google telah merilis hasil benchmark yang mengklaim bahwa versi paling kuat dari Gemini mengungguli teknologi OpenAI terbaru, GPT-4, di beberapa bidang utama. Pichai mengatakan teknik ini lebih baik dalam menghasilkan kode komputer dibandingkan teknik Google sebelumnya, dan dapat meringkas artikel berita dan dokumen teks lainnya dengan lebih akurat.
Gemini juga dirancang untuk menganalisis gambar dan suara, tetapi keterampilan ini tidak akan dimasukkan ke dalam chatbot Bard sampai nanti.
Google telah membuat tiga versi Gemini dengan tiga keahlian berbeda. Yang terbesar, Ultra, dirancang untuk menangani tugas-tugas kompleks dan akan debut tahun depan. Pro, penawaran tingkat menengah, akan diluncurkan ke beberapa layanan Google, mulai Rabu, menggunakan chatbot Bard. Nano, versi yang lebih kecil, akan mendukung beberapa fitur pada smartphone Pixel 8 Pro, seperti meringkas rekaman audio dan menawarkan balasan teks yang disarankan di WhatsApp mulai Rabu.
Gemini adalah apa yang para ilmuwan sebut sebagai model bahasa besar, atau LLM, sebuah sistem matematika kompleks yang dapat mempelajari keterampilan dengan menganalisis sejumlah besar data, termasuk buku digital, artikel Wikipedia, dan papan buletin online. Dengan mengidentifikasi pola dalam semua teks ini, LLM belajar membuat teks sendiri. Artinya dia bisa menulis makalah penelitian, membuat kode komputer, dan bahkan melakukan percakapan.
Melalui Gemini, Google juga telah melatih teknologi gambar dan suara digital. Inilah yang para peneliti sebut sebagai sistem “multimodal”, artinya sistem ini dapat menganalisis dan merespons gambar dan suara. Jika Anda memberinya soal matematika yang melibatkan garis, bentuk, dan gambar lain, misalnya, dia mungkin akan menjawab dengan cara yang sama seperti siswa sekolah menengah.
Namun, teknologi ini baru akan tersedia bagi konsumen pada tahun depan. Google juga mengakui bahwa Gemini, seperti sistem serupa, rentan terhadap kesalahan. Bisa salah mengartikan fakta atau bahkan “berhalusinasi” – mengada-ada.
Google Cloud, yang menyediakan layanan AI dan komputasi untuk perusahaan lain, sangat ingin menyediakan Gemini kepada pelanggan saat bersaing untuk mendapatkan kesepakatan melawan OpenAI dan Microsoft. Setelah OpenAI sempat memaksa Sam Altman, CEO-nya, untuk mengundurkan diri bulan lalu, meninggalkan perusahaan dalam ketidakpastian, Google Cloud membuat rencana migrasi dalam upaya untuk memburu pelanggan pesaingnya.
Pelanggan dapat membayar Google dengan harga yang sama dengan harga OpenAI mereka saat ini dan menerima kredit atau diskon cloud.
Google mengatakan pelanggan cloud akan memiliki akses ke Gemini Pro – penawaran tingkat menengah – pada 13 Desember. Pichai mengatakan beberapa orang asing kini sedang menguji Gemini Ultra – versi paling kuat dari teknologi tersebut.
Meskipun Google telah menghabiskan satu tahun terakhir berlomba untuk mendapatkan kembali kepemimpinan AI dari OpenAI, Pichai mengatakan ada cukup ruang di pasar untuk semua penyedia AI.
“Ini jauh dari permainan zero-sum,” kata Pichai. “Kami sangat gembira dengan apa yang kami luncurkan. Kami juga menyadari bahwa ini masih sangat awal karena kami dapat melihat kemajuan yang kami capai dalam tindak lanjutnya.
“Hipster-friendly explorer. Award-winning coffee enthusiast. Analyst. Problem solver. Troublemaker.”
More Stories
YouTube mengumumkan fitur kecerdasan buatan dari Google DeepMind untuk pembuat video pendek
Foto pabrik dari prototipe Switch 2 bocor
Fitur unggulan iOS 18: Peningkatan layar beranda menambah tingkat penyesuaian yang luar biasa pada iPhone [Video]