Hanya dua bulan setelah peluncuran Gemini, model bahasa besar yang diharapkan Google akan membawanya ke puncak industri AI, perusahaan tersebut telah mengumumkan penggantinya. Google meluncurkan Gemini 1.5 hari ini dan menyediakannya bagi pengembang dan pengguna perusahaan sebelum segera diluncurkan ke konsumen secara penuh. Perusahaan telah memperjelas bahwa Gemini bertujuan untuk menjadi alat bisnis, asisten pribadi, dan segala sesuatu di antaranya, dan mereka berusaha keras untuk mewujudkan rencana tersebut.
Ada banyak peningkatan pada Gemini 1.5: Gemini 1.5 Pro, model serba guna dalam ekosistem Google, tampaknya setara dengan Gemini Ultra kelas atas yang baru saja diluncurkan perusahaan, dan mengungguli Gemini 1.0 Pro sebesar 87 persen. Dari tes referensi. Model ini dibuat menggunakan teknik yang semakin populer yang dikenal sebagai “campuran pakar”, atau MoE, yang berarti model ini hanya berfungsi pada sebagian model keseluruhan saat Anda mengirimkan kueri, dibandingkan memproses keseluruhan model sepanjang waktu. (Berikut penjelasan bagus tentang hal itu.) Pendekatan ini akan membuat formulir lebih cepat untuk Anda gunakan dan lebih efisien untuk dijalankan oleh Google.
Namun ada satu hal baru di Gemini 1.5 yang membuat seluruh perusahaan, dimulai dengan CEO Sundar Pichai, sangat bersemangat: Gemini 1.5 memiliki jendela konteks yang sangat besar, yang berarti dapat menangani pertanyaan yang jauh lebih besar dan melihat lebih banyak informasi sekaligus. Jendela ini berisi 1 juta karakter, dibandingkan dengan 128.000 pada OpenAI GPT-4 dan 32.000 pada Gemini Pro saat ini. Token adalah metrik yang sulit untuk dipahami (Berikut rincian yang bagus), jadi Pichai membuatnya lebih sederhana: “Ini sekitar 10 atau 11 jam video, dan puluhan ribu baris kode.” Jendela konteks berarti Anda dapat bertanya kepada bot AI tentang semua konten ini sekaligus.
(Pichai juga mengatakan bahwa peneliti Google sedang menguji jendela kontekstual 10 juta token — itu seperti keseluruhan rantai permainan singgasana Semua sekaligus.)
Saat dia menjelaskan hal ini kepada saya, Pichai berkomentar dengan acuh bahwa Anda bisa menyesuaikan semuanya Lord of the Rings Tiga kali lipat di jendela konteks itu. Tampaknya ini sangat spesifik, jadi saya bertanya kepadanya: Ini benar-benar terjadi, bukan? Seseorang di Google baru saja memeriksa apakah Gemini telah menemukan kesalahan kontinuitas, mencoba memahami garis keturunan Middle-earth yang kompleks, dan melihat apakah AI akhirnya dapat memahami Tom Bombadil. “Saya yakin ini pernah terjadi, atau akan terjadi — salah satu dari keduanya,” kata Pichai sambil tertawa.
Pichai juga percaya bahwa jendela konteks yang lebih besar akan sangat bermanfaat bagi bisnis. “Ini memungkinkan kasus penggunaan di mana Anda dapat menambahkan banyak konteks dan informasi pribadi pada saat melakukan kueri,” katanya. “Pikirkanlah karena kami telah memperluas jendela kueri secara signifikan.” Dia membayangkan para pembuat film mungkin mengunggah seluruh film mereka dan bertanya kepada Gemini apa yang akan dikatakan pengulas; Dia melihat perusahaan menggunakan Gemini untuk mencari catatan keuangan dalam jumlah besar. “Saya menganggapnya sebagai salah satu pencapaian terbesar kami,” katanya.
Untuk saat ini, Gemini 1.5 hanya akan tersedia untuk pengguna bisnis dan pengembang, melalui Vertex AI dan AI Studio milik Google. Pada akhirnya, ini akan menggantikan Gemini 1.0, versi standar Gemini Pro – versi yang tersedia untuk semua orang Gemini.google.com Dan dalam aplikasi perusahaan – ini akan menjadi versi 1.5 Pro dengan jendela konteks yang berisi 128.000 token. Anda harus membayar jumlah tambahan untuk mencapai 1 juta. Google juga menguji integritas model dan batasan etika, terutama yang berkaitan dengan jendela konteks baru yang lebih besar.
Google sedang berlomba-lomba untuk membangun alat AI terbaik saat ini, ketika perusahaan-perusahaan di seluruh dunia mencoba mencari tahu strategi AI mereka — dan apakah akan menandatangani kesepakatan pengembang mereka dengan OpenAI, Google, atau pihak lain. Baru minggu ini, OpenAI mengumumkan “memori” untuk ChatGPT, dan tampaknya siap diluncurkan dalam penelusuran web. Sejauh ini, Gemini tampil impresif, terutama bagi mereka yang sudah tergabung dalam ekosistem Google, namun masih banyak pekerjaan yang harus diselesaikan di semua aspek.
Pada akhirnya, Pichai memberi tahu saya, semua pertarungan 1.0, 1.5, plus, ultra, dan korporat ini tidak akan terlalu menjadi masalah bagi pengguna. “Orang hanya akan mengkonsumsi pengalaman,” katanya. “Ibarat menggunakan smartphone tanpa selalu memperhatikan prosesor di bawahnya.” Namun saat ini, katanya, kita masih berada pada titik di mana semua orang mengetahui chip apa yang ada di dalam ponsel mereka, karena itu penting. “Teknologi yang mendasarinya berubah dengan sangat cepat,” katanya. “Orang-orang peduli.”
“Hipster-friendly explorer. Award-winning coffee enthusiast. Analyst. Problem solver. Troublemaker.”
More Stories
YouTube mengumumkan fitur kecerdasan buatan dari Google DeepMind untuk pembuat video pendek
Foto pabrik dari prototipe Switch 2 bocor
Fitur unggulan iOS 18: Peningkatan layar beranda menambah tingkat penyesuaian yang luar biasa pada iPhone [Video]