
OpenAI, perusahaan di balik ChatGPT, baru saja merilis Operator. Ini adalah layanan kecerdasan buatan generatif yang bertindak sebagai agen dan melakukan tugas atas nama Anda. Operator menggunakan browser mereka sendiri untuk melihat halaman web dan berinteraksi dengannya dengan mengetik, mengklik, dan menggulir sendiri tanpa masukan apa pun.
Peluncurannya akan dilakukan secara bertahap, dan yang pertama mendapatkannya adalah pelanggan ChatGPT Pro di Amerika Serikat.
Operator dapat menangani berbagai tugas browser yang berulang, dan OpenAI mengklaim dapat mengisi formulir, memesan bahan makanan, dan bahkan membuat meme. Ini dapat menggunakan antarmuka dan alat yang sama dengan yang digunakan untuk interaksi manusia, yang juga akan membantu bisnis menghadirkan peluang keterlibatan baru bagi mereka.
Pratinjau penelitian Operator, agen yang menggunakan browsernya sendiri untuk melakukan tugas untuk Anda. pic.twitter.com/wkBBDIlVqj
— OpenAI (@OpenAI) 23 Januari 2025
Operator didukung oleh model baru yang disebut CUA (Computer Usage Agent). Ini menggabungkan kemampuan visi GPT-4o dengan penalaran tingkat lanjut melalui pembelajaran penguatan. CUA dilatih untuk berinteraksi dengan GUI—antarmuka pengguna grafis dengan tombol, menu, dan bidang teks yang dilihat orang di layar.
Ketika layanan menemui kesulitan atau membutuhkan bantuan, layanan akan menyerahkan kendali kembali kepada Anda. Anda juga harus memasukkan data sensitif secara manual, seperti kata sandi atau formulir verifikasi lainnya.
Operator bekerja dengan layanan seperti Doordash, Etsy, Booking.com, Uber dan Instacart, serta melakukan penelitian melalui mitra media seperti The Associated Press dan Reuters.
sumber