
OpenAI telah meluncurkan Operator, agen AI yang sebagian besar otonom yang dirancang untuk mengambil perintah teks sederhana Anda dan mengubahnya menjadi tugas dunia nyata yang diselesaikan melalui internet. Secara teori, Anda dapat memintanya melakukan hampir semua hal yang mungkin dilakukan melalui browser web. Dalam praktiknya, pengguna awal tampaknya mendapati hasil yang kurang tepat.
Contoh hal yang dapat dilakukan Operator adalah memesan perjalanan, membuat reservasi restoran untuk waktu tertentu, atau mungkin membeli tiket konser band tertentu dalam kisaran harga tertentu.
Saat ini dirilis sebagai pratinjau penelitian yang hanya tersedia untuk pelanggan ChatGPT Pro dan bukan produk yang sepenuhnya matang, Operator didasarkan pada model Agen Penggunaan Komputer (CUA) OpenAI, yang menggabungkan kemampuan visi komputer dari GPT-4o dengan antarmuka pengguna grafis (GUI) tertentu. ) pelatihan dan penalaran tingkat lanjut untuk membuat alat yang mampu menjelajahi web, merumuskan tugas multi-langkah dari prompt teks dan menjalankan keseluruhan shebang.
Bisa dibilang, Operator tidak unik, apalagi UI-TARS ByteDance dan Penggunaan Komputer Anthropic memiliki kewenangan yang agak mirip. Namun mungkin yang membuat Operator sedikit berbeda adalah tidak memerlukan API.
“Operator dapat 'melihat' (melalui tangkapan layar) dan 'berinteraksi' (menggunakan semua tindakan yang dimungkinkan oleh mouse dan keyboard) dengan browser, sehingga memungkinkannya mengambil tindakan di web tanpa memerlukan integrasi API khusus,' kata OpenAI.
Meskipun demikian, sepertinya akan membantu jika layanan web dioptimalkan untuk Operator. “Kami berkolaborasi dengan perusahaan seperti DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber, dan lainnya untuk memastikan Operator memenuhi kebutuhan dunia nyata sambil menghormati norma yang ada,” kata OpenAI.
Agaknya, hasil Anda—atau haruskah itu hasil Operator?—tidak akan seakurat layanan yang tidak dioptimalkan.
Seberapa baik Operator saat ini dalam mengambil prompt dan menjalankannya tidak sepenuhnya jelas. OpenAI sendiri mengatakan model CUA menghasilkan tingkat keberhasilan 38,1% pada pengujian benchmark OSWorld untuk tugas penggunaan komputer penuh, 58,1% untuk WebArena, dan 87% pada WebVoyager untuk tugas berbasis web.
Sementara itu, beberapa pengguna awal melaporkan bahwa Operator mungkin lebih rentan terhadap halusinasi dibandingkan versi terbaru dari ChatGPT itu sendiri. Misalnya, seorang pengguna mengklaim bahwa ketika ditugaskan untuk membuat daftar influencer online dan membuat tabulasi rincian kontak mereka, Operator membuat semua rinciannya.
Beberapa pengguna juga melaporkan bahwa Operator sangat lambat, sesuatu yang tampaknya sesuai dengan demo video yang diposting oleh OpenAI. Ini bukan sekedar masukan dari mouse, itu sudah pasti.
Jadi, sepertinya Anda berani meminta Operator untuk berbelanja bahan makanan minggu depan dan mengharapkan semua barang yang tepat akan muncul, atau mungkin apa pun akan muncul.
Pertanyaan besarnya adalah seberapa cepat Operator versi beta awal ini akan berkembang menjadi sesuatu yang dapat diandalkan dan berguna secara luas. Dan tentu saja betapa amannya jika dan kapan hal itu terjadi.
“Kami tahu pelaku jahat mungkin mencoba menyalahgunakan teknologi ini. Itu sebabnya kami merancang Operator untuk menolak permintaan berbahaya dan memblokir konten yang tidak diizinkan,” kata OpenAI, juga menjelaskan bahwa Operator telah dirancang untuk menangani situs web yang mungkin mencoba membajak AI. agen dengan perintah tersembunyi, kode berbahaya, atau upaya phishing.
Untuk saat ini, semua hal tersebut pada akhirnya tidak dapat dibayangkan. Namun, baik atau buruk, sepertinya Anda akan segera dapat menyerahkan beberapa tugas rutin online Anda kepada agen AI.