Pekan ini, OpenAI mengumumkan layanan yang memungkinkan hampir siapa pun membangun versi kustom dari ChatGPT tanpa memerlukan keterampilan pemrograman. Perusahaan ini menyarankan pengguna untuk membuat bot yang mengerti aturan semua permainan papan, mengajari anak-anak tentang matematika, atau memberikan saran kuliner. ChatGPT, yang OpenAI sebut sebagai GPT (Generative Pre-trained Transformer), dapat melakukan tindakan sederhana dengan terhubung ke layanan internet, seperti mencari melalui surel atau memesan produk dari toko online.
Wajar bagi OpenAI untuk membangun sesuatu yang memanfaatkan kesuksesan ChatGPT. Namun, mungkin lebih banyak chatbot bukanlah apa yang kita butuhkan?
Adept AI, sebuah startup di San Francisco yang didirikan oleh para veteran dari OpenAI, Google, dan DeepMind, hari ini meluncurkan agen AI eksperimental yang mengotomatiskan tugas-tugas umum dengan cara yang lebih canggih dan berpotensi lebih kuat daripada chatbot seperti ChatGPT. ACT-2, yang berbeda dengan chatbot, berusaha menggunakan komputer lebih seperti manusia—dengan memahami piksel di layar dan kemudian mengambil tindakan untuk mengendalikan browser dan layanan online.
Demos dari Adept menunjukkan bagaimana ACT-2 dapat digunakan untuk mengumpulkan informasi dari surel dan dokumen untuk mengisi klaim asuransi, memasukkan informasi dari faktur yang dikirim melalui surel ke perangkat lunak akun bayar, dan merencanakan tur berjalan-jalan di kota dengan berinteraksi dengan Google Maps.
Cara ACT-2 mencoba menggunakan antarmuka pengguna yang sama dengan manusia menjanjikan kemampuan dan cakupan yang lebih luas. Dalam teori, pendekatan ini dapat memungkinkan chatbot melakukan apa pun yang mungkin dilakukan oleh seseorang di ponsel atau komputer mereka. Namun, cara ini juga lebih menantang untuk algoritma, dan saat ini membuat agen lebih rentan terhadap kesalahan.
Di balik layar, ACT-2 menggunakan model bahasa besar bernama Fuyu. Model ini mirip dengan yang menggerakkan banyak chatbot, tetapi seperti ChatGPT, itu dapat menangani baik teks maupun gambar (sehingga disebut “model multimodal”). Model menganalisis apa yang terlihat di layar komputer dan mencoba menerjemahkan permintaan yang ditulis oleh pengguna menjadi tindakan yang berguna yang harus diambil oleh bot. Adept menggunakan pembelajaran penguatan—teknik yang digunakan untuk mengajari komputer melakukan tugas-tugas termasuk bermain permainan papan dan permainan video—untuk mengajarkan AI-nya cara melakukan berbagai tugas. Ini melibatkan menonton banyak orang melakukan tugas-tugas tertentu dan mencoba mencapai kinerja serupa.
David Luan, pendiri dan CEO Adept, dan sebelumnya VP teknik di OpenAI, mengatakan bahwa meskipun chatbot telah memukau semua orang dengan kemampuannya, sulit untuk membuat agen AI bekerja secara dapat diandalkan. Tetapi ia percaya bahwa Adept dan orang lain semakin mendekati pemecahan masalah tersebut.
“Tahun ini mereka belum sampai di sana,” kata Luan tentang agen-agennya, termasuk ciptaannya sendiri. “Saya pikir yang akan terjadi adalah tahun depan akan ada perang besar seputar agen yang benar-benar berfungsi.” Adept awalnya merancang agennya untuk melakukan hanya sejumlah tugas kantor sederhana namun umum, dan dikatakan mereka sekarang setidaknya 95 persen dapat diandalkan, yang cukup untuk diterapkan secara komersial di beberapa perusahaan.
Mencapai tingkat keandalan itu bahkan hanya untuk tugas-tugas awal yang direncanakan untuk ACT-2 merupakan kemajuan besar. Selama bertahun-tahun, sudah ada alat untuk mengotomatiskan tugas-tugas kantor—yang dikenal sebagai otomasi proses robotik—tetapi ini sulit dibangun dan rentan rusak. Jika Adept dan yang lain dapat menggunakan AI untuk mengotomatiskan tugas-tugas lebih banyak secara dapat diandalkan, itu dapat mengubah pekerjaan kantor dan meningkatkan produktivitas.
Jika Luan benar, maka pertempuran untuk mengotomatiskan pekerjaan rumah tangga yang paling membosankan Anda mungkin membuat perang chatbot tahun 2023 tampak relatif tenang.
Sumber: MIT Technology Review
0 Comments