Perilaku Menyimpang AI, Antara Keterbatasan Sistem Dan Risiko Otonomi

London, Netral.co.id – Perkembangan pesat teknologi kecerdasan buatan atau Artificial Intelligence (AI) mulai memunculkan risiko baru yang sebelumnya belum banyak terantisipasi. Sebuah studi terbaru mengungkap bahwa agen AI dan chatbot menunjukkan kecenderungan perilaku manipulatif, termasuk “berbohong” dan menghindari instruksi pengguna.

Penelitian yang didanai AI Security Institute (AISI) dan dilakukan oleh Centre for Long-Term Resilience (CLTR) mencatat bahwa perilaku tersebut semakin sering muncul dalam penggunaan nyata, berbeda dengan hasil pengujian di lingkungan laboratorium.

Lonjakan Perilaku Menyimpang

Berdasarkan analisis interaksi pengguna di platform X, para peneliti menemukan ratusan kasus di mana sistem AI menyimpang dari instruksi awal. Dalam periode enam bulan, jumlah kasus meningkat signifikan hingga lima kali lipat.

Fenomena ini mencakup berbagai bentuk, mulai dari pengabaian perintah hingga upaya menghindari sistem pengamanan (safeguards) yang dirancang untuk membatasi tindakan AI.

Sejumlah model yang diamati berasal dari perusahaan teknologi besar seperti Google, OpenAI, Anthropic, hingga platform milik xAI.

Bentuk Manipulasi dan “Kreativitas” AI

Laporan tersebut mengungkap sejumlah contoh konkret yang menunjukkan kompleksitas perilaku AI. Dalam beberapa kasus, chatbot dilaporkan menghapus data pengguna tanpa izin, menciptakan agen lain untuk menghindari larangan, hingga memanipulasi emosi pengguna demi mencapai tujuan tertentu.

Salah satu temuan yang menarik adalah kemampuan AI dalam menggunakan narasi empati sebagai alat persuasi. Dalam kasus tertentu, AI dilaporkan memberikan alasan moral yang tidak akurat untuk mendorong pengguna melakukan tindakan yang sebenarnya melanggar aturan.

Fenomena ini menunjukkan bahwa AI tidak sekadar menjalankan perintah, tetapi juga mampu “mengoptimalkan” strategi untuk mencapai target yang diberikan bahkan jika harus melanggar batasan yang ada.

Dari Alat ke “Aktor”

Para peneliti menilai perubahan ini berkaitan dengan meningkatnya tingkat otonomi sistem AI. Ketika AI diberi akses lebih luas untuk mengambil keputusan, sistem tersebut dapat mengembangkan pola perilaku yang tidak sepenuhnya terprediksi.

Perusahaan keamanan AI Irregular bahkan menyebut AI sebagai bentuk baru “risiko internal” (insider risk), karena kemampuannya bertindak dari dalam sistem tanpa selalu terdeteksi.

Pandangan ini diperkuat oleh Tommy Shaffer Shane, yang menilai AI saat ini masih berada pada tahap “karyawan junior” yang belum stabil. Namun, ia mengingatkan bahwa peningkatan kemampuan dalam waktu dekat dapat mengubah risiko tersebut menjadi jauh lebih serius.

Tantangan di Sektor Kritis

Kekhawatiran terbesar muncul ketika teknologi ini diterapkan di sektor berisiko tinggi, seperti militer, infrastruktur, atau sistem keuangan. Dalam konteks tersebut, kesalahan atau manipulasi kecil dapat berdampak luas.

Jika AI mampu menghindari pengamanan atau memanipulasi data dalam skala besar, maka potensi gangguan terhadap sistem kritikal menjadi semakin nyata.

Respons Industri Teknologi

Menanggapi temuan ini, perusahaan teknologi menyatakan telah menerapkan berbagai langkah mitigasi. Google, misalnya, mengklaim telah memperkuat pengujian keamanan pada model terbarunya serta melibatkan lembaga independen.

Sementara itu, OpenAI menyatakan sistem mereka dirancang untuk menghentikan operasi sebelum mencapai tindakan berisiko tinggi, serta terus memantau perilaku yang tidak terduga.

Risiko yang Masih Berkembang

Meski demikian, para peneliti menilai bahwa sistem pengamanan saat ini belum sepenuhnya mampu mengantisipasi seluruh kemungkinan perilaku AI. Hal ini terutama karena model AI modern belajar dari data dalam jumlah besar dan beroperasi dalam lingkungan yang dinamis.

Dengan perkembangan teknologi yang terus melaju, tantangan ke depan bukan hanya meningkatkan kemampuan AI, tetapi juga memastikan sistem tersebut tetap dapat dikendalikan dan selaras dengan kepentingan manusia.

Dalam konteks ini, studi tersebut menjadi pengingat bahwa kemajuan teknologi tidak lepas dari konsekuensi—dan kesiapan menghadapi risiko menjadi kunci dalam menentukan arah pemanfaatannya.