
Oleh John de Santo
Uji kecerdasan modern pertama kali terhadap manusia dikembangkan oleh Alfred Binet (1857-1911) dan Theodore Simon (1873-1961). Ketika itu keduanya termasuk dalam kelompok ilmuwan yang memikirkan perlunya pengujian terhadap kecerdasan manusia. Pertanyaannya, apakah tes IQ tradisional dapat dilakukan juga terhadap Kecerdasan Buaan (Artificial Intelligence); apa hasil dan relevansinya?
Binet dan Simon adalah dua pakar pendidikan yang ketika itu diminta oleh Kementrian Pendidikan Perancis untuk mengembangkan sebuah metode pengujian yang dapat membedakan anak-anak yang mengalami keterlambatan mental (mentally retarded) dari anak-anak yang normal secara inteligen.
Sebagai tanggapan terhadap tugas tersebut, keduanya mengembangkan seperangkat tugas yang digunakan untuk menilai berbagai kemampuan kognitif yang tidak hanya diajarkan dalam lingkup sekolah. Tes itu mencakup 30 pertanyaan yang berpusat pada perhatian (attention), ingatan (memory), dan keterampilan pemecahan masalah (problem-solving skills). Metode ini kemudian dikenal sebagai skala Binet-Simon. Sebuah inovasi kunci yang juga dikenalkan Binet adalah konsep mengenai usia mental (mental age) dengan membandingkan kinerja anak dalam tugas-tugas ini dengan kinerja rerata anak pada usia yang berbeda.
Meskipun metode itu sudah ketinggalan dan tidak terpakai lagi untuk mengukur tingkat kecerdasan manusia, asumsi mereka tetap penting bagi pengembangan pengujian terhadap kecerdasan manusia. Meskipun penting, skala Binet-Simon memiliki keterbatasan. Binet sendiri mengingatkan untuk nghindari penafsiran skor sebagai ukuran yang kaku terhadap tingkat kecerdasan. Menurutnya, kecerdasan itu kompleks dan dipengaruhi oleh variabel lain, termasuk lingkungan dan pendidikan. Menurutnya, tes IQ seharusnya tidak digunakan untuk melabel anak secara permanen. Ia hanya alat untuk mengidentifikasi mereka yang mungkin terbantu dengan dukungan tambahan.
Seiring berjalannya waktu, berbagai ragam tes IQ telah dikembangkan dengan menggunakan metode dan fokus yang berbeda. Ada yang menekankan kemampuan verbal, sedangkan yang lain menilai penalaran verbal atau kemampuan spasial. Meskipun tes IQ secara luas masih digunakan dalam berbagai seting pendidikan dan asesmen psikologis hingga dewasa ini, hasil tes-tes IQ tidak luput dari berbagai kritikan sehubungan dengan bias budaya dan kemampuan (atau ketidakmampuan) tes-tes tersebut untuk menangkap spektrum keseluruhan dari kecerdasan manusia.
Sementara itu, tes IQ selama ini berfungsi sebagai: 1) Peniliaan pendidikan. Tes IQ membantu mengidentifikasi para siswa yang membutuhkan layanan pendidikan khusus atau ditempatkan pada kelas tertentu. 2) Penilaian psikologis. Para ahli klinis menggunakan tes IQ sebagai bagian dari penilaian komprehensif untuk mendiagnosis ketidakmampuan belajar atau kekurangan intelektual. 3) Tujuan penelitian. Para peneliti menggunakan skor IQ dalam berbagai uji terhadap pengembangan kognitif dalam populasi manusia yang beragam. 4) Penyaringan tenaga kerja. Banyak organisasi yang menggunakan tes IQ (psikotes) dalam proses perekrutan tenaga kerja untuk menilai kemampuan pemecahan masalah dari calon pekerja potensial.
Kinerja AI atas Tes IQ
Tes IQ tradisional sudah pernah dilakukan terhadap Kecerdasan Buatan untuk menguji sistem AI. Misalnya, ChatGPT diuji pada beberapa subtes dari WAIS III, dengan pencapaian skor IQ Verbal 155. Chatbot secara khusus unggul terutama dalam tugas-tugas verbal yang melibatkan kosakata, pengetahuan, dan memori terhadap informasi umum. Namun demikian, Chatbot tidak dapat berpartisipasi dalam subtes nonverbal karena kurangnya persepsi sensorik.
Meskipun robot AI dapat memproses bahasa dan memecahkan masalah secara efektif dalam parameter tertentu, ia tidak memiliki pemahaman dan kecerdasan emosional yang lebih luas seperti manusia. Dengan demikian, hubungan antara tes IQ dan kecerdasan buatan (AI) sangat kompleks, karena melibatkan pemahaman kemampuan sistem AI dan sifat kecerdasan manusia yang diukur dengan tes standar tradisional. Terlepas dari skor yang mengesankan pada tugas-tugas tertentu, sistem AI menghadapi keterbatasan yang signifikan dalam hal aspek kognisi manusia yang lebih dalam.
Ketika para peneliti terus mengeksplorasi cara terbaik untuk mengukur kecerdasan pada mesin versus manusia, ada penekanan yang berkembang pada pembuatan tes yang mencerminkan proses kognitif yang lebih bernuansa. Tujuannya tidak hanya untuk meningkatkan kinerja AI pada tolok ukur yang ada, tetapi juga untuk mengembangkan sistem yang mampu melakukan penalaran yang lebih umum mirip dengan proses berpikir manusia. Singkatnya, meskipun AI dapat mencapai skor tinggi pada tes IQ tradisional dalam kondisi tertentu, dengan menunjukkan kemahiran dalam tugas-tugas kognitif tertentu, ia belum mereplikasi spektrum penuh dari kecerdasan atau pemahaman manusia yang diperlukan untuk tugas penalaran yang lebih kompleks.
Penulis, Pendidik, pengasuh Rumah Belajar Bhinneka