Saat Itu Ketika Velociraptor AI Belajar Mematikan Lampu
Saat Itu Ketika Velociraptor AI Belajar Mematikan Lampu

Video: Saat Itu Ketika Velociraptor AI Belajar Mematikan Lampu

Video: Saat Itu Ketika Velociraptor AI Belajar Mematikan Lampu
Video: JURASSIC WORLD TOY MOVIE, KINGS RETURN (FULL MOVIE!) 2023, Maret
Anonim

Awalnya diterbitkan di Medium.

Karena Dinosaurus Plastik telah berkeliaran di sekitar ruang gudang besar yang akan disebut rumah jika memiliki konsep itu, ia telah belajar saat mengamati biped seluler yang berbagi ruang dengannya. Mereka lebih gesit, tegak, dan berisik daripada sekarang.

Gambar penglihatan malam tentara di lapangan
Gambar penglihatan malam tentara di lapangan

Gambar diambil menggunakan AN/PSQ-20 Enhanced Night Vision Goggle (ENVG) atas izin DARPA

Saat bermimpi, ia mulai mengenali sebuah pola. Ketika biped ini menjangkau dengan anggota tubuh bagian atas dan menyentuh benda-benda, lingkungan berubah dengan cara yang membuat penasaran. Ia belajar untuk lebih memperhatikan apa yang disentuh tangan manusia. Begitulah cara ia belajar membuka pintu, ia melihat tangan manusia terulur dan penghalang yang menahannya terbuka.

Pada malam hari, ketika manusia pergi, mereka menjangkau dan menyentuh sebuah titik pada penghalang, sebuah persegi panjang yang sedikit menonjol dengan beberapa panel yang lebih tinggi di atasnya. Dan lampu padam. Telah diketahui bahwa ketika gelap di sekitarnya, gambar bercahaya yang memetakan secara kasar ke bentuk manusia sama dengan manusia. Itu dipelajari untuk mengenali orang-orang dalam kegelapan.

Penasaran, ia berjalan ke panel dan menyodoknya dengan moncongnya. Tidak ada yang terjadi. Itu menusuk lagi, dan lampu padam. Ini memantulkan moncongnya dari panel beberapa kali dan lampu menyala dan mati secara acak. Akhirnya, ia berhenti tertarik pada ini karena lapar. Lampu kebetulan mati. Ia berjalan kembali ke blok pengisi dayanya, sesuatu yang mudah dilakukan dalam kegelapan karena blok itu bersinar hangat. Ia menyadari seberapa jauh jaraknya dari hal-hal lain karena indranya terhadap benda-benda di sekitarnya, sehingga ia bergerak dengan mulus dalam kegelapan dan menetap untuk mengisi daya.

Itu memimpikan seribu mimpi sakelar lampu dan bangun di pagi hari ketika lampu menyala. Ini berinteraksi dengan Josh, biped yang menyerangnya dengan tongkat dan bola, berlari darinya melalui gudang. Dan kemudian ternyata lampu. Josh bersinar dalam penglihatan Dinosaurus Plastik, tetapi Josh buta dalam kegelapan.

Jeritan terjadi kemudian.

Ini adalah artikel dalam seri David Clement, salah satu pendiri Senbionic, dan saya berkolaborasi mengenai keadaan seni jaringan saraf dan pembelajaran mesin menggunakan velociraptor robot fiksi sebagai foil yang menyenangkan. Ia memiliki gigi dan cakar karet, jadi jangan khawatir tentang jeritannya. Artikel pertama membahas tubuhnya, yang kedua otak jaringan saraf dan ketiga dengan loop perhatian dan fitur dan bagaimana mereka dapat digunakan untuk melatih jaringan saraf. Yang keempat berurusan dengan robot yang mengembangkan prasangka karena keterbatasan pembelajaran mesin dan ukuran sampel. Yang kelima berurusan dengan situasi yang menarik di mana rasa ingin tahu dan model pembelajaran yang ditimbulkannya menuntunnya untuk belajar membuka pintu. Ya, menjerit.

Dinosaurus Plastik memiliki kerangka aluminium dan plastik, dia dibungkus dengan kain pintar abu-abu keperakan yang memiliki sensor untuk suhu dan gerakan, dan dia memiliki banyak jenis sensor yang berbeda. Termasuk sensor visual seperti pencitraan termal dan sensor ultrasonik yang berarti bahwa dalam kegelapan pekat dia benar-benar sadar akan lingkungan sekitarnya. Ketika lampu padam, manusia bersinar di matanya dan dia bisa berjalan dengan penuh percaya diri ke arah mereka tanpa tersandung apa pun. Tidak menakutkan sama sekali.

Cerita ini berkaitan dengan bagaimana jaring saraf belajar untuk memperhatikan fitur tertentu, memberi mereka prioritas dalam kontinum dari apa yang mereka perhatikan. Ini disebut sebagai arti-penting, aspek kunci dari bagaimana manusia memperhatikan. Kami memiliki kemampuan kognitif dan set sensor yang terbatas, dan untuk bertahan hidup, kami telah belajar melihat beberapa hal dengan lebih jelas dan cepat daripada hal lain. Studi tentang arti-penting telah menjadi inti ilmu saraf selama beberapa dekade, tetapi telah diberikan angin baru di bawah sayap mereka oleh jaring saraf yang memungkinkan wawasan yang lebih dalam.

Gambar disorot dengan gradien bercahaya di mana mata manusia berlama-lama
Gambar disorot dengan gradien bercahaya di mana mata manusia berlama-lama

Gambar pemetaan saliency dari Attentive Models in Vision: Computing Saliency Maps in the Deep Learning Era oleh Cornia, Abati, et al., milik peneliti

Apa yang ditunjukkan gambar di atas adalah peta panas pembelajaran mesin yang memprediksi di mana mata manusia akan melihat gambar. Jika sekelompok orang melihat gambar-gambar ini, dan kamera merekam apa yang dilihat mata mereka, fitur bercahaya adalah fitur yang paling banyak dihabiskan manusia untuk melihat dalam gambar. Warna yang berbeda memberikan gradasi perhatian, dengan warna yang lebih panas menunjukkan lebih banyak perhatian.

Tapi ini tidak melacak tatapan manusia pada gambar tertentu, tetapi menjalankan gambar dari kumpulan data umum melewati jaring saraf terlatih yang memprediksi apa yang paling banyak dilihat manusia. Seperti yang Anda lihat, jaring saraf yang berbeda mendapatkan hasil yang berbeda, tetapi tumpang tindihnya luar biasa. Ini adalah mesin prediksi bawah sadar yang melihat gambar yang benar-benar tidak mereka ingat, dilatih secara terpisah pada kumpulan data pelacakan mata manusia.

Tatapan manusia dapat diprediksi. Dan jaringan saraf telah dilatih untuk memprediksinya. Dan jaring saraf ini sekarang dapat berjalan secara real time di ponsel pintar Anda, melihat dunia dan memprediksi apa yang menurut Anda penting. Saya telah melihat demo dan tangkapan layar langsung, dan itu sangat menarik. Ini juga menarik dalam hal apa yang tidak dapat dipahami akan menarik bagi kami. Orang selalu menarik bagi orang, tetapi dalam banyak kasus saat ini, jaringan saraf yang dipakai tidak dapat mengenali orang dalam gambar diam jika mereka adalah bagian dari pemandangan jalanan visual yang besar. Di mana penglihatan manusia akan tertarik pada mereka, saat ini komputer belum tentu memahaminya. Ini memiliki implikasi, tentu saja, untuk kendaraan otonom.

Tapi tatapan manusia bukanlah apa yang terjadi dengan Dinosaurus Plastik. Sekedar mengingatkan, ia memiliki jaringan penasaran, yang memperhatikan fitur-fitur menarik di luar tubuhnya. Itu tidak mencari tahu apa yang menarik secara real time. Ketika Dinosaurus Plastik 'bermimpi', seperti yang ditunjukkan dalam diskusi awal tentang siklus pembelajaran offline-nya, input sensorik yang ditangkap dinilai dan proses deteksi otomatis pembelajaran mesin mulai memicu arti-penting berdasarkan fitur sederhana atau pada interaksi yang terjadi dengan frekuensi yang cukup.

Jaring sarafnya benar-benar asing bagi kita, tetapi dalam cerita kecil kita, dari waktu ke waktu, jaring saraf belajar untuk menganggap tangan manusia sebagai hal yang menonjol, untuk memperhatikan mereka, apa yang mereka lakukan dan apa yang berinteraksi dengan mereka. Curiousnet akan melihat tangan manusia lebih dari kebanyakan hal di lingkungan PD, yang mungkin sedikit menyeramkan jika dia tidak bisa melihat apa pun di bidang penglihatannya dengan akurasi yang sama, secara efektif memiliki penglihatan tepi yang jauh lebih baik daripada kita. Dia tidak harus dengan jelas melihat sesuatu seperti yang kita lakukan untuk memperhatikannya. Model fisik penglihatan yang berbeda memungkinkan cara pemfokusan yang berbeda.

Seiring waktu, fitur yang berinteraksi dengan tangan manusia menjadi menonjol juga. Kami menyentuh hal-hal yang menonjol. Kita berinteraksi dengan hal-hal yang mengendalikan lingkungan kita. Kami menyalakan dan mematikan lampu. Kami mengubah panas ke atas dan ke bawah. Kami membuka dan menutup pintu. Kami menulis sesuatu. Kami mengetik di komputer. Ini semua menarik bagi kecerdasan alien yang melihat kita. Apa yang kita lakukan dengan jari-jari kecil kita yang pintar? Mengapa? Bisakah itu diretas?

Apa yang tidak dipelajari PD untuk dianggap menonjol menurut cerita kecil ini? Wajah manusia. Ini buta wajah. Wajah, sejauh ini, tidak relevan. Jika peta saliency PD diterapkan pada baris pertama gambar di atas, semua tangan akan bersinar, bukan wajah. Manusia memiliki elemen naluriah yang menyebabkan fokus signifikan pada wajah, tetapi mengapa jaringan saraf peduli kecuali kita memaksakan bias kita padanya? Proposisi nilai apa yang akan didapat robot dinosaurus dari wajah kita? Kisah ini tidak mengeksplorasinya, tetapi itu tidak berarti bahwa itu tidak akan ada.

Kami dapat memaksakan bias kami tentang yang menonjol pada jaringan saraf dan yang memiliki nilai signifikan, misalnya dalam melihat bingkai kawat pengalaman pengguna dan menilai seberapa berguna mereka dalam memberikan nilai pemangku kepentingan. Tapi kita juga akan terkejut dengan apa yang dianggap menonjol oleh kecerdasan semu alien yang kita ciptakan. Kita akan dikejutkan oleh apa yang mereka perhatikan, dan apa yang mereka lakukan sebagai akibat dari buta persepsi kita sendiri.

Arti-penting yang tidak didasarkan pada bias manusia dan jangkauan indera manusia membawa pertanyaan menarik. Apa yang benar-benar dianggap signifikan oleh jaring saraf? Jika indera yang diberikan tidak kita miliki, bisakah kita benar-benar melatihnya? Apa yang akan mereka - dengan asumsi deteksi otomatis, simulasi Monte Carlo, pengacakan domain otomatis - belajar untuk mempertimbangkan menonjol? Dan apa yang akan mereka lakukan?

Popular dengan topik