Facebook sedang meneliti sistem AI yang melihat, mendengar, dan mengingat semua yang Anda lakukan

0


Facebook mencurahkan banyak waktu dan uang untuk augmented reality, termasuk membangunnya sendiri kacamata AR dengan Ray Ban. Saat ini, gadget ini hanya dapat merekam dan berbagi citra, tetapi menurut perusahaan, perangkat tersebut akan digunakan untuk apa di masa depan?

A proyek penelitian baru dipimpin oleh tim AI Facebook menunjukkan ruang lingkup ambisi perusahaan. Ini membayangkan sistem AI yang terus-menerus menganalisis kehidupan orang menggunakan video orang pertama; merekam apa yang mereka lihat, lakukan, dan dengar untuk membantu mereka melakukan tugas sehari-hari. Peneliti Facebook telah menguraikan serangkaian keterampilan yang ingin dikembangkan oleh sistem ini, termasuk “memori episodik” (menjawab pertanyaan seperti “di mana saya meninggalkan kunci saya?”) dan “diarisasi audio-visual” (mengingat siapa mengatakan apa kapan).

Saat ini, tugas-tugas yang diuraikan di atas tidak dapat dicapai dengan andal oleh sistem AI mana pun, dan Facebook menekankan bahwa ini adalah proyek penelitian daripada pengembangan komersial. Namun, jelas bahwa perusahaan melihat fungsionalitas seperti ini sebagai masa depan komputasi AR. “Tentu saja, memikirkan tentang augmented reality dan apa yang ingin kami lakukan dengannya, ada kemungkinan di masa depan bahwa kami akan memanfaatkan penelitian semacam ini,” kata ilmuwan riset AI Facebook, Kristen Grauman. The Verge.

Ambisi semacam itu memiliki implikasi privasi yang sangat besar. Pakar privasi sudah khawatir tentang bagaimana kacamata AR Facebook memungkinkan pemakainya merekam anggota publik secara diam-diam. Kekhawatiran seperti itu hanya akan diperburuk jika versi perangkat keras yang akan datang tidak hanya merekam rekaman, tetapi juga menganalisis dan menyalinnya, mengubah pemakainya menjadi mesin pengawasan berjalan.

Sepasang kacamata AR komersial pertama Facebook hanya dapat merekam dan berbagi video dan gambar — tidak menganalisisnya.
Foto oleh Amanda Lopez untuk The Verge

Nama proyek penelitian Facebook adalah Ego4D, yang mengacu pada analisis video orang pertama, atau “egosentris”. Ini terdiri dari dua komponen utama: kumpulan data terbuka dari video egosentris dan serangkaian tolok ukur yang menurut Facebook dapat ditangani oleh sistem AI di masa depan.

Kumpulan data tersebut adalah yang terbesar dari jenisnya yang pernah dibuat, dan Facebook bermitra dengan 13 universitas di seluruh dunia untuk mengumpulkan data. Secara total, sekitar 3.205 jam rekaman direkam oleh 855 peserta yang tinggal di sembilan negara berbeda. Universitas, bukan Facebook, bertanggung jawab untuk mengumpulkan data. Peserta, yang sebagian dibayar, mengenakan kamera GoPro dan kacamata AR untuk merekam video aktivitas tanpa naskah. Mulai dari pekerjaan konstruksi, membuat kue, hingga bermain dengan hewan peliharaan dan bersosialisasi dengan teman. Semua rekaman dide-identifikasi oleh universitas, termasuk mengaburkan wajah para pengamat dan menghapus informasi pengenal pribadi apa pun.

Grauman mengatakan dataset ini adalah “yang pertama dari jenisnya baik dalam skala dan keragaman.” Proyek sebanding terdekat, katanya, berisi 100 jam rekaman orang pertama ditembak seluruhnya di dapur. “Kami telah membuka mata sistem AI ini ke lebih dari sekadar dapur di Inggris dan Sisilia, tetapi [to footage from] Arab Saudi, Tokyo, Los Angeles, dan Kolombia.”

Komponen kedua dari Ego4D adalah serangkaian tolok ukur, atau tugas, yang Facebook ingin para peneliti di seluruh dunia coba dan selesaikan menggunakan sistem AI yang dilatih pada kumpulan datanya. Perusahaan menggambarkan ini sebagai:

Memori episodik: Apa yang terjadi ketika (misalnya, “Di mana saya meninggalkan kunci saya?”)?

Peramalan: Apa yang akan saya lakukan selanjutnya (misalnya, “Tunggu, Anda sudah menambahkan garam ke resep ini”)?

Manipulasi tangan dan objek: Apa yang saya lakukan (misalnya, “Ajari saya cara bermain drum”)?

Diarisasi audio-visual: Who said what when (misalnya, “Apa topik utama selama kelas?”)?

Interaksi sosial: Siapa yang berinteraksi dengan siapa (misalnya, “Bantu saya lebih baik mendengar orang berbicara kepada saya di restoran yang bising ini”)?

Saat ini, sistem AI akan merasa sangat sulit untuk mengatasi masalah ini, tetapi membuat kumpulan data dan tolok ukur adalah metode yang telah dicoba dan diuji untuk memacu pengembangan di bidang AI.

Memang, pembuatan satu kumpulan data tertentu dan kompetisi tahunan terkait, yang dikenal sebagai ImageNet, sering kali dikreditkan dengan kickstarting ledakan AI baru-baru ini. Kumpulan data ImagetNet terdiri dari gambar-gambar dari berbagai macam objek yang peneliti latih sistem AI untuk mengidentifikasi. Pada tahun 2012, entri pemenang dalam kompetisi menggunakan metode pembelajaran mendalam tertentu untuk meledakkan saingan masa lalu, meresmikan era penelitian saat ini.

Dataset Ego4D Facebook akan membantu memacu penelitian ke dalam sistem AI yang dapat menganalisis data orang pertama.
Gambar: Facebook

Facebook berharap proyek Ego4D-nya akan memiliki efek serupa untuk dunia augmented reality. Perusahaan mengatakan sistem yang dilatih pada Ego4D mungkin suatu hari nanti tidak hanya digunakan di kamera yang dapat dikenakan tetapi juga robot asisten rumah, yang juga mengandalkan kamera orang pertama untuk menavigasi dunia di sekitar mereka.

“Proyek ini memiliki kesempatan untuk benar-benar mengkatalisasi pekerjaan di bidang ini dengan cara yang belum benar-benar mungkin dilakukan,” kata Grauman. “Untuk memindahkan bidang kami dari kemampuan menganalisis tumpukan foto dan video yang diambil oleh manusia dengan tujuan yang sangat khusus, ke aliran visual orang pertama yang mengalir dan berkelanjutan yang perlu dipahami oleh sistem AR, robot, dalam konteks berkelanjutan. aktivitas.”

Meskipun tugas-tugas yang digariskan Facebook tampaknya praktis, minat perusahaan di bidang ini akan mengkhawatirkan banyak orang. Rekor Facebook tentang privasi sangat buruk, mencakup kebocoran data dan denda $5 miliar dari FTC. Itu juga pernah ditampilkan berkali-kali bahwa perusahaan menghargai pertumbuhan dan keterlibatan di atas kesejahteraan pengguna di banyak domain. Dengan pemikiran ini, sangat mengkhawatirkan bahwa tolok ukur dalam proyek Ego4D ini tidak menyertakan perlindungan privasi yang menonjol. Misalnya, tugas “diarisasi audio-visual” (mentranskripsikan apa yang dikatakan orang berbeda) tidak pernah menyebutkan penghapusan data tentang orang-orang yang tidak ingin direkam.

Ketika ditanya tentang masalah ini, juru bicara Facebook mengatakan: The Verge bahwa diharapkan perlindungan privasi akan diperkenalkan lebih jauh. “Kami berharap sejauh perusahaan menggunakan dataset dan benchmark ini untuk mengembangkan aplikasi komersial, mereka akan mengembangkan perlindungan untuk aplikasi tersebut,” kata juru bicara tersebut. “Misalnya, sebelum kacamata AR dapat meningkatkan suara seseorang, mungkin ada protokol di tempat yang mereka ikuti untuk meminta izin kacamata orang lain, atau mereka dapat membatasi jangkauan perangkat sehingga hanya dapat menangkap suara dari orang-orang yang memilikinya. yang sudah saya ajak bicara atau yang berada di sekitar saya.”

Untuk saat ini, perlindungan tersebut hanya hipotetis.

Leave A Reply

Your email address will not be published.