Menurut para Peneliti, Algoritma pembelajaran Mesin dapat memberi Organisasi Kekuatan yang kuat dan Alat Hemat Biaya untuk bertahan dari Serangan pada Jaringan Komputer yang Rentan dan Infrastruktur Dunia Maya, yang sering disebut serangan Zero-Day. Serangan Pada Jaringan Komputer Yang Rentan dan Infrastruktur Dunia Maya sering disebut Serangan Zero-Day, Serangan tersebut dapat dengan cepat menyerang Pertahanan yang mengakibatkan kerusakan hingga Miliaran Rupiah.
Jika Hal itu terjadi, Perlu waktu berminggu-minggu untuk memperbaiki secara Manual, dan harus memperkuat Sistem setelah terkena gangguan. Sekarang, Tim Peneliti yang dipimpin oleh Penn State, Menggunakan pendekatan pembelajaran Mesin berdasarkan Teknik yang dikenal sebagai pembelajaran Penguatan, untuk menciptakan Pertahanan Cyber Adaptif terhadap serangan.
Menurut Minghui Zhu, Profesor Teknik kelistrikan dan ilmu Komputer serta bekerja sama dengan Institute for Computational and Data Sciences, Timnya telah mengembangkan Metode berbasis pembelajaran Mesin Adaptif untuk mengatasi keterbatasan Sistem saat ini. Dalam Metode untuk mendeteksi dan menanggapi Serangan Dunia Maya, Pertahanan Target bergerak, atau MTD adalah Teknik pertahanan Target Manual Adaptif yang dapat secara Dinamis dan Proaktif mampu mengkonfigurasi Ulang Pertahanan yang dapat meningkatkan ketidakpastian, dan kerumitan bagi Penyerang selama berada di Jendela Kerentanan.
Zhu mengatakan, Teknik MTD yang ada mengalami dua keterbatasan, Pertama, Pemilihan Manual bisa sangat memakan Waktu. Kedua, Konfigurasi yang dipilih secara Manual mungkin bukan Metode yang paling Hemat Biaya untuk menangani masalah. Respons terhadap Serangan dapat memakan waktu hingga 15 hari, yang dapat menghabiskan Dana dan Sumber Daya untuk sebuah Organisasi.
Menurut para Peneliti, yang merilis temuan mereka di ACM Transactions on Privacy and Security, Zhu mengatakan bahwa Serangan Zero-Day adalah salah satu Ancaman paling berbahaya bagi Sistem Komputer, dan dapat menyebabkan Kerusakan Serius yang bertahan lama. Serangan Ransomware WannaCry, yang terjadi pada Mei 2017, menargetkan lebih dari 200.000 Komputer Windows di 150 Negara, dan menyebabkan Kerusakan senilai 56 Triliun hingga 112 Triliun.
Pendekatan Tim yang mengandalkan Pembelajaran Penguatan, bersama dengan Pembelajaran yang diawasi dan tanpa Pengawasan, merupakan salah satu dari tiga Paradigma Pembelajaran Mesin Utama. Menurut para Peneliti, Pembelajaran Penguatan adalah Keputusan untuk belajar membuat Pilihan yang tepat dengan memilih tindakan yang memaksimalkan Imbalan dengan menyeimbangkan Pendayagunaan, dengan Memanfaatkan Pengalaman masa lalu dan Penjelajahan dalam mencoba tindakan baru.
Menurut Peng Liu, Raymond G. Tronzo, MD Profesor Keamanan Cyber di Sekolah Tinggi Ilmu dan Teknologi Informasi. Pembuat keputusan mempelajari Kebijakan dan tindakan yang Optimal melalui Interaksi secara terus menerus dengan Lingkungan yang mendasarinya, serta sebagian yang tidak diketahui. Jadi, Pembelajaran Penguatan sangat cocok untuk bertahan dari Serangan Zero-Day, ketika Informasi Penting terlihat Rumit di Target Serangan dan Lokasi kerentanan atau mungkin tidak Tersedia.
Para Peneliti menguji Algoritma pembelajaran Penguatan mereka dalam jaringan 10 Mesin, Mereka menambahkan Jaringan 10 Komputer, yang mungkin tidak tampak terlalu besar. Sebenarnya itu lebih dari cukup untuk Pengujian, dan cukup kuat dalam Penyiapan Server web, Email, Server Gateway, Server SQL, Server DNS, Server Admin, dan Firewall yang dipasang untuk mencegah Akses ke Host Internal.
Para peneliti juga memilih kerentanan yang dapat menghasilkan beberapa Rencana Serangan untuk Pengujian, Mereka menambahkan Ruang untuk perbaikan lebih lanjut dalam pendekatan mereka. Misalnya, Algoritma mereka bergantung pada Pembelajaran Penguatan tanpa Model yang memerlukan Data dalam jumlah besar, atau perulangan dalam Jumlah Besar untuk mempelajari Kebijakan pertahanan yang Relatif baik. Di masa depan mereka ingin memasukkan Pendekatan berbasis Model untuk mempercepat Proses Pembelajaran.