Senza categoria

Peneliti Mengungkap Rahasia AI Libratus Poker

Kembali pada bulan Januari, AI poker Libratus mengalahkan empat spesialis top head-up no limit hold’em, menandai pertama kalinya sebuah komputer menunjukkan bahwa ia dapat mengalahkan pemain profesional tingkat tinggi.

Sekarang, tim peneliti dari Universitas Carnegie Mellon yang menciptakan hiu silikon telah mengungkapkan bagaimana mereka melakukan hal itu.

Dalam makalah yang diterbitkan oleh Science , Profesor Tuomas Sandhold dan Ph.D. siswa Noam Brown merinci bagaimana kecerdasan buatan mereka tidak hanya mampu bersaing dengan pemain poker top manusia, tetapi pada akhirnya mengalahkan mereka, mencapai tingkat kinerja manusia super.

Makalah tersebut merinci bagaimana tim berhasil mengajari komputer untuk memainkan permainan informasi yang tidak lengkap, tantangan yang jelas berbeda dari mempelajari permainan informasi lengkap seperti catur atau go.

Kemenangan Kekuatan Tiga Algoritma

Salah satu langkah kunci yang diambil adalah memecah strategi Libratus menjadi tiga algoritme berbeda untuk mencakup berbagai aspek Texas Hold’em. Yang pertama menggunakan limit hold’em sebagai panduan untuk mempelajari cara bermain tanpa batas juga.

Ukuran tangan dan taruhan yang serupa dikelompokkan bersama untuk mengurangi ukuran pohon keputusan, yang merupakan salah satu rintangan serius yang harus diatasi mengingat banyaknya kemungkinan dalam permainan tanpa batas.

“Daripada mempertimbangkan setiap kemungkinan taruhan antara $100 dan $20.000, kami malah dapat mempertimbangkan peningkatan sebesar $100,” tulis para peneliti. “Ini secara drastis mengurangi kompleksitas penyelesaian permainan.”

Kedua, komputer diprogram untuk menggunakan kerangka strategis yang lebih canggih pada dua ronde pertaruhan terakhir (putaran dan sungai). Dikenal sebagai “penyelesaian subgame bersarang”, bagian AI ini tidak mengabstraksi apa pun, melainkan mempertimbangkan setiap tangan satu per satu.

Bagian dari program ini dibangun di atas ide-ide dari upaya AI poker sebelumnya, tetapi menampilkan sejumlah kemajuan kompleks yang membantu memastikan bahwa lawan tidak dapat mengeksploitasi komputer dengan mengubah strategi mereka.

Terakhir, Libratus menyertakan algoritme download idn poker peningkatan diri yang terus meningkatkan “strategi cetak biru” yang berjalan di latar belakang dan membentuk dasar permainan mesin.

Peningkatan diri ini menggunakan keputusan yang dibuat oleh lawan untuk membantu memutuskan di mana komputer harus melihat untuk mempelajari lebih lanjut tentang permainan poker dan menghitung strategi teori permainan.

...

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *