Game Theory

Teori permainan adalah bagian dari ilmu matematika yang mempelajari interaksi antar agen, di mana tiap strategi yang dipilih akan memiliki payoff yang berbeda bagi tiap agen. Pertama kali dikembangkan sebagai cabang tersendiri dari ilmu matematika oleh Oskar Morgenstern dan John von Neumann, cabang ilmu ini telah berkembang sedemikian pesat hingga melahirkan banyak tokoh peraih nobel, seperti John Nash (AS), Reinhard Selten (Jerman), dan John Harsanyi (AS) pada tahun 1999 dan Thomas Schelling (AS),Robert Aumann (Israel) pada tahun 2005, dan Leonid Hurwicz (Amerika Serikat) pada tahun 2007.

John Van Neemann dan Oskar Morgenstern mengungkapkan bahwa, “Permainan terdiri atas sekumpulan peraturan yang membangun situasi bersaing dari dua sampai beberapa orang atau kelompok dengan memilih strategi yang dibangun untuk memaksimalkan kemenangan sendiri atau pun untuk meminimalkan kemenangan lawan. Peraturan-peraturan menentukan kemungkinan tindakan untuk setiap pemain, sejumlah keterangan diterima setiap pemain sebagai kemajuan bermain, dan sejumlah kemenangan atau kekalahan dalam berbagai situasi.”

Dari pengertian diatas dapat disimpulkan bahwa, teori bermain adalah merupakan suatu teori yang mengedepankan konsep konsep dalam suatu permainan sebagai landasan. Dimana didalam permainan terdapat peraturan, yang secara langsung mampu menciptakan situasi bersaing dan digunakan untuk mencari strategi terbaik dalam suatu aktivitas, dimana setiap pemain didalamnya sama-sama mencapai utilitas tertinggi.


Contoh game:

  • Intel vs AMD
  • Penulis buku dengan pembacanya
  • Maskapai penerbangan dengan penumpangnya
  • Penjual dengan pembeli

Asumsi-asumsi Teori game:
Agar game dapat dimodelkan secara matematis, diperlukan 4 elemen dasar dari sebuah game:

  1. Pemain
  2. Tindakan
  3. Payoff
  4. Informasi
Keempat elemen itu disebut juga Rules of The Game. Para pemain berusaha memaksimalkan payoff mereka, dengan cara memilih strategi yang tepat berdasarkan informasi yang mereka miliki. Keadaan di mana setiap pemain telah menentukan strategi yang optimal disebut kesetimbangan (equilibrium). Dengan mengetahui kesetimbangan dari suatu game, pemodel dapat mengetahui tindakan/strategi apa yang dipilih oleh para pemain yang terlibat, dan juga outcome dari game tersebut.


Asumsi-asumsi dasar:

  1. Setiap pemain memiliki strategi yang berhingga banyaknya (finite), dan mungkin berbeda dengan pemain lainnya.
  2. Setiap pemain bersikap rasional yaitu berusaha memilih strategi yang memberikan hasil paling optimal bagi dirinya, berdasarkan payoff dan jenis game yang dimainkan.


Model Game:


- Klasifikasi berdasarkan jumlah pemain:
  •  Game dua-pemain (2-person)
  • Game N-pemain (N ≥ 3) 


- Klasifikasi berdasarkan jumlah keuntungan dan kerugian:

  • Game jumlah-nol (zero-sum game)
Jumlah payoff dari setiap pemain sama dengan nol. Untuk game dengan 2 pemain, besar keuntungan di satu pihak sama dengan besar kerugian di pihak lain.


  • Game bukan jumlah-nol (non zero-sum game)
Jumlah payoff dari setiap pemain tidak sama dengan nol. Untuk game dengan 2 pemain, besar keuntungan di satu pihak tidak sama dengan besar kerugian di pihak lain.



- Klasifikasi berdasarkan jumlah strategi:


  • Game strategi-murni (pure-strategy game)
  • Game strategi-campuran (mixed-strategy game)
- Klasifikasi berdasarkan urutan (giliran) bermain:


  • Game sekuensial

Pemain melakukan tindakan secara bergantian. Pemain berikutnya mengetahui tindakan yang diambil oleh pemain sebelumnya (mungkin secara tidak utuh).


  • Game simultan 

Pemain melakukan tindakan secara bersamaan. Pada saat mengambil tindakan, pemain yang terlibat tidak mengetahui tindakan yang dipilih oleh pemain lainnya. Dalam hal ini jeda waktu pengambilan tindakan antara sesaa pemain tidak berpengaruh terhadap pilihan yang diambil oleh pemain ybs.


- Klasifikasi berdasarkan kesempurnaan informasi:


  • Game dengan informasi sempurna

Pemain mengetahui dengan pasti tindakan yang diambil oleh lawannya, sebelum ia memilih tindakan → asumsi ini hanya dapat dipenuhi oelh game sekuensial.



  • Game dengan informasi tidak sempurna

Pemain tidak mengetahui tindakan yang dipilih lawannya sebelum permainan berakhir.


· Klasifikasi berdasarkan kelengkapan informasi:


  • Game dengan informasi lengkap

Pemain mengetahui payoff lawannya.


  • Game dengan informasi tidak lengkap

Pemain tidak memiliki informasi lengkap tentang payoff lawannya.




· Klasifikasi berdasarkan adanya kesepakan (komitmen):


  • Game kooperatif

Para pemain membuat komitmen yang mengikat (binding commitment) untuk meningkatkan outcome mereka.



  • Game nonkooperatif

Para pemain tidak membuat komitmen yang mengikat.




Payoff

Payoff adalah angka yang menunjukkan hasil dari strategi permainan yang diinginkan oleh ybs. Hasil ini dinyatakan dalam bentuk ukuran efektivitas, seperti uang, persentase market share, atau kegunaan. Dalam suatu permainan, payoff dapat dipresentasikan dalam bentuk matriks payoff.

Untuk permainan dua-pemain bukan-jumlah-nol (2-person non-zero-sum game), payoff direpresentasikan dalam bentuk bimatriks. 

Untuk permainan dua-pemain jumlah-nol (2-person zero-sum game), payoff direpresentasikan dalam bentuk matriks dan atau bimatriks.

Strategi 

Strategi permainan adalah rangkaian rencana kegiatan yang menyeluruh dari pemain ybs, sebagai respon atas aksi yang mungkin dilakukan oleh pemain lain (pesaingnya). Suatu strategi dikatakan dominan bila setiap payoff dalam strategi adalah superior terhadap setiap payoff yang berhubungan dalam suatu strategi alternative. Aturan dominan ini dapat digunakan untuk mengurangi ukuran matriks payoff dan upaya perhitungan.

Strategi Terdominasi dan Strategi Dominan

· Strategi terdominasi adalah strategi yang strictly inferior terhadap sejumlah strategi lain, apapun strategi yang dipilih lawan.

· Strategi dominan adalah strategi yang memiliki payoff tertinggi dibandingkan dengan strategi lainnya. Misalkan strategi “X” adalah strategi dominan bagi pemain A, maka apapun strategi yang dipilih pemain B, pemain A tetap akan memilih strategi “X”.

· Kesetimbangan strategi dominan adalah suatu outcome yang dibentuk oleh strategi dominan setiap pemain.

Contoh Pemecahan Game dengan Pohon

Pada sub bab ini akan dibahahas sepenggal contoh pemecahan game dengan bantuan pohon. Sebagai contoh akan digunakan permainan dengan kompleksitas terendah yaitu permainan Tic Tac Toe.

Aplikasi Lainnya dari Teori Game dalam berbagai bidang

Seperti kita ketahui bahwa penggunaan graf dan pohon sangat banyak aplikasinya dalam kehidupan. Game-theory juga merupakan salah satu konsep yang dapat diimplementasikan dalam bidang lainnya. Dengan menggunakan konsep pohon, kombinatorial matriks, dan dilengkapi dengan algoritma minimum.

Politik dan Ekonomi (Konsep Pohon)

Beberapa pemakaian yang paling mencolok adalah pada pengambilan keputusan yang berhubungan dengan sistem pemerintahan. Pada penerapan politik ini, untuk satu masalah yang sangat membutuhkan keputusan terbaik karena menyangkut masalah suatu negara. Dengan menggambarkannya secara ekstensif berupa pohon dengan informasi lengkap, dapat dimisalkan semua elemen yang mempengaruhi dan kemungkinan keputusan sebagai suatu node. Dengan menerapkan minimum tree dapat terlihat keputusan dengan resiko terkecil, dengan algoritma minimax (algoritma untuk mempertimbangkan keputusan terbaik) akan didapat solusi terbaik sebagai pemecahan masalah.

Biologi (Konsep Matriks Kombinatorial)

Konsep matriks kombinatorial dari game-theory banyak digunakan dalam bidang biologi khususnya yang menyangkut evolusi dan habitat hewan. Untuk masalah habitat hewan misalnya, sangat mirip dengan matriks kombinatorial pada Zero-Sum Game. Sebagai contoh permisalan adalah masalah piramida makanan yang berlaku pada hewan. Misalkan terdapat suatu populasi sebanyak n ayam dan n elang dengan asumsi bahwa ayam adalah makanan dari elang. Sehingga untuk bertahan hidup dan memperbanyak jenisnya, elang harus memakan ayam. Untuk satu kali memangsa maka di sini kemungkinan elang akan menjadi (n + 1) dan ayam akan (n - 1). Hal yang sama juga berlaku untuk teori territorial pada hewan. Selain dari dua contoh bidang di atas, masih banyak bidang lainnya yang memakai konsep hampir sama dengan game-theory.

Algoritma yang Digunakan dalam Membuat Game

Algoritma Greedy

Algoritma greedy merupakan jenis algoritma yang menggunakan pendekatan penyelesaian masalah dengan mencari nilai maksimum sementara pada setiap langkahnya. Nilai maksimum sementara ini dikenal dengan istilah local maximum. Pada kebanyakan kasus, algoritma greedy tidak akan menghasilkan solusi paling optimal, begitupun algoritma greedy biasanya memberikan solusi yang mendekati nilai optimum dalam waktu yang cukup cepat.
Algoritma greedy merupakan algoritma yang besifat heuristik, mencari nilai maksimal sementara dengan harapan akan mendapatkan solusi yang cukup baik. Meskipun tidak selalu mendapatkan solusi terbaik (optimum), algoritma greedy umumnya memiliki kompleksitas waktu yang cukup baik, sehingga algoritma ini sering digunakan untuk kasus yang memerlukan solusi cepat meskipun tidak optimal seperti sistem real-time atau game.
Dari impementasi yang kita lakukan, dapat dilihat bagaimana algoritma greedy memiliki beberapa fungsionalitas dasar, yaitu:
  1. Fungsi untuk melakukan penelusuran masalah.
  2. Fungsi untuk memilih local maximum dari pilihan-pilihan yang ada tiap langkahnya.
  3. Fungsi untuk mengisikan nilai local maximum ke solusi keseluruhan.
  4. Fungsi yang menentukan apakah solusi telah didapatkan.
Algoritma Minimax
Algoritma minimax merupakan basis dari semua permainan berbasis AI seperti permainan catur misalnya. AI permainan catur tentunya sudah sangat terkenal dimana AI tersebut bahkan dapat mengalahkan juara dunia sekalipun. Pada algoritma minimax, pengecekan akan seluruh kemungkinan yang ada sampai akhir permainan dilakukan. Pengecekan tersebut akan menghasilkan pohon permainan yang berisi semua kemungkinan tersebut. Tentunya dibutuhkan resource yang berskala besar untuk menangani komputasi pencarian pohon solusi tersebut berhubung kombinasi kemungkinan untuk sebuah permainan catur pada setiap geraknya sangat banyak sekali.
Keuntungan yang didapat dengan menggunakan algoritma minimax yaitu algoritma minimax mampu menganalisis segala kemungkinan posisi permainan untuk menghasilkan keputusan yang terbaik karena algoritma minimax ini bekerja secara rekursif dengan mencari langkah yang akan membuat lawan mengalami kerugian minimum. Semua strategi lawan akan dihitung dengan algoritma yang sama dan seterusnya. Ini berarti, pada langkah pertama komputer akan menganalisis seluruh pohon permainan. Dan untuk setiap langkahnya, komputer akan memilih langkah yang paling membuat lawan mendapatkan keuntungan minimum, dan yang paling membuat komputer itu sendiri mendapatkan keuntungan maksimum. Dalam penentuan keputusan tersebut dibutuhkan suatu nilai yang merepresentasikan kerugian atau keuntungan yang akan diperoleh jika langkah tersebut dipilih.
Untuk itulah disini digunakan sebuah fungsi heurisitic untuk mengevaluasi nilai sebagai nilai yang merepresentasikan hasil permainan yang akan terjadi jika langkah tersebut dipilih. Biasanya pada permainan tic tac toe ini digunakan nilai 1,0,-1 untuk mewakilkan hasil akhir permainan berupa menang, seri, dan kalah. Dari nilai-nilai heuristic inilah komputer akan menentukan simpul mana dari pohon permainan yang akan dipilih, tentunya simpul yang akan dipilih tersebut adalah simpul dengan nilai heuristic yang akan menuntun permainan ke hasil akhir yang menguntungkan bagi komputer.


Referensi:
  • https://id.wikipedia.org/wiki/Teori_permainan 
  • http://www.catatanfadil.com/2014/03/teori-game.html
  • https://www.ics.uci.edu/~eppstein/cgt/
  • www.it-jurnal.com/2015/09/pengertian-algoritma-greedy.html
  • https://id.wikipedia.org/wiki/Minimax

Jannes Prasetya

sedang dalam perbaikan....

Tidak ada komentar:

Posting Komentar