Teorya ng laro: Pagkakaiba sa mga binago

Content deleted Content added
No edit summary
No edit summary
Linya 2:
Ang '''Teoriya ng laro''' (Ingles: '''Game theory''') ang pag-aaral ng [[stratehiya|stratehikong]] [[paggawa ng desisyon]]. Sa mas pormal na paglalarawan, ito "''ang pag-aaral ng mga modelong [[matematika]]l ng alitan at pakikipagtulungan sa pagitan ng mga matalinong [[teoriyang makatwirang pagpili|makatwirang]] mga tagagawa ng desisyon.''"
<ref>[[Roger B. Myerson]] (1991). ''Game Theory: Analysis of Conflict,'' Harvard University Press, p. [http://books.google.com/books?id=E8WQFRCsNr0C&printsec=find&pg=PA1=onepage&q&f=false#v=onepage&q&f=false 1]. Chapter-preview links, pp. [http://books.google.com/books?id=E8WQFRCsNr0C&printsec=find&pg=PR7=onepage&q&f=false#v=onepage&q&f=false vii-xi].
</ref> AnAng alternativeisang termalternatibong suggestedterminong iminungkahi "asbilang aisang moremas descriptivedeskriptibong namepangalan forpara thesa disciplinedisiplina" isang ''interactiveinteraktibong [[decisionteoriyang theorydesisyon]]''.<ref>[[Robert Aumann|R. J. Aumann]] ([[The New Palgrave: A Dictionary of Economics|[1987] ]] 2008). "game theory," Introduction, ''[[The New Palgrave Dictionary of Economics]]'', 2nd Edition. [http://www.dictionaryofeconomics.com/article?id=pde2008_G000007&q=game%20theory&topicid=&result_number=3 Abstract.]</ref> Ang teoriya ng laro ay pangunahing ginagamit sa [[ekonomika]], [[agham politikal]], [[sikolohiya]] gayundin sa [[lohika]] at [[biolohiya]]. Ang paksang ito ay unang sumagot sa mga [[larong sumang-sero]](''zero-sum game'') na ang pakinanabang ng isang tao ay eksaktong katumbas ng netong mga kawalan ng iba pang mga kalahok. Gayunpaman, sa kasalukuyan, ang teoriya ng laro ay lumalapat sa isang malawak na saklaw ng mga relasyon ng klase at umunlad sa isang [[terminong payong]] para sa [[lohika]]l na panig ng [[agham]] upang isama ang parehong tao at mga hindi tao gaya ng mga [[kompyuter]]. Ang mga klasikong paggamit ay kinabibilangan ng isang kahulugan ng balanse sa maraming mga laro kung saan ang bawat tao nakatuklas o nakabuo ng isang taktika na hindi matagumpay na makapagpapabuti ng mga resulta sa ibinigay na pakikitungo ng iba. Ang modernong teoriya ng laro ay nagmula sa ideya tungkol sa pag-iral ng stratehiyang-halong ekwilibria sa dalawang-taong mga larong sumang-sero at ang patunay nito ni [[John von Neumann]]. Ang orihinal na patunay ni Von Neumann ay gumamit ng [[teoremang nakapirmeng-punto]] ni Brouwer sa tuloy tuloy na mga pagmamapa tungo sa siskik na mga [[hanay na konbeks]] na naging isang pamantayang paraan sa teoriya ng laro at [[ekonomikang matematikal]]. Ang kanyang papel ay sinundan ng kanyang 1944 aklat na ''[[Theory of Games and Economic Behavior]]'' kasama ni [[Oskar Morgenstern]] na nagsaalang alang ng mga larong pakikipagtulungan ng ilang mga manlalaro. Ang ikalawang edisyon ng aklat na ito ay nagbigay ng teoriyang [[aksiyoma]]tiko ng [[inaasahang utilidad]] na pumayag sa mga [[estadistika|estadistikong matematikal]] at [[ekonomika|ekonomista]] na itrato ang paggawa ng desisyon sa ilalim ng kawalang katiyakan. Ang teoriyang ito ay malawak na pinaunlad noong mga 1950 ng maraming mga skolar. Ang teoriya ng laro ay kalaunang hayagang inilapat sa [[biolohiya]] noong mga 1970 bagaman ang parehong mga pag-unlad ay bumabalik sa hindi bababa sa mga 1930. Ang teoriya ng laro ay malawak na kinikilala bilang isang mahalagang kasangkapan sa maraming mga larangan. Ang walang mga teorista ng laro ay nagwagi ng [[Gantimpalang Nobel]] sa [[ekonomika]] at si [[John Maynard Smith]] ay pinarangalan ng [[Gantimpalang Crafoord]] para sa kanyang paglalapat ng teoriya ng laro sa biolohiya.
==Pagkakatawan ng mga laro==
{{see also|Talaan ng mga laro sa teoriya ng laro}}
Linya 105:
Ang pagsasaliksik sa [[Intelihensiyang Artipisyal]] ay sumagot sa parehong perpekto at hindi perpektong(o hindi kompletong) mga larong impormasyon na may labis na masalimuot na mga istrakturang kombinatoryal(tulad ng chess, go o backgammon) kung saan walang mapapatunayang mga stratehiyang optimal ang natagpuan. Ang mga praktikal na solusyon ay kinasasangkutan ng mga komputsasyonal na [[heuristika]] tulad ng [[pagtatabas na alpha-beta]] o paggamit ng [[artipisyal na neural network]] na sinanay ng [[pagpapapalakas na pagkatuto]](''reinforcement learning'') na gumagawa sa mga larong mas mapangasisiwaan sa pagsasanay na pagkukuwenta.<ref name="Bewersdorff2005">{{cite book|author=Jörg Bewersdorff|title=Luck, logic, and white lies: the mathematics of games|year=2005|publisher=A K Peters, Ltd.|isbn=978-1-56881-210-6|pages=ix-xii and chapter 31}}</ref><ref name="Jones2008">{{cite book|author=M. Tim Jones|title=Artificial Intelligence: A Systems Approach|year=2008|publisher=Jones & Bartlett Learning|isbn=978-0-7637-7337-3|pages=106–118}}</ref>
 
===Walang hangganang mahabang mga laroInfinitely long gameslaro===
{{main|Determinasya}}
Ang mga laro kung paanong pinag-aaralan ng mga ekonomista at mga manlalaro ng larong tunay na daigdig ay pangkalahatang nagtatapos sa may hangganang maraming mga galaw. Ang purong matematika ay hindi labis na tinatakdaan at ang [[teoriya ng hanay|mga teorista ng hanay]] sa partikular ay nag-aaral ng mga laro na tumatagal sa walang hanggananhangganang maraming mga galaw na ang ang nanalo(o iba pang kabayaran) ay hindi alam hanggang pagkatapos na lahat na ang mga galaw ay nakumpleto. Ang pokus ng atensiyon ay karaniwankaraniwang hindi labis sa kung annoano ang pinakamahusay na paraan na maglaro ng gayong laro ngunit simpleng kung ang isa o iba pang manlalaro ay may mananalong stratehiya. Maaaring patunayan gamit ang [[aksiyoma ng pagpili]] na mayroong mga laro kahit sa perpektong imporasyonimpormasyon at kung ang tanging mga kalalabasan ay panalo o talo kung saan wala sa mga manlalaro ang may stratehiyang mananalo. Ang pag-iral ng gayong mga stratehiya para sa matalinong dinisenyong mgmga alarolaro ay mahalagang mga konsekwensiya sa [[teoriyang deskriptibong hanay]].
 
===Mga larong diskreto at tuloy tuloy===
Ang karamihan ng teoriya ng laro ay nauukol sa may hangganan, diskretong mga laro na may hangganan bilang ng mga manlalaro, galaw, pangyayari, kalalabasan etc. Gayunpaman, maraming mga konsepto ay maaaring palawigin. Ang mga larong tuloy tuloy ay pumapayag sa mga manlalaro na pumili ng isang stratehiya mula sa isang hanay nang tuloy tuloy na stratehiya. Halimbawa, ang [[kompetisyong Cournot]] ay karaniwang minomodelo na ang mga stratehiya ng mga manlalaro ay anumang hindi negatibong mga kantidad kabilang ang mga praksiyonal na kantidad.
 
===Mga larong diperensiyal ===
Linya 118:
 
===Mga larong maraming-manlalaro at populasyon===
Ang mga larong may arbitraryo ngunit may hangganang bilang ng mga manlalaro ay kadalasang tinatawag na mga larong n-tao.<ref>{{harv|Luce & Raiffa|1957}}</ref>. Ang [[teoriyang evolusyonaryong laro]] ay tumuturing sa mga larong kinsasangkutan ng isang populasyon ng mga tagagawa ng desisyon kung saan ang prekwensiya kung saan ang isang partikular na desisyon ay ginawa ay maaaring magbago sa loob ng panahon bilang tugon sa mga desisyong ginawa ng lahat ng mga indibiwal sa populasyon. Sa biolohiya, ito ay nilalayon namag-modelo imodelo angng biolohikal na [[ebolusyon]] kung saan ang ang nakaprogramang [[henetika|henetikong]] ng [[organismo]] ay nagpapasa kasama ng kanilang mga pagpoprogramang stratehiya sa kanilang mga supling. Sa [[ekonomika]], ang parehong teoriya ay nilalayon na ibihagbumihag angng mga pagbabago sa populasyon dahil ang mga tao ay gumagampan ng papel sa laro ng maraming mgmga abesebeses sa loob ng kanilang panahon ng buhay at may kamalayang(at marahila ay makatwiran) na naglilipat ng mga stratehiya.<ref>{{harv|Webb|2007}}</ref>
 
===Mga kalalabasang stokastiko(at relasyon sa ibang mga larangan)===
Ang mga problema ng indibidwal na desiyon na may mga kalalabasang [[stokastiko]] ay minsang itinuturing na mga larong isang manlalaro. Ang mga sitwasyong ito ay hindi itinuturing na larong teoretikal ng ilang mga may akda. Ang mga ito ay maaaring imodelimodelo gamit ang mga parehong kasangkapan sa loob ng mga kaugnay na disiplina ng [[teoriya ngteoriyang desisyon]], [[pagsasaliksikmga ngoperasyong operasyonpagsasaliksik]], at mga area ng [[Intelihensiyang Artipisyal]], partikular na ang [[pagpaplanong AI]](na may kawalang katiyakan) at [[sistemang maraming ahente]]. Bagaman ang mga larangang ito ay may iba't ibang mga motibator, ang [[matematika]] na nasasangkot ay malaking pareho, e.g, gamit ang mga [[prosesong desisyong Markov]](MDP). Ang mga kalalabasang stokastiko ay maaari ring imodelo sa mga termino ng teoriya ng laro sa pamamagitan ng pagdaragdag ng isang randomang umaasal na manlalaro na gumagawa ng mga "galaw na tsansa" na tinatawag ring [[galaw sa kalikasan]].<ref>{{harv|Osborne & Rubinstein|1994}}</ref> Ang manlalarong ito ay hindi karaniwang itinuturing na ikatlong manlalaro na kundi ay isang larong dalawang manlalaro ngunit tanging nagsisilbi upang magbigay ng pagikot ng [[dice]] kung inaatasan ng laro. Para sa ilang mga problema, ang ilang mga pakikitungo sa pagmomodelo ng mga kalalabasang stokastiko ay maaaring tumungo sa iba't ibang mga solusyon. Halimbawa, ang pagkakaiba sa pakikitungo sa pagitan ng MDP at [[solusyong minimaks]] ay ang huli ay tumuturing sa kasong masahol kesa sa hanay ng mga galaw adbersaryal kesa sa pangangatwiran sa ekspektrasyon tungkol sa mga galaw na ito sa ibinigay na nakapirmeng distribusyong probabilidad. Ang pakikitungong minimaks ay maaaring mapapakinabangan kung saan ang mga modelong stokastiko ay hindi makukuha ngunit maaaring labis na magtantiya ng labis na hindi malamang(ngunit magastos) na mga pangyayari na drmatikong umimpluwnsiya sa stratehiya sa gayong mga eksena kung ipinagpapalagay na ang kalaban ay magpupwersa ng gayong pangyayari.<ref name=McMahan>Hugh Brendan McMahan (2006), ''[http://www.cs.cmu.edu/~mcmahan/research/mcmahan_thesis.pdf Robust Planning in Domains with Stochastic Outcomes, Adversaries, and Partial Observability]'', CMU-CS-06-166, pp. 3-4</ref> Ang mga pangkalahatang model na kinabibilangan ng lahat ng mga elemento ng kalalabasang stokastiko, mga kalaban at parsiyal o maingay na obserbabilidad(ng mga galaw ng ibang mga manlalaro) ay pinag-aralan rin. Ang [[pamantayang ginto]] ay itinuturing na parsiyal na mapagmamasdang [[larong stokastiko]](POSG) ngunit kaunting mga problemang realistiko ay magagawang komputasyonal sa representasyong POSG.
<ref name=McMahan/>