我們都生於這個競爭激烈的社會裡,很多人都不自覺地相信「你的付出」就等如「我的收獲」、「你的失去」就等如「我的獲得」;公司裡充滿政治氣氛,就正正因為很多人都相信要往上爬就非得踏在人家頭上,總不能全民一起升職吧!我們從小在學校裡就被薰陶了要考第一才能成材的思想,第一也只能得一位,我們只有「爭」。乘電梯/乘車/去樂園也是爭先恐後,因為想「上位」的人總比空出的位置多。而在現今全民皆「股」的巿場氣氛中,大戶賺多少就等如散戶蝕多少!一正一負,加起來永遠是零,股票巿場是一個零和遊戲,而大多數人歷經不同的教育或薰陶後,都不期然地認為這就是世界規則。一個人的失去,就等如另一個人的獲得,零和遊戲就是世界規則。
可是,世界的規則並不是如此,世界並不是要你從人家那兒強搶甚麼才得能得到甚麼;相反地,世界的規則是你愈付出得多愈給得多,你將會得到更加多!
世界的運行可以是雙贏遊戲,全世界都可以是贏家,但實際上有多少贏家多少輸家卻要看世人的自私/無私的程度,努力/怠惰的程度。世上的資源是多是少也是一個相對的概念,空氣並非無限,但要供給地球上所有的生物都總算是綽綽有餘了!而石油卻是靠開採所得的,地底或許有很多天然資源,但對人類而言,它卻是有限的,所以也是有「價」的資源!(很多人或許已有簡單的經濟學概念,但我會在往後的篇幅裡加入些簡易入門的經濟學,有興趣者可往參閱!)
其實當我們每個人都變得更加好的時候,這個世界就會比我們加起來的好更加好!
就等於在經濟學裡面的囚徒困境(Prisoner's dilemma),這個囚徒困境是博弈論(Game Theory)的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體的最佳選擇。如果每個人都很自私地只會自己著想的話,其實我們每個人得到的回報會比我們都為大家設想時的少!
如果我們能改變我們的思想,去為社會的利益而努力的話,我們全世界能得到的就會更加多!
1+1 > 2!
02 August, 2011
經典的囚徒困境 (Prisoner's Dilemma)
經典的囚徒困境
1950年,由就職於蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述,並命名為「囚徒困境」。經典的囚徒困境如下:
警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人有罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:
若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。
若二人都保持沉默(Stays silent)(相關術語稱互相「合作」),則二人同樣判監半年。
若二人都互相檢舉(Confesses)(互相「背叛」),則二人同樣判監2年。
用表格概述如下:
________| 甲沉默(合作) | 甲認罪(背叛)
乙沉默(合作) | 二人同服刑半年 |甲即時獲釋;乙服刑十年
乙認罪(背叛) |甲服刑十年;乙即時獲釋 | 二人同服刑兩年
如同博弈論的其他例證,囚徒困境假定每個參與者(即「囚徒」)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為「嚴格劣勢」,理性的參與者絕不會選擇。另外,沒有任何其他力量干預個人決策,參與者可完全按照自己意願選擇策略。
囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇:
若對方沉默、我背叛會讓我獲釋,所以會選擇背叛。
若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。
二人面對的情況一樣,所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略(dominant strategy)。因此,這場博弈中唯一可能達到的納什均衡(Nash equilibrium),就是雙方參與者都背叛對方,結果二人同樣服刑2年。
這場博弈的納什均衡,顯然不是顧及團體利益的帕累托最優解決方案。以全體利益而言,如果兩個參與者都合作保持沉默,兩人都只會被判刑半年,總體利益更高,結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。均衡狀況會是兩個囚徒都選擇背叛,結果二人判監均比合作為高,總體利益較合作為低。這就是「困境」所在。例子華麗地證明了:非零和博弈中,帕累托最優(Pareto optimum)和納什均衡(Nash equilibrium)是互相衝突的。
*引用維基百科
1950年,由就職於蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述,並命名為「囚徒困境」。經典的囚徒困境如下:
警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人有罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:
若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。
若二人都保持沉默(Stays silent)(相關術語稱互相「合作」),則二人同樣判監半年。
若二人都互相檢舉(Confesses)(互相「背叛」),則二人同樣判監2年。
用表格概述如下:
________| 甲沉默(合作) | 甲認罪(背叛)
乙沉默(合作) | 二人同服刑半年 |甲即時獲釋;乙服刑十年
乙認罪(背叛) |甲服刑十年;乙即時獲釋 | 二人同服刑兩年
如同博弈論的其他例證,囚徒困境假定每個參與者(即「囚徒」)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為「嚴格劣勢」,理性的參與者絕不會選擇。另外,沒有任何其他力量干預個人決策,參與者可完全按照自己意願選擇策略。
囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇:
若對方沉默、我背叛會讓我獲釋,所以會選擇背叛。
若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。
二人面對的情況一樣,所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略(dominant strategy)。因此,這場博弈中唯一可能達到的納什均衡(Nash equilibrium),就是雙方參與者都背叛對方,結果二人同樣服刑2年。
這場博弈的納什均衡,顯然不是顧及團體利益的帕累托最優解決方案。以全體利益而言,如果兩個參與者都合作保持沉默,兩人都只會被判刑半年,總體利益更高,結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。均衡狀況會是兩個囚徒都選擇背叛,結果二人判監均比合作為高,總體利益較合作為低。這就是「困境」所在。例子華麗地證明了:非零和博弈中,帕累托最優(Pareto optimum)和納什均衡(Nash equilibrium)是互相衝突的。
*引用維基百科
Subscribe to:
Comments (Atom)