羅伯特?奧曼的博弈論及其經濟理論
一、博弈論:交互式條件下“最優理性決策”
一般認為,博弈理論始于1944年。數學家約翰•馮•諾伊曼(john von neumann)和經濟學家奧斯卡•摩根斯坦(oskar morgenstern)合作出版了《博弈論與經濟行為》一書,概括了經濟主體的典型行為特征,提出了策略型與廣義型(擴展型)等基本的博弈模型、解的概念和分析方法,奠定了經濟博弈論大廈的基石,也標志著經濟博弈論的創立。
那么,什么是博弈論?奧曼認為,較具描述性的名稱應是“交互的決策論”。可以看到,奧曼對博弈論的定義是十分簡潔凝練的。因為博弈論是研究決策者的行為發生直接相互作用時的決策以及這種決策的均衡問題的,就是說人們之間的決策與行為將形成互為影響的關系,一個經濟主體在決策時必須考慮到對方的反應,所以用“交互的決策”來描述博弈論是再簡潔不過的了。奧曼還以經濟主體的理性為分析的出發點,認為博弈論是交互式條件下“最優理性決策”,即每個參與者都希望能以其偏好獲得最大的滿足。如果僅有一個參與者,通常就會產生劃分明確的最優化問題。而在多人參與者的博弈論中,一個參與者對結果的偏好等級并不意味著是他的可能決策的等級,這個結果也取決于其他參與者的決策。
奧曼還分析了一般和特殊模型中的“解概念”,指出,就社會科學的理性方面而言,博弈論是一種概括或“統一場論”。這里的“社會”是廣義的,包括人類和非人類的參與者(如計算機、動物、植物等)。與探討像經濟學或政治學等學科的他種方法不同,博弈論不利用個別的、特定的結構討論各種具體問題,如完全競爭、壟斷、寡頭壟斷、國際貿易、征稅、表決、威懾等等。更確切地說,博弈論發展了原則上應用于所有交互情形的一套方法,并進而探討這些方法在每一具體應用中所導致的結果。從一般博弈論方法得到的結果與用較為特殊的方法得到的結果之間,常常出現密切的聯系。然而在其他的情形下,博弈論方法會得出一些其他方法未能得出的新見解。
二、完全競爭經濟:參與者連續統模型
眾所周知,完全競爭經濟模型描述了一種存在著許多參與者(居民和廠商),并且每個參與者的影響都是微不足道的市場情形。就是說,在完全競爭的經濟狀態下,每個居民或廠商的交易量相對于市場總量來說是很小的,任何一個人交易的商品數量并不會影響總供給和總需求。然而,奧曼認為:“事實上,只要僅存在有限多的參與者,個別參與者對經濟的影響就不能被忽視。因此,適合于完全競爭的直觀上的概念的數學模型必須包括無限多的參與者。我們認為適合這個目的的最自然的模型包括了參與者連續統(continuum),類似于一條線上點的連續統或流體中粒子的連續統。”
在經濟理論中,“連續統”觀點的引入對經濟學的學科發展有很大的影響。奧曼指出,連續統可以被看作接近于存在許多但是數量有限的粒子(或經濟主體,或策略,或可能的價格)的真實情形。采用連續統的粗略估計的目的是使稱為“分析”的數學分支的強有力的、精確的方法得以應用,而使用有限的方法將會更困難甚至是無望的。古典經濟學假定每個人接受既定的所有商品的價格(單個居民或廠商的決策不能影響價格)。為了使經濟處于穩定的狀態,價格必須使總需求等于總供給,這就是瓦爾拉斯的競爭均衡(walrasian competitive equilibrium)。奧曼證明了它的存在,并用商人連續統的市場作了明確的說明。
奧曼還考慮了稱為聯盟的團體和它們之間以互益的方式進行的交易。競爭均衡定義假定廠商允許市場力量決定價格,他們根據市場價格進行交易;而對埃奇沃思著名的“契約曲線”(contract curve)進行概括的博弈論概念的核心,則認為這個核心由在此之上沒有聯盟可以有所進步的所有分配組成,它忽視了價格機制,僅僅涉及參與者之間的直接交易。奧曼指出,競爭分配的核心和模式與廠商連續統的市場相一致。奧曼通過精確表達完全競爭觀點的連續統模型,成功地使最初由埃奇沃思提出,經許多其他模型改進的理論精確化,并從此成為經濟理論的基本準則之一。
此外,1975年,奧曼還獲得了另一個完全競爭經濟中競爭分配和值分配之間等價性的結果。在奧曼看來,博弈論和經濟理論中最顯著而獨有的現象或許是競爭市場經濟的價格均衡與對應的博弈的主要解概念(除一個以外)之間的關系。直觀上看,等價性原理是說,市場價格的建立是從在完全競爭市場上運轉的基本力量自然地產生的,幾乎不管我們假定這些力量是怎樣運轉的。
綜上所述可以看到,完全競爭分析所獲得的基本觀點,使對完全競爭之外的基本經濟問題的研究成為可能并且更加容易。在這方面,奧曼最重要的貢獻和影響是利用一個或更大的參與者的連續統建立的壟斷和寡頭壟斷競爭模型,以及公共經濟學基于經濟活動和政治過程相互交織的稅收模型,如表決、固定價格模型等。
三、重復博弈論:理論系統性的發展
重復博弈是指同樣結構的博弈重復多次,其中的每次博弈稱為“階段博弈”。重復博弈是動態博弈中的重要內容,它可以是完全信息的重復博弈,也可以是不完全信息的重復博弈。奧曼對重復博弈的貢獻在于對理論系統性的發展起了一定的促進作用。
首先是對完全信息的重復博弈研究的促進。完全信息博弈的最早結果出現在50年代,被稱為“佚名定理”。該定理認為,重復博弈的策略均衡結局與一次性博弈中的可行的個體理性結局恰好相一致。這個結局可被視為把多階段非合作行為與一次性博弈的合作行為聯系在一起。然而,雖然所有可行的個體理性結局確實代表了合作博弈的解觀點,但是它相當模糊,并且不提供信息。而奧曼認為,完全信息的重復博弈論與人們之間相互作用的基本形式的演化相關。它的目的是解釋諸如合作、利他主義、報復、威脅(自我破壞或其他)等現象。博弈論和新古典經濟學模式的現象,可能一開始看起來是非理性的。
奧曼還考察了許多具體的合作行為,定義了“強均衡”概念,即沒有任何參與者團體可以通過單方面改變它們的決策來獲益的情形。他指出,重復博弈的“強均衡”與一次性博弈的核(更精確的是“6核心”)相一致。為此,奧曼定義和研究了經濟理論中極為重要的“一般”合作博弈,即非轉移效用(non-transferable utility)博弈,這開拓了該領域的研究空間,因為在此之前,僅有“單邊支付”博弈被研究,即每個聯盟可以任意在其成員中分享一定數額的贏得。
其次是對不完全信息的重復博弈研究的促進。從20世紀60年代中期開始,奧曼和其他合作者一起,在其學生的輔助下,發展了不完全信息的重復博弈論。1966年,奧曼和m.馬希勒(michael maschler)在給美國武器控制和裁軍機構的開創性報告中,建立了不完全信息的重復博弈模型。他們指出,信息使用的復雜性實際上可以以一種出色的、簡練的、明確的方式來解決。在最簡單的一個重復的2人零(zero-sum)和博弈中,其中一個參與者比另一個擁有更多的信息(這就是所謂的單邊的不完全信息),擁有更多信息的參與者所使用(并揭露)的信息數量是被精確地決定的;有時是完全揭露或根本沒有揭露;有時是部分揭露。這種分析被擴展至更一般的模型,即2人零和博弈與非零和博弈。許多新的精深的觀點和概念由此產生。例如,奧曼、馬希勒和斯特恩斯在1968年引入了一個“聯合控制的彩票”(jointly controlled lottery)的概念,即沒有參與者可以單方面地改變彩票不同結果的可能性,這個概念與非零和博弈密切相關。之后,奧曼在重復博弈上的研究獲得了豐碩成果。事實上,他的有關不完全信息博弈的許多重要觀點已被應用于許多經濟學科,諸如寡頭壟斷、委托人與代理人、保險等等。
四、合作與非合作博弈論:非轉移效用與理性的假設
博弈論還可以劃分為合作博弈與非合作博弈。在20世紀50年代,既是合作博弈發展的鼎盛期,又是非合作博弈的開創期。奧曼在該方面的貢獻在于,一方面把“可轉移效用”理論擴展為一般的非轉移效用理論;另一方面發展并提煉了“什么是理性”,使之形成統一的觀點。
合作博弈理論不討論理性的個人如何達成合作的過程,而是直接討論合作的結果與利益的分配。合作博弈的基本形式是聯盟型博弈,它隱含的假設是存在一個在參與者之間可以自由轉移的交換媒介(“貨幣”),每個參與者的效用在其中是線性的。這些博弈被稱為“單邊支付”博弈,或“可轉移效用”博弈(tu-games)。奧曼把“可轉移效用”理論擴展到一般的非轉移效用理論,發展并加強了可轉移效用和非轉移效用的合作博弈論。他先是界定了非轉移效用聯盟形式的博弈概念,然后提出了相應的合作解的概念。他研究了不同模型中的合作解,同時,將非轉移效用值公理化,這是奧曼對合作博弈論基本原理所作的貢獻之一。在1985年,奧曼還成功地制定了描述非轉移效用值的一個簡單公理集,這不僅拓展了這一領域的研究,而且產生了許多新的研究方向。
非合作博弈論的重點是對個體的戰略選擇,即每個參與者如何博弈,或者說選擇什么策略達到他的目標。與之不同,合作博弈理論的重點則是對群體,并僅從更一般的意義上闡述了每個聯盟的贏得,而沒有說明如何贏得。奧曼通過多年的努力,發展并提煉了“什么是理性”。他認為:“如果一個參與者在既定的信息下最大化其效用,他就是理性的。”因此,一個理性人選擇他最偏好的行動,當然“最”是相對于他所掌握的(關于環境和其他參與者的)知識而言的。令人驚訝的是,這個看上去簡單清晰的表述可以以不同的方式理解,當然,也有些是互相矛盾的。什么是“參與者的信息”?他知道其他人的什么情況?是他們的理性嗎?奧曼在他的許多影響深遠的研究工作中解決了這些問題,并為這些模型制訂了標準。
首先,他考察了知識和信息問題。對于這個問題,奧曼相當精確地概括出具有常識性的概念。他指出,如果開始時兩個參與者具有了相同信念,但在對于一個具體事件的較晚的信念(基于不同的個人信息)是常識的,則這些較晚的信念必然形成一致。奧曼的觀點對非博弈論產生了重大的影響。一方面,它導致了涉及多人情形下知識的正式概念的“交互認識論”整個領域的發展。另一方面,它形成了許多應用范疇。從經濟模型——諸如只要人們有相同的最高執行官,他們的行為是人所共知的,那么具有不同信息的人們之間就不會產生交易——到計算機科學——用于分析分布環境,諸如多重處理器網絡等。
其次,他假定參與者是“貝葉斯理性的”(bayesian rational)。這在一人決策論中或許是標準的,但是它在多人模型中是否也適用?奧曼引入了相關均衡的基本理論概念。相關均衡出現在經濟和其他許多領域,引起了對不同交流程序和通常所說的“機制”的更重要的研究。
同時,奧曼還研究了“達到古典納什均衡所需要的理性和理性知識的范圍”的基本問題。他的觀點與專業人士相反,認為答案并不一定是“理性的常識”。嚴格的理性是對決策者行為復雜的假設,由此產生了對邊界理性模型的考察,該模型放寬了假定。奧曼指出,在交互情形下,微小的非理性是如何起很大作用的。實際上,在某些情形下,它能夠導致重復博弈的合作。
五、其他貢獻
奧曼在值集函數(即值為點集而非單獨一點的函數)領域,也作出了許多重要的貢獻,如“奧曼可衡量選擇定理”、值集函數積分結果等。大部分問題產生于對不同博弈論和經濟模型的研究,經濟人連續統和數學理論是這些模型演化和分析的重要工具。奧曼所獲得的諸如一般均衡、最優分配、非線性編制程序、控制理論、測量理論、定點理論等結果是基本的,它們被應用于經濟學、數學、運籌學等許多領域。此外,奧曼把庫恩(kuhn)著名的完全檢索有限博弈中的行為和混合戰略的均衡結果擴展為無限的情形,克服了復雜的技術困難。除了他發表的書外,奧曼多年來對許多人的研究產生了直接的影響。他向他們建議并提出了重要的問題和研究的渠道,與他們分享了深層的理解,幫助并鼓勵他們從事研究工作。奧曼總是引導他的學生走向這一領域,與學生之間形成了雙向反饋的相互作用,所獲得的結果又被他用于塑造和提煉他的觀點和理解。
六、簡評
在過去的幾十年中,奧曼對博弈論和經濟理論的發展作出了重要貢獻。可以說,在當代的博弈論研究中幾乎沒有他未涉足過的領域。他的研究具有與眾不同的廣度和深度,他的科學貢獻從基本概念、學科的發現與形成到適當工具與方法的發展在分析不同具體問題中的應用,都具有開創性的進展。值得注意的是,奧曼的大部分研究與經濟理論的中心問題聯系密切。一方面,這些問題為他的工作提供了刺激和推動力;另一方面,他研究的結果產生了經濟學新的見解和思維。
同時,奧曼的哲學論文和研究也具有相當的影響力。事實上,奧曼成功地以許多不同的受眾可以接受的方式解釋了甚至是最復雜的觀點。他的研究并不止是一張簡單列表,而是展示了所有美麗和清晰的宏偉畫面,指出了成就、需要解決的困難以及將來研究的領域。毫無疑問,奧曼的觀點從總體上說,在建立并使博弈思想和經濟理論思想的輪廓更加清晰方面起了重要的作用。