時間:2023-10-08 15:33:14
序論:在您撰寫經(jīng)濟博弈理論時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導您走向新的創(chuàng)作高度。
引言
一、兩個簡單的例子
1.1 老鷹(Hawk)與鴿子(Dove)博弈
1.2 系統(tǒng)選擇博弈
二、進化博弈理論的產(chǎn)生及其發(fā)展
2.1 理性的由來及其缺陷
2.2 心理學研究成果及有限理性概念的提出
2.3 進化博弈理論的產(chǎn)生及其發(fā)展
三、進化博弈理論的基本內(nèi)容
3.1 進化博弈理論基本模型分類
3.2 進化博弈理論基本均衡概念-----進化穩(wěn)定策略
3.3 進化博弈理論基本動態(tài)概念----模仿者動態(tài)
四、進化博弈理論的應用
五、傳統(tǒng)方法的缺陷及進化博弈理論研究方法的現(xiàn)實性
5.1 新古典經(jīng)濟學均衡分析法的缺陷
5.3 進化博弈理論局部動態(tài)分析方法的現(xiàn)實性
5.3.1 局部動態(tài)分析法的均衡觀
5.3.2 局部動態(tài)法的時間觀
5.3.3 局部動態(tài)法的均衡選擇觀
5.3.4 局部動態(tài)法的特殊性
六、結論
參考文獻
摘要
本文從兩個簡單的博弈例子出發(fā),以通俗的語言全面介紹了進化博弈理論的理性基礎及其形成、發(fā)展、基本內(nèi)容和部分應用,在此基礎上文章進一步比較了新古典經(jīng)濟學、經(jīng)典博弈理論 ①及進化博弈理論在研究方法上的不同之處,并特別強調(diào)了進化博弈理論局部動態(tài)法的均衡觀、時間觀、均衡選擇觀及方法上的特殊性。進化博弈理論的局部動態(tài)分析方法既是經(jīng)濟學研究方法的一次創(chuàng)新又是經(jīng)濟學直面現(xiàn)實的有力武器。
關鍵詞:沉默互動;社會互動;進化穩(wěn)定策略;模仿者動態(tài);均衡分析法;局部動態(tài)法
引言
為什么同樣一項經(jīng)濟制度在某個地方對經(jīng)濟發(fā)展有積極的推動作用而在另一個地方對經(jīng)濟發(fā)展卻起著消極的阻礙作用?為什么能夠有效降低交易費用的中介在一些地方會出現(xiàn)而在另一些地方卻不能出現(xiàn)?為什么同樣的管理方法在一個地方顯示出高效率而在另一地方卻不具有效率?諸如此類的問題,新古典經(jīng)濟學利用均衡分析法都無法給出令人滿意的答案。均衡分析法的最大缺陷是把經(jīng)濟系統(tǒng)中參與人看作是互不聯(lián)系的單個人(僅研究單個生產(chǎn)者或消費者的行為),不能把其所考察的問題放在一定的環(huán)境中去,該方法完全忽略了制度環(huán)境、社會環(huán)境及人文環(huán)境等對參與人行為的影響,單純考察某個條件與結果之間的一一對應關系。因而,無法對現(xiàn)實中出現(xiàn)的諸多現(xiàn)象給予合理的解釋。博弈理論盡管把參與人之間行為互動關系納入到了模型之中,但依然沒能跳出新古典均衡分析法的基本框架,并且由于其對理性賦予更強的假定,使得該理論更加脫離現(xiàn)實。進化博弈理論則一反常規(guī),從一種全新的視角來考察經(jīng)濟及社會問題,它所提供的局部動態(tài)研究方法是從更現(xiàn)實的社會人出發(fā),把其所考察的問題都置于一定的環(huán)境中進行更全面的分析,因而,其結論更接近于現(xiàn)實且具有較強的說服力。進化博弈理論屬于經(jīng)濟學的前沿理論,該理論從其理論框架建立到現(xiàn)在僅僅只有近三十年的歷史,但其在經(jīng)濟學、社會學、生態(tài)學等領域卻得到了廣泛的應用,近年來已經(jīng)成為主流經(jīng)濟的研究方法之一。在我國由于歷史原因,對經(jīng)濟學的研究起步較晚,特別對進化博弈這樣的前沿理論更是知者甚少,本文的主要目的是以通俗的語言介紹進化博弈理論的相關內(nèi)容及其應用,讓讀者對該理論有一個全面的了解。
本文的結構如下:第一部分給出進化博弈理論的兩個典型的例子;第二部分對進化博弈理論的產(chǎn)生及其發(fā)展進行闡述;第三部分對進化博弈理論的基本內(nèi)容進行簡要的介紹;第四部分概述進化博弈理論的有關應用;第五部分論述傳統(tǒng)的經(jīng)濟學研究方法的缺陷及進化博弈理論研究方法的現(xiàn)實性;第六部分對進化博弈理論的發(fā)展及理論前景進行簡要的說明。
一、兩個簡單的例子
為了下文說明的方便,本文先給出進化博弈理論中兩個具有代表性的例子,在此基礎上再進一步給出該理論的基本內(nèi)容及其研究方法的基本特點。
1.1 老鷹(Hawk)與鴿子(Dove)博弈
假定一個生態(tài)環(huán)境中有老鷹與鴿子兩種動物,它們?yōu)榱松嫘枰獱帄Z有限的資源(如食物或生存空間等)而競爭。老鷹一般比較兇悍,必要時在斗爭中直到重傷。鴿子一般比較溫馴,競爭時在強敵面前常常退縮。競爭中獲勝者得到了生存資源就可以更好地繁衍后代,重傷者則不利于其后代生長,即會減少其后代的數(shù)量。如果群體中老鷹與鴿子相遇并競爭資源,那么老鷹就會輕而易舉地獲得全部資源,而鴿子由于害怕強敵退出爭奪,從而不能獲得任何資源(當然不會受傷);如果群體中兩個鴿子相遇并競爭生存資源,由于它們均膽小怕事不愿意戰(zhàn)斗,結果平分資源;如果群體中兩個老鷹相遇并競爭有限的生存資源,由于它們都非常勇猛而相互殘殺,直到雙方受到重傷而精疲力竭,結果雖然雙方都獲得部分生存資源但損失慘重,入不敷出。假定競爭中得到全部資源為50個單位(該數(shù)字也可以表示為生物的適應度、繁殖成活率或后代數(shù)量);得不到資源則表示其適應度為零;雙方重傷則用來表示。于是老鷹、鴿子兩種動物進行的資源競爭可以用一個對稱博弈來描述,博弈的支付矩陣如下:
操作依賴于該群體的初始狀態(tài)。如果初始時,該宿舍有多于4人使用操作系統(tǒng),那么該宿舍所有學生最終都會使用該操作系統(tǒng);否則所有學生最終會使用操作系統(tǒng)。
二、進化博弈理論的產(chǎn)生及其發(fā)展
進化博弈理論是經(jīng)濟學研究方法的一次創(chuàng)新,該理論從否定傳統(tǒng)理論賴以成立的基礎----理性人假定出發(fā)而建立起來一個新的分析框架,它結合了生態(tài)學、社會學、心理學及經(jīng)濟學的最新發(fā)展成果,從有限理性的社會人出發(fā)來分析參與人的資源配置行為。
2.1 理性的由來及其缺陷
經(jīng)濟學自從古希臘哲學中分離出來并成為一門系統(tǒng)的學問,是在亞當•斯密1776年發(fā)表《國富論》之后。以斯密為代表的古典經(jīng)濟學關注的核心是資源的稀缺程度如何能被人類經(jīng)濟活動所減少,他們關注的重點不是資源配置問題而是國民財富的增長及國別差異的原因。1890年馬歇爾《經(jīng)濟學原理》的出版,標志著新古典經(jīng)濟學的成形,馬歇爾之后,新古典經(jīng)濟學關注的核心逐漸轉向在給定稀缺程度下資源的最優(yōu)配置問題。稀缺資源的配置是需要人的參與,也就是說經(jīng)濟學研究的問題演變?yōu)殛P于經(jīng)濟中參與人如何把稀缺的資源配置到效率最高地方去的問題,強調(diào)個體行為在資源配置中的作用。經(jīng)濟中參與人的決策行為是通過高度復雜的思維活動作出的,為了更好地從微觀個體行為來解釋資源配置問題,新古典經(jīng)濟學借用了哲學中“理性”概念對復雜的人類行為過程進行了抽象的假定。然而,理性一詞用于經(jīng)濟學時卻對其含義的理解與哲學中對其含義的理解已經(jīng)有了明顯的區(qū)別。哲學中的理性是指人類所特有的用以探索自然和社會奧秘的認知能力,當代偉大的哲學家康德在其著作《純理性批判》一書中指出,人類理性即認知能力并不是萬能的,而是有限的。經(jīng)濟學中的理性則是指一種行為方式,具體地說即是經(jīng)濟中參與人對其所處世界的各種狀態(tài)及不同狀態(tài)對自己支付的意義都具有完全信息,并且在既定的條件下每個參與人都具有選擇使自己獲得最大效用或最大利潤的能力。
經(jīng)濟學家認為理性是至高無上的,人們憑借理性就可以完全地認識自然與社會。經(jīng)濟學中對理性的含義經(jīng)過這樣的處理以后,就使得經(jīng)濟學能夠充分運用數(shù)學理論發(fā)展的成果來進行分析。為了應用數(shù)學工具并更好地處理經(jīng)濟問題,傳統(tǒng)經(jīng)濟學家們從偏好,信念及理性三個方面來界定經(jīng)濟主體的特征,其中信念就是個體認為不同結果將會出現(xiàn)的基于個體所獲信息之上的條件概率。偏好則是基于不同結果的信念之上的序。理性是根據(jù)上述偏好及信念,個體獲得最優(yōu)決策的程度以及個體根據(jù)已經(jīng)獲得的信息來修正其信念的能力。這三個特征使得經(jīng)濟學研究的對象由現(xiàn)實人轉向了理想化的對象,經(jīng)濟學越來越偏離了現(xiàn)實。
由理性概念而引致的缺陷首先表現(xiàn)在理性人具有無限的信息收集及處理能力的均衡觀,認為經(jīng)濟系統(tǒng)常常處于均衡狀態(tài),非均衡只是一種暫時的現(xiàn)象,當受到外生因素擾動而使系統(tǒng)偏離均衡狀態(tài)時,系統(tǒng)會以線性的方式回歸均衡,這種機械式線性反應的均衡觀來源于牛頓力學,由此而得出的比較靜態(tài)分析法完全忽視了系統(tǒng)受到非線性擾動及連續(xù)因素的影響。其次表現(xiàn)在由全知全能的理性人而引致的均衡跳躍觀,認為經(jīng)濟系統(tǒng)達到均衡或者從一個均衡到另一個均衡是不需要時間的,認為時間是可逆的,即經(jīng)濟變量與物理學的變量一樣,只要條件相同系統(tǒng)的均衡也就相同,市場和經(jīng)濟對于過去的記憶是短暫的或者是沒有的。這種應用經(jīng)典牛頓力學分析方法來分析高度復雜的參與人經(jīng)濟行為使得其預測效果大打折扣。最后表現(xiàn)在其比較靜態(tài)分析方法上,傳統(tǒng)經(jīng)濟學的最基本分析方法----比較靜態(tài)分析法賴以成立的基礎是假定經(jīng)濟系統(tǒng)只受到外界一個個相互獨立、互不重疊的沖擊的影響,或者當一個因素的影響消除之后,下一因素才開始對經(jīng)濟系統(tǒng)產(chǎn)生影響。我們知道現(xiàn)實世界是普遍聯(lián)系的,各種因素之間不可能相互獨立,系統(tǒng)中任何一個因素的變動都會引起其他因素的變動,這些因素之間相互作用的時間可能很短也可能很長,各因素對最終目標會產(chǎn)生不同程度的影響。比較靜態(tài)法卻只見局部不見整體,企圖通過比較不同均衡來找出系統(tǒng)達到均衡的條件,因此得不出符合現(xiàn)實的結論,其研究方法上的局限性大大降低了其理論的現(xiàn)實意義。
2.2 心理學研究成果及有限理性概念的提出
隨著經(jīng)濟學家對理論研究的深入,特別近來實驗經(jīng)濟學的迅速發(fā)展,主流經(jīng)濟學賴以成立的基礎“理性人”假定及其基本的比較靜態(tài)均衡分析法越來越受到了人們的質(zhì)疑。相繼出現(xiàn)了許多其他的研究方法,其中在經(jīng)濟學中影響最大的就是心理學的研究方法。心理學應用于經(jīng)濟分析有著非常曲折的歷史。事實上,斯密、馬歇爾、庇古、費雪爾和凱恩斯等一批古典經(jīng)濟學家都仔細地分析了偏好和信念的心理學基礎。但從1940’s開始,一方面受到薩繆爾森及??怂沟刃乱慌苫诶硇约俣ń?jīng)濟學家的影響,心理分析在經(jīng)濟學中的地位慢慢地被降低了;另一方面理性模型也遇到了許多如Allais(1952)悖論等難以給出合理解釋的經(jīng)濟現(xiàn)象。于是1960’s開始,許多微觀經(jīng)濟學家再次運用心理學研究方法來解釋現(xiàn)實中的異常現(xiàn)象,宏觀經(jīng)濟學也把經(jīng)驗法則和適應性預期納入到其模型之中,正是在這一時期心理學家Simon(1957)提出了其著名的“有限理性”概念。然而,1970’s初隨著Robert Lucas等人提出的理性預期理論、Selten、Kreps等倡導的強調(diào)正確信念及貝葉斯修正的博弈理論及Stiglitz、Spence等研究的信息經(jīng)濟學理論相繼成為主流經(jīng)濟學的一部分,經(jīng)濟學界再一次掀起了排除滲透在經(jīng)濟學領域中心理學研究方法的熱潮,心理的研究方法在經(jīng)濟學界幾乎無立足之地,嚴格理性假定席卷整個經(jīng)濟學界。行為經(jīng)濟學的發(fā)起者Amos Tversky在經(jīng)濟學界根本找不到志趣相投者。1970’s末期,隨著心理學家Amos Tversky與Kahneman合作發(fā)表了一系列應用心理分析方法來研究經(jīng)濟學問題的原創(chuàng)性文章,如1974年他們在Science發(fā)表的Judgment under uncertainty: Heuristics and biases,1979年他們合作在Econometrica發(fā)表Prospect theory: An analysis of decision under risk,慢慢消除了經(jīng)濟學界中存在的對心理學分析方法的偏見,此后應用心理分析方法來解釋經(jīng)濟現(xiàn)象的文獻見諸于各種經(jīng)濟學期刊之中,心理分析方法也漸漸地成為了主流經(jīng)濟學的研究方法之一。
進入1980’s,隨著經(jīng)典博弈理論、生態(tài)理論及心理學理論研究的深入發(fā)展,特別是心理學家西蒙把其在心理學領域研究的成果直接應用經(jīng)濟分析并因此獲得了諾貝爾經(jīng)濟學獎,極大地激勵著經(jīng)濟及社會學家從現(xiàn)實人行為出發(fā)來解釋經(jīng)濟及社會現(xiàn)象。心理學研究表明人類認知過程首先表現(xiàn)為人們通過一種“感知秩序”進行學習活動,并形成分散的非同質(zhì)的知識,其中“感知秩序”是指人的理解力、知識和人類行動之間的關系;其次表現(xiàn)為個體通過學習所達到的理性程度的有限性,組織學習個體學習行為的整合而形成的多層次“理性結構”,個體理性便會在一個累積性的組織或制度環(huán)境中得到塑造和提高并發(fā)揮作用,在這個過程中,個體學習行為總會受到組織、習慣和文化等制度性的限制和影響。西蒙認為人類并不是完全理性而是有限理性的,因為人類認知能力有著心理的臨界極限,人類進行推理活動需要消耗大量的能量,推理也是一種相對稀缺的資源,另外決策者決策時需要大量的信息,而這些信息是不可能免費獲得的,獲得決策所需要的信息是需要大量成本的??紤]到參與人有限的知識水平、有限的推理能力、有限的信息收集及處理能力,經(jīng)濟主體的決策行為并非總是最大化的結果,其決策受到參與人所處的社會環(huán)境、過去的經(jīng)驗、日常慣例及其他人相似情形下的行為選擇等因素的影響。在有限理性條件下,由于參與人無法免費獲得決策所需要的全部信息,并且參與人即使獲得了決策所需要的全部信息也可能由于有限的計算能力而無法得出最優(yōu)決策。因此,參與人只能采取模仿、學習等簡單的直觀決策方法或一些固定的常規(guī)來進行決策。人類的決策結果受到復雜的認知過程的影響,不同的人或者同一個人在不同時間即使給出相同的條件也可能會得出不同的決策結果,即決策結果受到認知過程的路徑影響。
2002年諾貝爾經(jīng)濟學獎得主之一心理學家丹尼爾·卡內(nèi)曼(Daniel Kahneman)將源于心理學的綜合洞察力應用于研究在不確定條件下參與人的決策過程及行為結果并展示了人為決策是如何異于標準經(jīng)濟理論預測的結果。在1979年,他與有著深厚數(shù)學及哲學背景的心理學家特韋爾斯基(Tversky)提出了震撼經(jīng)濟學界的“前景理論”(Prospect theory)。他們的發(fā)現(xiàn)激勵了新一代經(jīng)濟學研究人員運用認知心理學來研究經(jīng)濟學,使經(jīng)濟學的理論更加豐富。一個理論獲得諾貝爾經(jīng)濟學獎不僅是對獲獎者過去成就的肯定,更主要說明了獲獎理論將會成為主流經(jīng)濟學未來的發(fā)展方向。2002年諾貝爾經(jīng)濟學獎授予給丹尼爾·卡內(nèi)曼標志著經(jīng)濟學的研究對象從傳統(tǒng)的“經(jīng)濟人”轉向現(xiàn)實的“社會人”,經(jīng)濟學直面現(xiàn)實。如何從有限理性出發(fā)來研究參與人的行為,許多經(jīng)濟學家對之進行了廣泛而深入的研究并提出了許多理論,在這些理論之中影響最大且受到了經(jīng)濟學界普遍接受的理論即進化博弈理論。
2.3 進化博弈理論的產(chǎn)生及其發(fā)展
進化博弈理論源于對生態(tài)現(xiàn)象的解釋,1960年代生態(tài)學家Lewontin就開始運用進化博弈理論的思想來研究生態(tài)問題。生態(tài)學家從動植物進化的研究中發(fā)現(xiàn),動植物進化結果在多數(shù)情況下都可以用博弈論的納什均衡概念來解釋。然而,博弈論是研究完全理性的人類互動行為時提出來的,為什么能夠解釋根本無理性可言的動植物的進化現(xiàn)象呢?我們知道動植物的進化遵循達爾文“優(yōu)勝劣汰”生物進化理論,生態(tài)演化的結果卻能夠利用博弈理論來給予合理的解釋,這種巧合意味著我們可以去掉經(jīng)典博弈理論中理性人假定的要求。另外,1960年代生態(tài)學理論研究取得突破性的進展,非合作博弈理論研究成果也不斷涌現(xiàn)并日趨成熟,進化博弈理論具備了產(chǎn)生的現(xiàn)實及理論基礎。
進化博弈理論應用于研究經(jīng)濟學問題在學術界曾經(jīng)引起極大的爭議,爭論的焦點在于理性假定。當時由于理性概念在經(jīng)濟學界已經(jīng)根深蒂固。多數(shù)人認為利用研究生態(tài)演化的進化博弈理論來研究參與人的行為是不合適的。因為動植物行為是完全由其基因所決定的,而經(jīng)濟問題則涉及到具有邏輯思維及學習、模仿能力的理性參與人的行為,因此,借助于進化博弈理論來研究遠比動植物復雜的人類行為顯然是行不通的。但隨著心理學研究的發(fā)展及有限理性概念的提出,越來越多的經(jīng)濟學家應用進化博弈理論來解釋經(jīng)濟現(xiàn)象并獲得了巨大的成功,利用進化博弈理論來研究并解釋經(jīng)濟現(xiàn)象的文獻大量出現(xiàn)于各種經(jīng)濟學期刊了。盡管如此,利用進化博弈理論來解釋經(jīng)濟現(xiàn)象還是需要對該理論的基本分析框架作出相應的調(diào)整。如果去掉參與人偏好、信念及理性假定等條件,那么參與人是如何作出決策的呢?進化博弈理論在處理有限理性參與人決策問題時,常常假定參與人遵循某種比貝葉斯法則更簡單的行為規(guī)則,這種行為規(guī)則應該告訴如何采取行動及如何根據(jù)經(jīng)驗來改變行為選擇,這樣參與人只要知道什么會發(fā)生,而不必知道為什么會發(fā)生。
1970年代,生態(tài)學家Maynard Smith and Price(1973)結合生物進化論與經(jīng)典博弈理論在研究生態(tài)演化現(xiàn)象的基礎上而提出了進化博弈理論的基本均衡概念----進化穩(wěn)定策略(Evolutionarily stable stragegy ESS),目前學術界普遍認為進化穩(wěn)定策略概念的提出標志著進化博弈理論的誕生。此后,生態(tài)學家Taylor and Jonker(1978)在考察生態(tài)演化現(xiàn)象時首次提出了進化博弈理論的基本動態(tài)概念----模仿者動態(tài)(Replicator Dynamics)。至此,進化博弈理論有了明確的研究目標。
1980年代以后,隨著新古典經(jīng)濟學及博弈論固有的缺陷逐漸被人們所認識,有限理性概念得到了學術界的普遍認可,加之進化博弈理論在解釋生態(tài)現(xiàn)象時獲得的巨大成功,特別是經(jīng)濟學界于1992年在康奈爾大學召開的進化博弈理論學術會議,正式確立了該理論的學術地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等經(jīng)濟學家從不同的角度對傳統(tǒng)的進化博弈理論分析框架進行拓展,并使之逐漸轉化為描述經(jīng)濟行為的理論。目前,進化博弈理論的基本理論體系雖然已經(jīng)形成但還是相當粗糙。因此,它仍然處于不斷發(fā)展和完善的階段,但該理論提供了比傳統(tǒng)理論更具現(xiàn)實性且能夠更準確地解釋并預測參與人行為的研究方法,從而得到了越來越多的經(jīng)濟學家、社會學家、生態(tài)學家的重視,我們有理由相信該理論成為主流經(jīng)濟學的一部分已經(jīng)為時不遠。
三、進化博弈理論的基本內(nèi)容
進化博弈理論結合經(jīng)典博弈理論及生態(tài)理論研究成果,并以有限理性的參與人群體為研究對象,利用動態(tài)分析方法把影響參與人行為的各種因素納入其模型之中,并以系統(tǒng)論的觀點來考察群體行為的演化趨勢。
進化生態(tài)學與博弈論的結合至少已有三十幾年的歷史,初看起來使人覺得奇怪,因為博弈論常常假定參與人是完全理性的,而基因和其他的演化載體常常被假定是以一種完全機械的方式運動。然而一旦用參與人群體來代替博弈論中的參與者個人,用群體中選擇不同純策略的個體占群體中個體總數(shù)的百分比來代替博弈論中的混合策略,那么這兩種理論就達到了形式上的統(tǒng)一。盡管這兩種理論在形式上達到了統(tǒng)一,但進化博弈理論與經(jīng)典博弈理論還是存在本質(zhì)區(qū)別。在進化博弈理論中每個參與人都是隨機地從群體中抽取并進行重復、匿名博弈,他們沒有特定的博弈對手 ④。在這種情況下,參與人既可以通過自己的經(jīng)驗直接獲得決策信息,也可以通過觀察在相似環(huán)境中其他參與人的決策并模仿而間接地獲得決策信息,還可以通過觀察博弈的歷史而從群體分布中獲得決策信息。對參與人來說,觀察群體行為的歷史即估算群體分布是非常重要的,首先,群體分布包含了對手如何選擇策略的信息。其次,通過觀察群體分布也有助于參與人知道什么是好的策略什么是不好的策略。參與人常常會模仿好的策略⑤ 而不好的策略則會在進化過程中淘汰,模仿是學習過程中的一個重要組成部分,成功的行為不僅以說教的形式傳遞下來,而且也容易被模仿。參與人由于受到理性的約束而其行為是幼稚的(Naive),其決策不是通過迅速的最優(yōu)化計算得到,而是需要經(jīng)歷一個適應性的調(diào)整過程,在此過程中參與人會受到其所處環(huán)境中各種確定性或隨機性因素影響。因此,系統(tǒng)均衡是達到均衡過程的函數(shù),要更準確地描述參與人行為就必須考察經(jīng)濟系統(tǒng)的動態(tài)調(diào)整過程,動態(tài)均衡概念及動態(tài)模型在進化博弈理論中占有相當重要的地位。
3.1 進化博弈理論基本模型分類
進化博弈理論的基本模型按其所考察的群體數(shù)目可分為單群體模型(Monomorphic Population Model)與多群體模型(Polymorphic Populations Model)。單群體模型直接來源生態(tài)學的研究,在研究生態(tài)現(xiàn)象時,生態(tài)學家常常把同一個生態(tài)環(huán)境中所有種群看作一個大群體,由于生物的行為是由其基因唯一確定的,因而可以把生態(tài)環(huán)境中每一個種群都程式化為一個特定的純策略。經(jīng)過這樣處理以后,整個群體就相當于一個選擇不同純策略(純策略集的數(shù)目就相當于群體中的種群數(shù))的個體。群體中隨機抽取的個體兩兩進行的都是對稱博弈,有些文獻中稱這類模型為對稱模型(Symmetry model)。嚴格地說,單群體時個體進行的并不是真正意義上的博弈,博弈是在個體與群體分布所代表的虛擬參與人之間進行。如第一部分的老鷹----鴿子博弈,該生態(tài)環(huán)境中有兩個種群老鷹與鴿子,它們代表兩個不同的純策略,用進化方法進行處理時認為該生態(tài)群體中每個個體都有兩種可供選擇策略即老鷹策略與鴿子策略,此時的博弈并不是在隨機抽取的兩個個體之間進行,而是每個個體都觀察群體狀態(tài)(選擇老鷹策略與鴿子策略個體數(shù)在群體中所占的比例),給定此狀態(tài)它就可以計算自己選擇不同策略所得的期望支付(嚴格地說這并不是期望支付,但為了說明的方便本文仍然借用該概念)進而確定選擇哪一個策略不選擇哪一個策略,對物種而言這就意味著種群數(shù)量的增加或減少。
多群體模型是由Selten (1980)首次提出并進行研究的,他在傳統(tǒng)單群體生態(tài)進化模型中通過引入角色限制行為(Role Conditioned Behavior)而把對稱模型變?yōu)榱朔菍ΨQ模型。在非對稱博弈個體之間有角色區(qū)分,此時可以從大群體中區(qū)分出不同的小群體,群體中隨機抽取的個體之間進行真正意義上的兩兩配對重復、匿名非對稱博弈,有時又稱之為非對稱模型(Asymmetry model)。如果我們把系統(tǒng)選擇博弈中的宿舍變成學校(整個學校相當于一個大群體)而把十個人變成十個班(每一個班看成是一個小群體,且同一班的同學無角色區(qū)分即與單群體情形一樣),每個班的學生都有多種選擇,此時該校學生所進行的計算機系統(tǒng)選擇博弈就是非對稱博弈。非對稱博弈模型并不是對單群體博弈模型的簡單改進,由單群體到多群體涉及到一系列的如均衡及穩(wěn)定性等問題的變化。Selten(1980)證明了“在多群體博弈中進化穩(wěn)定均衡都是嚴格納什均衡⑥ ”的結論,這就說明在多群體博弈中,傳統(tǒng)的進化穩(wěn)定均衡概念就顯示出其局限性了。同時,在模仿者動態(tài)下,同一博弈在單群體與多群體時也會有不同的進化穩(wěn)定均衡。
按照群體在演化過程中所受到的影響因素是確定性的還是隨機性的,進化博弈模型可分為確定性動態(tài)模型和隨機性動態(tài)模型。確定性模型一般比較簡單并且能夠較好地描述系統(tǒng)的演化趨勢,因而,理論界對之進行較多的研究。隨機性模型需要考慮許多隨機因素對動態(tài)系統(tǒng)的影響,一般比較復雜,但該類模型卻能夠更準確地描述系統(tǒng)的行為,近年來理論界對之也進行廣泛的探討[對隨機動態(tài)的詳細討論可以參閱這方面的經(jīng)典文獻Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。
3.2 進化博弈理論基本均衡概念-----進化穩(wěn)定策略
進化博弈理論的基本均衡概念---進化穩(wěn)定策略⑦ [文獻2、5有詳細介紹]是由Maynard Smith and Price(1973)及Maynard Smith(1974)在研究生態(tài)演化問題時提出來的,其直觀思想是:如果一個群體(原群體)的行為模式能夠消除任何小的突變?nèi)后w,那么這種行為模式一定能夠獲得比突變?nèi)后w高的支付,隨著時間的演化突變者群體最后會從原群體中消失,原群體所選擇的策略就是進化穩(wěn)定策略。系統(tǒng)選擇進化穩(wěn)定策略時所處的狀態(tài)即是進化穩(wěn)定狀態(tài),此時的均衡就是進化穩(wěn)定均衡。下面給出Maynard Smith and Price(1973)對進化穩(wěn)定策略的定義(此后本文稱之為原初定義),用符號表示如下:
說是進化穩(wěn)定策略,如果,存在一個<,不等式對任意都成立。其中A是群體中個體博弈時的支付矩陣;y表示突變策略;是一個與突變策略y有關的常數(shù),稱之為侵入邊界(Invasion Barriers);表示選擇進化穩(wěn)定策略群體與選擇突變策略群體所組成的混合群體。實際上相當于該吸引子對應吸引域的半徑,也就說進化穩(wěn)定策略考察的是系統(tǒng)落于該均衡的吸引域范圍之內(nèi)的動態(tài)性質(zhì),而落于吸引域范圍之外是不考慮的,所以說它只能夠描述系統(tǒng)的局部動態(tài)性質(zhì)。至于系統(tǒng)是如何進入吸引域的原初的進化穩(wěn)定策略定義所沒有給予足夠的重視。
要準確地理解進化穩(wěn)定策略概念就必須正確理解突變者和侵入邊界的含義。我們可借助于前面的兩個例子來理解。在老鷹、鴿子博弈中,當該生態(tài)環(huán)境中只有老鷹(或只有鴿子)時,這時系統(tǒng)已經(jīng)處于均衡狀態(tài),但它們都是不穩(wěn)定的均衡,因為這兩個均衡都可以被突變者侵入。開始時,假定該生態(tài)環(huán)境處于老鷹均衡,如果由于某種原因而進入鴿子時,那么隨著時間的演化,整個生態(tài)系統(tǒng)最終就會穩(wěn)定于一半為老鷹一半為鴿子的狀態(tài),即混合策略納什均衡是進化穩(wěn)定的。這說明該博弈中兩個純策略納什均衡是不穩(wěn)定的。因為,當系統(tǒng)處于純策略所表示的狀態(tài)時,只要存在突變者系統(tǒng)就會離開這種狀態(tài),所以它們都不是進化穩(wěn)定的。相反混合策略納什均衡卻不一樣,即當系統(tǒng)處于一半是老鷹一半是鴿子時,如果由于某種因素使得系統(tǒng)偏離該狀態(tài),那么系統(tǒng)會自動恢復到原來狀態(tài)。另外,在系統(tǒng)選擇博弈中突變者、侵入邊界就更為明顯,所謂突變者即是指選擇進化穩(wěn)定策略以外的策略者,且侵入邊界與不同的均衡有關。該博弈有兩個純策略納什均衡和一個混合策略納什均衡(),前一個均衡所對應的侵入邊界就是,也就是說如果選擇操作系統(tǒng)的學生數(shù)占群體總數(shù)的比例大于(即學生數(shù)大于4),那么選擇操作系統(tǒng)的突變者就不可能侵入到該群體中,如果選擇操作系統(tǒng)的學生數(shù)占群體總的比例小于(即學生數(shù)小于4),那么選擇操作系統(tǒng)的突變者就會侵入到該群體中而原來選擇操作系統(tǒng)的學生會轉而學習操作系統(tǒng)。
最初進化穩(wěn)定策略定義有比較苛刻的條件限制,如單群體、群體中個體數(shù)目無限大、系統(tǒng)只受到不連續(xù)且互不重疊沖擊的影響等。這些條件大大地限制該定義的應用,隨著學術界對進化博弈理論研究的深入,許多理論家們從不同的角度對最初定義進行了拓展,如Selten 1980首次給出了適應于描述多群體均衡的定義;Schaffer 1988首次給出了適應于描述有限規(guī)模群體的均衡定義;Foster and Young(1990)首次給出了適應于描述連續(xù)隨機系統(tǒng)的均衡定義等等(有關對進化穩(wěn)定策略進行拓展的討論見文獻[5])。最初定義是在解釋生態(tài)現(xiàn)象時提出來的,如果進行經(jīng)濟分析,時需要進行相應的改變。在分析生態(tài)現(xiàn)象時,把每一個種群的行為都程式化為一個策略,因此進化的結果將會是突變種群的消失(消失的原因在于生物的行為是由其遺傳基因唯一確定的)。如果用于經(jīng)濟分析,那么進化的結果將是那些選擇突變策略的個體最終會改變策略而選擇進化穩(wěn)定策略(因為人類可以通過學習、模仿等來改變自己所選擇的策略)。
經(jīng)典博弈理論中的核心概念納什均衡即是指一種策略組合,在該策略組合下任何個人單獨偏離都不會變得比不偏離好。納什均衡是一個靜態(tài)概念,不能描述系統(tǒng)的動態(tài)性質(zhì),用數(shù)學語言來說它是動態(tài)系統(tǒng)的不動點,納什的成功就是在于他應用拓撲學的不動點定理證明了納什均衡的存在性。進化穩(wěn)定策略必定是納什均衡策略,它是納什均衡的精練,文獻[3]對此有詳細的介紹。在進化穩(wěn)定策略的定義中引入突變者及侵入邊界使之能夠更好地描述系統(tǒng)的局部動態(tài)性質(zhì)。第一部分的兩個例子中,按照納什均衡的概念是無法得知兩個系統(tǒng)最終會選擇哪一個均衡,但利用進化穩(wěn)定策略卻可以說明系統(tǒng)最終會穩(wěn)定哪一個均衡并可以分析系統(tǒng)達到不同均衡的條件,在某種程度上,較好地解決了多重均衡選擇問題。
3.3 進化博弈理論基本動態(tài)概念----模仿者動態(tài)
進化博弈理論來源于生態(tài)學的研究,該理論基本上從“優(yōu)勝劣汰”的進化論觀點來看待群體行為的調(diào)整過程。一般的進化過程都包括兩個可能的行為演化機制:選擇機制(Selection Mechanism)和突變機制(Mutation mechanism)。選擇機制是指本期中能夠獲得較高支付的策略,在下期被更多參與者選擇;突變是指參與者以隨機(無目的性)的方式選擇策略,因此突變策略可能獲得較高支付也可能獲得較低支付,突變一般很少發(fā)生。新的突變也必須經(jīng)過選擇,并且只有獲得較高支付的策略才能生存(Survive)下來。進化博弈理論需要解決的關鍵問題就是如何描述群體行為的這種選擇機制和突變機制。博弈理論家對群體行為調(diào)整過程進行了廣泛而深入的研究,由于他們考慮問題的角度不同,對群體行為調(diào)整過程的研究重點也就不同,因而提出了不同的動態(tài)模型,如Weibull(1995) 提出的模仿動態(tài)(Imitation Dynamics)模型,認為人們常常模仿其他人的行為尤其是能夠產(chǎn)生較高支付的行為;Börgers and Sarin(1995,1997)等提出并應用強化動態(tài)(Reinforcement Dynamics)來研究現(xiàn)實中參與人的學習過程;Skyrms (1986) 引入了意向動態(tài)(Deliberational Dynamics)模型對哲學中的理性問題進行了討論;Swinkels(1993)提出了近似調(diào)整動態(tài)(Myopic Adjustment Dynamics);Borgers and Sarin(1995)提出了刺激—反應動態(tài)(Stimulus-Response Dynamics)等等。到目前為止,在進化博弈理論中應用得最多的還是由Taylor and Jonker(1978)在對生態(tài)現(xiàn)象進行解釋時首次提出描述單群體動態(tài)調(diào)整過程的模仿者動態(tài)(Replicator Dynamics)。所謂模仿者動態(tài)是指使用某一策略人數(shù)的增長率等于使用該策略時所得的支付與平均支付之差。下面就給出Taylor and Jonker(1978)提出的模仿者動態(tài)的微分形式:
化的而且因素之間的互動作用也是需要時間的。因此,均衡只是一種暫時現(xiàn)象或者在多數(shù)情況下,系統(tǒng)根本不可能達到的現(xiàn)象,要更準確地考察參與人的行為就必須運用系統(tǒng)論的觀點,把行為互動性、因素互動性及時間因素納入到其模型之中。
5.2 經(jīng)典博弈理論的策略互動分析法及其缺陷
考慮到新古典經(jīng)濟學沒有把參與人行為之間的互動關系納入到其模型之中,經(jīng)典博弈理論則在理性人假定的基礎上把參與人行為的互動關系納入到其模型之中進一步考察了參與人的決策問題。在我國,對人類互動行為的研究至少可以追溯到三國時期田賽馬的故事,但作為一種正式理論提出來,一般認為是始于馮·諾意曼和摩根斯藤(Von Neumann and O. Morgenstern, 1944)出版的《博弈論與經(jīng)濟行為》一書,直到納什(Nash 1950)在研究非合作博弈的基礎上提出著名的納什均衡(Nash Equilibrium)概念才使得博弈論成為一門完整的理論。經(jīng)過近五十年的發(fā)展,終于在1994年,三位杰出的博弈論大師:納什(John F. Nash)、澤爾藤(Rechard Selten)和海薩尼(John C. Harsanyi)獲得了經(jīng)濟學的最高榮譽——諾貝爾經(jīng)濟學獎,在全球經(jīng)濟學界再次掀起了對博弈論的研究熱潮。經(jīng)典博弈論為社會科學提供了一個新的研究視角,使我們能夠以全新的方法來處理各種沖突與合作的問題。博弈論作為一種理論工具,其應用相當廣泛。在信息經(jīng)濟學中得到了充分的應用,1996年諾獎得主Mirrlees等、2001年諾獎得主Akerlof等都對信息經(jīng)濟學研究作出了卓越的貢獻。這充分說明了博弈論在經(jīng)濟學的地位可見一斑。
經(jīng)典博弈理論的核心概念----納什均衡就是由普林斯頓大學數(shù)學家納什在研究非合作博弈時提出來的。納什均衡即是指給定其他參與人選擇的情況下,每一個人單獨偏離均衡都不會變得比不偏離好,顯然納什均衡是一個靜態(tài)均衡概念。經(jīng)典博弈理論盡管把參與人的互動行為引入到其模型之中,并認為現(xiàn)實中參與人不是孤立地作出自己的決策,每一個參與人的決策不僅依賴于其自身所面臨的條件及其所擁有的信息,而且也依賴于其他參與人的決策選擇。但該理論卻面臨著其自身無法克服的缺點。首先,博弈論中的互動是一種“沉默互動⑨ ”,這種互動不允許參與人之間存在任何形式的交流,即假定參與人都是一個個只會理性計算的孤立經(jīng)濟人而非社會人,一旦引入社會互動,許多博弈都無法進行分析,也就是說經(jīng)典博弈理論中的互動并不“社會互動”而是孤立的“沉默互動”。其次,博弈論的基本均衡概念納什均衡要求博弈各方都是理性的,并且理性是共同知識,博弈時如果某一方選擇了非理,那么博弈就無法進行下去。特別地該理論在利用后向歸納法(Backward Induction)對納什均衡進行精練時,不但要求參與人完全理性,而且還要求參與人的行為滿足序貫理性(Sequential Rationality)要求。這一比理性更強的要求使得博弈論更加遠離現(xiàn)實人。再次,在處理參與人所面臨的不確定性時,不僅要求各參與人知道世界的各種狀態(tài),而且要求參與人知道每一種狀態(tài)所出現(xiàn)的概率,并且給定一個先念信念,當出現(xiàn)任何新信息時,每個參與人都能夠應用貝葉斯法則修正自己的先念信念,也就是說參與人不但具有很強的計算、推理能力,而且能夠在一個大的狀態(tài)空間上應用貝葉斯法則解決相當復雜的問題?,F(xiàn)實中多數(shù)情況下,參與人并不都具有這種計算、推理能力。最后,博弈論碰到了其最棘手的問題就是多重均衡的處理,當博弈出現(xiàn)多重均衡特別是多重嚴格納什均衡時,盡管許多理論家提出了一些方法(Selten(1965)提出的子博弈精煉納什均衡概念,Selten(1975)提出的顫抖手精練納什均衡,Kerps—wilson(1982)提出的序貫均衡,Schelling(1960)提出的聚點均衡等)來處理多重均衡問題,但始終沒能獲得一致認可的結論。
與新古典經(jīng)濟學相比,經(jīng)典博弈理論雖然在其模型中納入了行為的“沉默互動”關系,但該理論給出的研究方法仍然沒能跳出新古典經(jīng)濟學的均衡分析框架,這種只注重結果而忽略達到結果的過程的分析方法依然把對經(jīng)濟系統(tǒng)的影響因素都看作為一個個孤立因素,依然認為影響因素與決策結果是一一對應的關系,依然沒能把參與人所處社會環(huán)境等因素納入到其模型之中,因而不能準確地描述現(xiàn)實中人的決策行為,其結論也僅僅具有理論意義而缺乏政策含義。
5.3 進化博弈理論局部動態(tài)分析方法的現(xiàn)實性
進化博弈理論利用達爾文“優(yōu)勝劣汰”的生物進化論、經(jīng)典博弈理論并結合心理學的研究成果,從西蒙提出有限理性(Bounded Rationality)的參與人群體出發(fā),通過對群體行為的研究進一步得出參與人個體的行為。進化博弈理論跨越了完全理性的“經(jīng)濟人”與有限理性的“社會人”的鴻溝,實現(xiàn)了經(jīng)濟學研究方法革命性的突破。與傳統(tǒng)均衡分析法相比,進化博弈理論的局部動態(tài)分析方法在以下幾個方面獨具特色。
5.3.1 局部動態(tài)分析法的均衡觀
傳統(tǒng)的均衡分析方法認為完全理性參與人能夠?qū)Νh(huán)境的任何變化作出迅速的最優(yōu)反應,因而,經(jīng)濟系統(tǒng)是常常處于均衡狀態(tài)的,分析參與人的行為只需要研究均衡結果,并以此來預測經(jīng)濟人的行為,通過比較不同均衡結果來尋找系統(tǒng)達到均衡的條件。這種處理方法為了數(shù)學上處理的方便而撇開現(xiàn)實中“因素互動”而分別考察單個因素對均衡的影響,使得理論更加缺乏現(xiàn)實基礎。進化博弈理論則完全摒棄傳統(tǒng)理論中非現(xiàn)實的“理性人”假定,直接從有限理性參與人群體出發(fā)而提出的一種全新的研究方法----局部動態(tài)法。局部動態(tài)法把經(jīng)濟系統(tǒng)達到均衡結果的過程納入到其模型之中,認為經(jīng)濟系統(tǒng)達到均衡需要一個長期的漸進過程,均衡結果依賴于達到均衡的過程,也就是說任何一個結果都是路徑依賴的,它與混沌經(jīng)濟學完全動態(tài)的研究方法具有某種程度的相似之處。
5.3.2 局部動態(tài)法的時間觀
傳統(tǒng)的均衡分析法并沒有納入因素互動關系并且理性計算是不需要時間的,所以得出經(jīng)濟系統(tǒng)常常是均衡的結論。進化博弈理論的局部動態(tài)法一個顯著特征就是把參與人的決策過程時間及因素互動的時間納入到其基本模型之中,強調(diào)系統(tǒng)達到均衡的過程,并認為經(jīng)濟系統(tǒng)由于受到各種互動行為及互動因素的影響,有些系統(tǒng)達到均衡可能只需要很短的時間,有些系統(tǒng)達到均衡可能需要很長的時間,有些系統(tǒng)可能無法達到均衡。時間因素對經(jīng)濟學研究有著非常重要的意義,如均衡分析法無法考慮宏觀經(jīng)濟政策中“時滯”使得許多實施時有效的政策在發(fā)生作用時卻出現(xiàn)了與原意相反的結果。時間是度量政策效率的一個很重要的因素,如果不考慮時間因素有些政策可能很有效率,但納入時間因素,一些需要太長時間才能使系統(tǒng)達到意愿均衡的政策可能根本就沒有效率。進化博弈理論把時間納入到模型分析中并充分應用數(shù)學中的相圖來描述經(jīng)濟系統(tǒng)達到均衡的路徑,這樣有利于決策者控制經(jīng)濟系統(tǒng)使之朝向既定的目標前進,也有利于決策者尋找能夠最大限度地促進系統(tǒng)向意愿均衡轉化的因素,使系統(tǒng)盡快達到有效率的均衡。
5.3.3 局部動態(tài)法的均衡選擇觀
新古典經(jīng)濟學研究的邏輯有理性就有均衡,然后在既定均衡下通過對不同均衡的比較來尋找系統(tǒng)達到不同均衡的條件,即比較靜態(tài)法,最后結合條件找出希望達到的均衡,因此,該理論不存在真正意義的均衡選擇問題。經(jīng)典博弈理論提供的分析方法在多數(shù)情況下都存在其自身所無法處理的多重均衡問題。如老鷹與鴿子博弈及系統(tǒng)選擇博弈中多重均衡問題。進化博弈理論的局部動態(tài)法引入突變因素就能夠較好地解決了多重均衡的選擇問題,在老鷹與鴿子博弈中,盡管全是老鷹(全是鴿子)都是均衡的,但這兩個均衡都極不穩(wěn)定即都不是進化穩(wěn)定均衡,一旦有鴿子(老鷹)突變者進入該系統(tǒng)就會使系統(tǒng)偏離,隨著時間的推移而使得系統(tǒng)趨向于混合策略進化穩(wěn)定均衡即一半鴿子一半老鷹(該均衡是一個全局吸引子);在系統(tǒng)選擇博弈中經(jīng)典博弈理論無法解釋系統(tǒng)最終會趨于哪一個均衡,局部動態(tài)法引入了突變因素就能夠很好地解決了均衡選擇問題,即系統(tǒng)最終會趨于哪一個均衡依賴于系統(tǒng)的初始狀態(tài)即路徑依賴。進化博弈理論的基本均衡概念----進化穩(wěn)定均衡描述的是當經(jīng)濟系統(tǒng)一旦進入到某一均衡的吸引域內(nèi)時,系統(tǒng)就會對其他的突變策略具有一定程度(即在突變邊界內(nèi))的抵抗力。
5.3.4 局部動態(tài)法的特殊性
新古典經(jīng)濟學與經(jīng)典博弈理論均衡分析法都是以單個消費者、單個生產(chǎn)者、單個市場為研究對象來考察參與人的最優(yōu)決策行為,并由此研究整個社會的資源配置問題。然而它們卻碰到了如何由個體行為轉化到群體行為的困難,因為這種轉化過程涉及到各種互動因素的影響。一個明顯的例子是經(jīng)典博弈理論中囚徒困境博弈,在該博弈中兩個囚徒都從個體理性出發(fā),但得到了集體非理性均衡的結論。也就是說,均衡分析法根本無法實現(xiàn)從個體行為向集體行為的過渡,在此框架內(nèi)尋找宏觀經(jīng)濟的微觀基礎的困難是非常大的。進化博弈理論的局部動態(tài)法則從人的社會性出發(fā),利用系統(tǒng)論的處理方法來看待參與人的決策行為。該理論直接以參與人的群體為其研究的邏輯起點,在考慮到影響參與人行為的社會因素、文化因素、民族習俗及個體生活習慣等因素的基礎上進一步考察群體中有限理性個體的行為互動關系,很巧妙地避開由個體行為向集體行為轉化問題,因而能夠更加真實地反應現(xiàn)實人的決策過程及其決策結果。
六、結論
進化博弈理論是經(jīng)濟學領域的前沿理論,它來源于對生態(tài)現(xiàn)象的研究,雖然該理論應用于經(jīng)濟分析的時間不長,但它為經(jīng)濟學研究提供了一個全新的分析方法,較好地克服了新古典經(jīng)濟學及經(jīng)典博弈理論中理性假定及多重均衡的困難。并且,應用進化博弈理論來研究經(jīng)濟系統(tǒng)能夠獲得比傳統(tǒng)理論更準確的結果,能夠更加現(xiàn)實地解釋經(jīng)濟現(xiàn)象,因而在短期內(nèi)為多數(shù)經(jīng)濟學家所接受。從某種意義上說引入進化博弈理論局部動態(tài)法來分析經(jīng)濟中參與人的行為是經(jīng)濟學研究方法的一次創(chuàng)新。
注釋: ①本文把源于馮·諾意曼和摩根斯藤經(jīng)納什發(fā)展而成的博弈理論稱之為經(jīng)典博弈理論。 ②即無性生殖,這樣假定的意思就是說后代繼承其母體的策略,并且永遠不改變,當然用于研究人類的行為時,需要作相應的調(diào)整。 ③所謂近視調(diào)整即是指參與人不管未來怎么樣,只知道使當前的支付最大化 ④ 經(jīng)典博弈理論中每一個參與人都有特定的博弈對象,并且,在重復動態(tài)博弈中,后行動者通過觀察先行動者的理而利用貝葉斯法則來修正自己的先念信念,然后,在此信念下選擇使自己獲得最大支付的策略。 ⑤好的策略即是指能夠獲得較高支付的策略。 ⑥所謂嚴格納什均衡即是嚴格占優(yōu)納什均衡。給定對手選擇的情況下,每個人都通過選擇嚴占優(yōu)的策略而組成的納什均衡。 ⑦事實上,這與Selten提出的顫抖手均衡概念具有相似性,所謂顫抖手均衡是指一個戰(zhàn)略組合,只有當它在允許所有參與人都可能犯錯誤時仍是每一個參與人的最優(yōu)戰(zhàn)略的組合時才是一個均衡,其嚴格定義可以參閱張維迎的《博弈論與信息經(jīng)濟學》。其中的顫抖或者犯錯誤與進化穩(wěn)定策略中的突變因素有差不多的含義,但它們之間存在本質(zhì)上的不同。 ⑧由模仿者動態(tài)方程進行支付變換,可得。 ⑨這一點我們可以從博弈論一個著名的捐款----回贈實驗中看出,募捐者要求每一個人都自愿捐款,最終募捐者以3倍于捐款總額的錢平均分派給每個捐款者,為了使得博弈能夠分析下去,募捐者要求自愿捐款時每個人都不得與其他人討論,否則該博弈就無法進行下去,因此,本文稱博弈論中的互動是一種沉默互動而非社會互動。這個實驗充分體現(xiàn)了古典經(jīng)濟學及博弈論研究對象上的一致性,即它們都是研究單個個體的行為而排除了人的一個重要特征----社會性。參考文獻
[1] 王則柯(1999):《博弈論平話》,中國經(jīng)濟出版社。
[2] 張維迎(1999):《博弈論與信息經(jīng)濟學》,上海三聯(lián)出版社。
[3] 張良橋,馮從文(2001):《進化穩(wěn)定均衡與納什均衡:兼談進化博弈理論的發(fā)展》,《經(jīng)濟科學》,3,103-111。
[4] 張良橋(2001):《理性與有限理性:論經(jīng)典博弈理論與進化博弈理論之關系》,《世界經(jīng)濟》,8,74-78。
[5] 張良橋(2003):《論進化穩(wěn)定策略》,《經(jīng)濟評論》,2,70-74。
[6] 張良橋,郭立國(2003):《論模仿者動態(tài)》,《中山大學學報自然科學版》,3。
[7] 楊小凱(2000):《新興古典經(jīng)濟學和超邊際分析》,中國人民大學出版社。
[8] 青木昌彥, 奧野正寬(1999):《經(jīng)濟體制的比較制度分析》, 魏加寧等譯, 北京: 中國發(fā)展出版社.
[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.
[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.
[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.
[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.
[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.
[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.
[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.
[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.
[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.
[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.
[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.
[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.
[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.
[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.
[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.
[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.
[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.
[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.
[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.
[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.
[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.
[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.
[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.
[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.
[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.
[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.
[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.
[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.
[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.
[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.
[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.
[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.
一、“囚犯悖論”與會計舞弊行為模型構建及分析
(一)會計舞弊行為模型構建。A、B兩同謀嫌疑犯被警察抓獲并分別關押審訊。條件:(1)兩人不能互通信息,個人只能在收益最大、損失最小的原則下做出招與不招的選擇;(2)暫不考慮價值判斷。法官告訴他們:①兩人均招供,各判刑三年;②兩人均抵賴,各判刑半年(或許因證據(jù)不足);③如一人招供,一人抵賴,招供者釋放,抵賴者重判五年。模型如下:
這是博弈支付矩陣,每格第一個數(shù)字是A的支付,每格第二個數(shù)字為B的支付。即矩陣第一行3,0為A選擇招供的付出,第二行5,0.5為A選擇抵賴的付出;矩陣第二列3,0為B選擇招供的付出,第四列5,0.5為B選擇抵賴的付出。假如B抵賴,A招供就被釋放,抵賴判刑半年,A招供比抵賴好;假如B招供,A招供判刑三年,抵賴判刑五年,A招供比抵賴好。同樣,B也是如此??梢?,無論對方如何選擇,個人的最優(yōu)選擇都是招供。由于受條件限制,二人均選擇了招供,被判刑三年,因為他們都不愿承擔自己抵賴而別人招供的風險,這種選擇只能在收益最大、損失最小的原則下作出。但因雙方抵賴才判刑半年,顯然招供的選擇不是最好的,這就是經(jīng)典博弈論中的“囚犯悖論”。
據(jù)此,我們來構建一個會計人員行為選擇的“囚犯困境”。假設甲乙兩個企業(yè)會計人在提供會計信息時有兩種選擇:如實做賬(合法)、弄虛作假(違法)。模型如下:
甲如何選擇:如果乙如實做賬,甲弄虛作假可比如實做賬多獲取3個利益單位(4-1=3);如果乙弄虛作假,則甲弄虛作假比如實做賬多獲取1.5個(2-0.5=1.5)個利益單位。無論乙做不做假,甲弄虛作假都比如實做賬獲利大,因此從個人理性出發(fā),必然選擇違法行為而作假賬。乙也同樣如此。結果大多企業(yè)“不造(假)白不造”,弄虛作假泛濫成災,成為一種社會普遍選擇。因此,從經(jīng)濟學角度看,舞弊行為的發(fā)生是舞弊者的理性選擇。
(二)會計舞弊與制假行為博弈分析。我們試分析一下,會計作假行為究竟需要“付出”什么呢?即應承擔的舞弊成本,主要有:實施過程中所付出的物質(zhì)耗費,幾乎為零;實施舞弊行為造成的后果及被有關部門追究受到制裁、懲罰,這是法律規(guī)定的違法行為應承受的代價,經(jīng)濟方面具體有:其行為受到某些限制,如吊銷營業(yè)執(zhí)照、生產(chǎn)許可證,停業(yè)、整頓、解散等處罰;給國家、社會、個人造成的財產(chǎn)或其他損失,應當以財產(chǎn)或其他經(jīng)濟利益給被損害者以補償;經(jīng)濟信譽受到的損失。其他還有如行為人、責任者受到的各類法律責任的追究。以上這些付出用C表示?!爱a(chǎn)出”呢,則是通過舞弊行為謀取的各種不正當經(jīng)濟、政治利益,用B表示。舞弊行為一旦被嚴厲查處而受到懲罰的付出的全部應為-(C+B),用q表示舞弊的被追究率,其關系如下:
弄虛作假的期望收益:
-(C+B)q+B(1-q)=(-2B-C)q+C+C
如實做賬的期望收益(謀取的不正當利益為0):0×q+0×(1-q)=0
當期望收益(-2B-C)q+C>0,選擇弄虛作假;當期望收益(-2B-C)q+C
二、會計舞弊產(chǎn)生的原因
會計舞弊同個人舞弊產(chǎn)生的前提相似。根據(jù)美國舞弊審核師協(xié)會的研究,形成會計舞弊必須滿足三個前提條件:(1)存在舞弊動機;(2)存在舞弊機會;(3)事后被發(fā)現(xiàn)的可能性很小。
(一)經(jīng)濟利益驅(qū)動是產(chǎn)生會計舞弊的內(nèi)部動因和根源。正所謂“天下熙熙,皆為利來;天下攘攘,皆為利往?!比魏紊鐣F(xiàn)象的背后,都有其深刻的經(jīng)濟利益根源,這也符合古典經(jīng)濟學的“經(jīng)濟人假定”?!敖?jīng)濟人”在一切經(jīng)濟活動中的行為都是合乎所謂的理性的,力圖以最小的經(jīng)濟代價去追逐和獲得自身的最大經(jīng)濟利益。這里所講的“利益”既包括單位利益,也包括單位領導、會計人員及其他相關人員的個人利益。因此,經(jīng)濟利益是最為常見的造假動機,是造假者最強大的內(nèi)在驅(qū)動力,造假者通過造假旨在得到直接的或間接的、現(xiàn)實的或潛在的經(jīng)濟利益,另外對政治利益的追逐和強烈的虛榮心也使造假者鋌而走險,不顧后果。
(二)造假環(huán)境促進了會計舞弊的產(chǎn)生。會計造假環(huán)境是指造假發(fā)生、發(fā)展的客觀背景、前提條件和特定時期及機遇,是會計造假存在的空間和生長發(fā)育的土壤。會計造假與其所處的環(huán)境存在著緊密聯(lián)系,假賬總是生成于一定時間和空間之中,且對其存在著一定的依存關系,并隨著社會經(jīng)濟發(fā)展的大環(huán)境和單位內(nèi)部管理的小環(huán)境的變化而不斷發(fā)展變化。
目前,我國市場秩序不規(guī)范、現(xiàn)代企業(yè)制度尚未完全建立、產(chǎn)權關系尚未理順、國有資本“所有者缺位”、國有企業(yè)“內(nèi)部人控制”的問題嚴重、不健全的法人治理結構無法對經(jīng)營者形成有效的約束和監(jiān)督機制。加之會計準則體系還不夠完善,受準則的廣泛適用性和準則本身某些既定原則的影響,會計處理的隨意性也比較大。有研究表明,我國上市公司廣泛存在著利用包括通過會計政策選擇在內(nèi)的手段操縱會計利潤的現(xiàn)象。而在監(jiān)管過程中主要問題是重“單一”監(jiān)管、輕“綜合”監(jiān)管;重“硬性”監(jiān)管、輕“柔性”監(jiān)管;重行政制裁,輕民事賠償。在現(xiàn)行的會計服務市場上,由于“內(nèi)部人控制”現(xiàn)象泛濫,審計的獨立性難以保證,注冊會計師失去了應盡的職責。
三、懲治會計舞弊幾點建議
(一)提高人員素質(zhì)。各級會計工作管理部門、單位負責人要重視和做好會計職業(yè)道德教育工作。即:職業(yè)基礎教育――敬業(yè)、愛業(yè)、樂業(yè)、勤業(yè)、精業(yè);服務宗旨教育――為人民服務,為廣大群眾服務;職業(yè)精神教育――廉潔奉公、實事求是、客觀公正、一絲不茍、嚴謹細致、忠于事業(yè)、無私奉獻;遵紀守法教育――依法辦事。
(二)加強法制建設。從法律制定方面看,其成本的設定應能有效地遏止舞弊行為的發(fā)生,足以補償受害方面的損失,體現(xiàn)社會的公正制裁,補償社會經(jīng)濟秩序所遭受的侵害。我們知道美國的法律多如牛毛,但是量化的多、抽象的少,實際應用中簡潔高效。我們也應該遵循市場經(jīng)濟的規(guī)律,增加量化標準減少原則性、抽象性的條款。例如,“重大損失”、“惡劣影響”、“性質(zhì)特別嚴重”等詞語在落實上就很含糊,可謂見仁見智。到底損失多少款項為“重大”?影響多大范圍算“惡劣”?嚴重到什么程度稱“特別”?各人都有自己的看法,而且不盡相同。再有就是像“應(該)……”、“禁止……”之類的條款,這原本沒有語病,但是,它往往缺少下文。規(guī)定某一事務應該或不能怎樣做,但沒有涉及行為人不這樣做或已經(jīng)做了要承擔的具體后果,這種條款也只是徒具形式而已。
關鍵詞:社會兩難;公共品博弈;實驗經(jīng)濟學;條件合作者;搭便車者;貨幣性懲罰;非貨幣性懲罰;非懲罰機制;性懲罰
中圖分類號:F062.6 文獻標志碼:A 文章編號:1674-8131(2013)01-0059-11一、引言
十報告指出:“堅持一切從實際出發(fā),……統(tǒng)籌各方面利益關系,充分調(diào)動各方面積極性,努力形成全體人民各盡所能、各得其所和諧相處的局面。”要構建和諧社會,形成和諧相處的局面,核心是妥善協(xié)調(diào)好各方利益。改革開放三十多年來,我國在經(jīng)濟高速發(fā)展、城鄉(xiāng)居民生活極大改善、綜合國力大大增強的同時,諸如收入分配的不平等程度加劇、城鄉(xiāng)差別擴大、區(qū)域發(fā)展不平衡等一些深層次的矛盾也逐漸暴露。在現(xiàn)階段,我國社會成員利益多元化,如何協(xié)調(diào)不同階層、不同群體間的利益,如何促使不同階層、不同群體相互合作,使整個社會資源達到合理配置,是一個很值得研究的問題。
我國不同地區(qū)或群體間存在共同的利益,但又有本地區(qū)或群體自身的利益,有時候這種共同利益和自身利益是相互沖突的,因此如何協(xié)調(diào)各方利益是一個重要的問題。群體成員的合作行為才最符合群體利益,是群體最優(yōu)行為;但個體傾向于選擇“搭便車”的行為。例如所謂的“公共地悲劇”,若按新古典經(jīng)濟學的“經(jīng)濟人假設”,所有農(nóng)民都只考慮自身的利益來決定放牧數(shù)量,這將會將導致草地資源被過度使用,最終所有農(nóng)民的利益都將受損。這種以經(jīng)濟主體暫時得利,但造成整個社會資源枯竭的“社會兩難”現(xiàn)象在社會沖突中比比皆是,如團隊生產(chǎn)活動、污水排放、公共品供給等。如果我們能夠提高這些社會兩難中決策者的合作水平,那么對于提高團隊競爭力、減少污水排放、增加公共品的供給,對于構建和諧社會都具有重要的意義。
在經(jīng)濟學實驗研究諾貝爾經(jīng)濟學獎得主諾斯認為,現(xiàn)代經(jīng)濟學的研究方法有三種:歷史的思辨的方法、實證的方法和實驗的方法。實驗經(jīng)濟學是在可控條件下應用實驗方法研究經(jīng)濟學問題的經(jīng)濟學新分支,在某些情況下,實驗方法有前兩種方法不可替代的作用?!≈校饕遣捎霉财凡┺膶嶒瀬矸治鲞@些社會兩難中的合作問題。一個簡單、典型、基準的公共品博弈實驗的內(nèi)容是:n個被試可以在私人賬戶和公共賬戶中分配E元的實驗貨幣稱為初始稟賦,其數(shù)值由實驗主持者設定,多數(shù)實驗的初始稟賦為20、40或100?!?。如果貢獻給公共賬戶X元,產(chǎn)生的收益為n名被試貢獻給公共賬戶的錢加總乘以k,再平均分給每個人k/n稱為邊際資本收益(marginal per capita return,MPCR),由實驗主持者設定,多數(shù)實驗該值為0.3、0.5或0.75?!?。投資私人賬戶的錢為E-X元,產(chǎn)生E-X元的收益。這樣,每個被試的總收益為公共賬戶收益與私人賬戶收益之和。根據(jù)新古典經(jīng)濟學的觀點,實驗環(huán)境提供了良好的搭便車的機會。公共品博弈實驗早期的研究主要包括Bohm(1972,1983)、Dawes(1980)、Dawes等(1977,1986)、Orbell 等(1990)、Marwell等(1979,1980)以及Isaac等(1988a,1988b)等文獻,這一系列的實驗發(fā)現(xiàn):(1)在單回合博弈中組內(nèi)成員平均捐贈介于初始稟賦的40%到60%之間,遠遠超過博弈理論中納什均衡的預測。個體捐贈水平則有很大的差異,有的捐贈了100%,有的不捐贈。(2)如果重復博弈,平均捐贈水平逐步下降,越來越多的局中人選擇搭便車。
劉建華:社會合作與利益協(xié)調(diào):國外公共品博弈實驗綜述Ledyard(1995)對20世紀90年代中期以前的一系列PG博弈實驗進行了綜述,并識別了一些提高合作水平的因素,包括交流、捐贈的門限值、MPCR的數(shù)值;他也討論了其他因素,這些因素看起來可能起作用但實際上總體效果不佳,比如性別和組的規(guī)模。此后,國外的公共品博弈實驗基本上是沿著兩條線路展開的:一條是探求促使被試自愿合作行為的原因;另一條則關注于如何提高與維持重復公共品博弈中的合作水平,主要包括貨幣性懲罰和非貨幣性懲罰及非懲罰機制。鑒于篇幅限制,本文將主要對第二條線路的國外實驗研究進行綜述。
二、條件合作
國外許多實驗研究發(fā)現(xiàn),在公共品博弈實驗中存在著不同類型的被試,其中條件合作者(condition cooperator)是最為普遍的類型(Brandts et al,2001;Keser et al,2000;Kurzban et al,2005;Brandts et al,2000,2009),他們對公共品的捐贈水平與他們對組內(nèi)成員捐贈水平的信念是正相關的。
Fischbacher等(2001)首先對這種條件合作行為進行了直接的實驗檢驗,發(fā)現(xiàn)50%的被試是條件合作者。他們的捐贈曲線位于45度線的下方,意味著雖然這些被試的捐贈水平與他們預期組內(nèi)其他成員的捐贈水平相關,但不是預期他人捐贈多少自己就捐贈多少,而是顯現(xiàn)出略微的自私偏向(self-serving bias)。Fischbacher等認為被試類型的異質(zhì)性可以合理地解釋為什么捐贈水平隨時間遞減:在實驗中每個組包含著條件合作者和搭便車者,對同伴的捐贈水平抱有樂觀信念的條件合作者將向公共賬戶捐贈,但隨著時間的推移,他們發(fā)現(xiàn)了被試類型的異質(zhì)性,特別是他們發(fā)現(xiàn)組內(nèi)存在搭便車者,于是他們逐漸減少捐贈,導致捐贈水平的遞減。
其他大量研究也探討這種條件合作行為,這些研究發(fā)表時間都比較接近。Sonnemans 等(1999)第一次使用“條件合作”這一術語。他們的實驗在3~12個回合內(nèi)保持組員不變,隨后組員逐漸變更,每次有一個被試離開,換另一個被試加入;被試離開的時間是共同知識;一個被試離開之后不會再與其他組員有任何關聯(lián),因此在他離開的最后一個回合里沒有動機去采用策略,而在其他回合里則有可能采用策略。研究發(fā)現(xiàn),在離開的最后一回合捐贈水平存在明顯的下降。他們還發(fā)現(xiàn)組內(nèi)存在著期望他人捐贈的被試自己也捐贈的條件合作行為。
Keser 等(2000)發(fā)現(xiàn)被試的行為并不是要么搭便車,要么利他,而是一種固有的條件行合作為。被試使用組平均捐贈的信息來鎖定他們自己未來的捐贈,大約80%的參加者采用條件合作行為,在一個回合中高于(低于)平均捐贈的人在下一個回合里會降低(增加)他們的捐贈。
Fischbacher等(2009,2010)拓展了Sonnemans 等(1999)的研究,他們使用兩種不同的實驗設置分析被試的類型。在P實驗里,被試首先進行單個回合的公共品博弈,然后填寫問卷,回答他們基于其他組內(nèi)成員的平均捐贈愿意捐贈多少。在C實驗里,被試重新隨機配對進行10個回合的線性公共品博弈,在每個回合結束后,要求估計其他組內(nèi)成員的平均捐贈。在一半的實驗局里,被試先進行P實驗,緊接著進行C實驗(P-C設置),另一半的實驗局的實驗順序則相反(C-P設置)。實驗發(fā)現(xiàn),55%的參加者是條件合作者,23%的被試是搭便車者。在C和P實驗里,條件合作者的信念與捐贈水平顯示出穩(wěn)定的正相關關系。在P實驗里,用問卷方式被歸類為條件合作者的被試的行為,與接下來他們進行的10回合的C實驗中的行為相同。P-C設置和C-P設置中被試的信念的分布無顯著差異,表明在被試參加了公共品博弈實驗之后誘導出的信念并不影響他們的偏好。
Burlando等(2005)用四種不同的方法來檢驗被試條件合作的穩(wěn)定性:(1)采用Sonnemans 等(1999)使用的“策略性方法”,(2)Offerman等(1996)使用的“分解博弈技術”,(3)在重復PG博弈實驗中往公共賬戶捐贈,(4)問卷調(diào)查??傮w而言,四種方法的結果是一致的,35%的被試是條件合作者,18%的是無條件合作者,32%是搭便車者,剩余的15%不知歸為何類。
近年來一些實驗考察了地區(qū)和文化差異對條件合作的影響。Kocher 等(2008)對美國北卡羅來納州、奧地利因斯布魯克和日本東京三個地區(qū)的被試進行研究,發(fā)現(xiàn)多數(shù)人是條件合作者,美國的被試中條件合作者較多,達81%,奧地利和日本則分別為44%和42%。Hermann 等(2008)在俄羅斯四個不同的大學招募了160個被試,研究發(fā)現(xiàn)總體上有56%的被試是條件合作者,只有6%是搭便車者,且農(nóng)村和城市的被試的偏好分布無顯著差異,社會經(jīng)濟條件似乎并不影響被試條件合作的偏好。Brandts等(2004)對日本、荷蘭、西班牙和美國進行跨文化的研究,也發(fā)現(xiàn)了條件合作行為。
鑒于在這些研究中條件合作者處于多數(shù),一個有趣的問題是當條件合作者了解到組內(nèi)存在其他條件合作者時情況會如何?Chaudhuri 等(2006)發(fā)現(xiàn)當向被試提供組內(nèi)存在條件合作者的信息時,條件合作者的捐贈額度顯著增加了。
三、利用貨幣性懲罰維持合作
庇古稅是傳統(tǒng)的價格控制手段,其稅收模型不斷完善,主要有庇古(Pigou)稅模型及古諾(Cournot)模型和斯坦克爾伯格(Stackelberg)模型等。
一、 原始的庇古稅模型
為了闡述便利,本文將英國經(jīng)濟學家庇古在1920年出版的《福利經(jīng)濟學》中提出的環(huán)境稅模型稱為原始庇古稅模型。按照庇古稅原理,由于外部性的存在,私人邊際成本曲線與社會邊際成本曲線不重合,相差外部邊際成本不由經(jīng)濟主體承擔,那么最佳私人產(chǎn)出和最佳社會產(chǎn)出存在著差異,從私人決策角度來看,是最優(yōu)決策(私人邊際成本=邊際收益),但從社會角度來看并非是最優(yōu)的。社會最優(yōu)產(chǎn)量與私人最優(yōu)產(chǎn)量間存在著差值,造成資源浪費。在市場經(jīng)濟條件下,經(jīng)濟主體不會自發(fā)地減少產(chǎn)量和使用量,進行污染治理,使外部成本內(nèi)部化,因此,庇古提出政府可以以稅收的形式進行 “非常限制”,迫使經(jīng)濟主體實現(xiàn)外部性的內(nèi)部化,這種對單位污染征收等于污染所造成的邊際社會損害的稅收即為庇古稅。
從理論上說,庇古稅可以使資源得到有效配置,使污染減少到帕累托最優(yōu)水平。在完全競爭的市場中,社會凈效益應等于由產(chǎn)生污染的經(jīng)濟活動的總效益減去私人成本,再減去外部成本。庇古得出在完全競爭的市場中,最優(yōu)的污染稅應該等于污染的邊際破壞的結論。它能使資源的配置達到帕累托最優(yōu),并成為研究解決外部性問題的理論基礎。
二、經(jīng)典庇古稅模型
雙足寡頭競爭模型,可以說是納什均衡最早的版本,即引入納什均衡后的經(jīng)典庇古稅模型。在古諾模型里,有兩個參與人(兩個企業(yè)),每個企業(yè)的戰(zhàn)略是選擇產(chǎn)量;支付是利潤,它是兩個企業(yè)產(chǎn)量的函數(shù)。每個企業(yè)在選擇自己的產(chǎn)量最優(yōu)時,只考慮對本企業(yè)產(chǎn)量的影響,而忽視對另一企業(yè)的外部負效應。
如果把古諾均衡可以看作納什均衡的第一個版本,斯坦克爾伯格模型則是博弈精煉納什均衡的最早版本。在斯坦克爾伯格模型中,企業(yè)的行動也是選擇產(chǎn)量。不同的是,在斯坦克爾伯格模型中,企業(yè)1首先選擇產(chǎn)量q1≥0,企業(yè)2(一般稱為尾隨企業(yè))觀測到q1,然后選擇自己的產(chǎn)量q2≥0。因此這是一個完全信息動態(tài)博弈。
古諾模型的分析結論是:企業(yè)1有“先動優(yōu)勢”(first-mover advantage),均衡產(chǎn)量1/2(a-c) 相對古諾雙足寡頭競爭模型時的均衡產(chǎn)量1/3(a-c)有所增加。而企業(yè)2擁有信息優(yōu)勢卻在競爭中處于劣勢,最終的均衡產(chǎn)量q*2 低于企業(yè)1的均衡產(chǎn)量q*1,利潤也隨著產(chǎn)量相應的下降。
三、最優(yōu)庇古稅模型
澳大利亞阿德萊德大學聯(lián)誼會Damania R. 2000年通過對古諾寡頭競爭模型的研究,在原有的經(jīng)典模型基礎上,考慮了開征庇古稅對企業(yè)帶來的負效應,假定環(huán)境稅收政策的變化會對企業(yè)的產(chǎn)量水平產(chǎn)生影響。他的主要結論是:污染稅的征收使企業(yè)產(chǎn)品的成本上升,導致原已供給不足的壟斷產(chǎn)量進一步減少,從而消費者剩余大幅下降。羅云峰等在線性逆需求函數(shù)和常數(shù)規(guī)模報酬條件的假定下,建立了寡頭壟斷條件下的環(huán)境污染稅收的完全信息靜態(tài)博弈古諾模型和完全信息動態(tài)博弈斯坦克爾伯格模型。認為提高稅收標準會進一步拉大企業(yè)產(chǎn)量的差距。從市場的集中程度來看,提高稅收標準將使產(chǎn)品的市場份額更加集中在領先企業(yè)手中。最優(yōu)產(chǎn)量隨稅收標準提高而減少的原因是,稅收增大了企業(yè)生產(chǎn)的邊際成本;提高稅收標準將使企業(yè)產(chǎn)品的市場價格提高,使該產(chǎn)品的消費者剩余減少。
吳偉、陳明義等人在2003年根據(jù)博弈論的基本原理,以古諾雙頭壟斷市場為前提,在古諾模型的假設條件中考慮到了企業(yè)的負債水平。討論在政府和企業(yè)的序貫博弈中,政府總體的環(huán)境管理政策(特別是污染物的稅收水平)對企業(yè)資本結構的影響,并分別從企業(yè)和政府的角度說明,適度環(huán)境管理政策的必要性和重要性。主要結論是,政府總體環(huán)境管理政策的松緊,對企業(yè)的資本結構將產(chǎn)生較大的影響(負債的比重變化);負債水平的變化方向與污染稅變化的方向相同。在總體環(huán)境政策松緊適度情況下,特定的污染稅收政策影響企業(yè)負債水平的高低。
上述的模型均基于博弈論的納什均衡原理,其研究主要思路是:首先構造利潤函數(shù),然后根據(jù)利潤最大化的一階條件,得到各企業(yè)的納什均衡最優(yōu)產(chǎn)量應該滿足的條件。以此,解得最優(yōu)產(chǎn)量以及最大的利潤,而后對于污染稅與其它變量的關系分析。求出最優(yōu)產(chǎn)量以及最大的利潤,而后對于污染稅與其它變量的關系作以研究。最優(yōu)污染稅的得出,是通過構造社會總福利的函數(shù),一般來說社會總福利包括企業(yè)的利潤、污染稅收收入、污染對環(huán)境的破壞等因素,而后總福利函數(shù)對污染稅t求一階導數(shù),即為dW(t)/dt,其中W(t)代表社會總財富,t代表稅收收入。若使社會總福利最大,則有dW(t)/dt=0。求解這個方程,即可得到最優(yōu)污染稅收以及最優(yōu)污染稅率。這里的目標是社會總福利最大。
從上述基于博弈論思想的幾個庇古稅模型中可以看出,此類模型均屬于微觀經(jīng)濟行為的分析,核心在于企業(yè)之間的博弈關系。而且較多的文獻是對古諾雙頭壟斷市場模型的進化,最終目標是社會總福利最大。從模型參與者的最終博弈結果看,最優(yōu)的污染稅在不同的假設環(huán)境下,有不同的結論。但是,由于古諾模型本身的分析是寡頭壟斷,它的參與者數(shù)量太少。當它的參與者數(shù)量足夠多,或者假設的情況過于復雜,最優(yōu)污染稅的確定會變得格外復雜。
關鍵詞:納稅理性;偷逃稅;稅務籌劃
“理性經(jīng)濟人”是經(jīng)濟學的一個基本假設,企業(yè)作為市場經(jīng)營的利益主體,其目標是追求企業(yè)經(jīng)濟利益的最大化。因此,企業(yè)自然希望能少納稅甚至不納稅,總是想方設法減輕自己的稅收負擔。在法制不完善的稅收環(huán)境下,這種動機往往演變?yōu)檫`法的偷逃稅行為。隨著我國稅收法制建設的進一步完善和稅收征管水平的提高,偷逃稅行為在一定程度上得到了遏制,納稅人開始轉向運用科學的稅務籌劃手段合法減輕自己的稅收負擔。作為不同的利益主體,企業(yè)納稅人追求的是稅后利潤的最大化,而稅務機關則盡可能保證國家稅款的應收盡收和及時征繳入庫。因此,企業(yè)納稅人與稅務機關稅收征納的博弈客觀存在,只是在不同稅收環(huán)境下兩者之間的策略選擇存在一定的差別。
一、企業(yè)偷逃稅與稅務機關的博弈分析
假定企業(yè)納稅人欲通過偷逃稅手段減輕稅負,模型中只考慮稅務機關行為對企業(yè)偷逃稅行為的影響,此時的博弈雙方是企業(yè)和稅務機關。博弈模型的建立:局中人(1)企業(yè),局中人(2)稅務機關。博弈雙方的策略:企業(yè)為偷逃稅或不偷逃稅也不籌劃,稅務機關為稅務查獲或未查獲。這里仍作如下假設:偷逃稅款額為T,被稅務機關查獲的概率為P,查獲后應補繳稅款為T,加收滯納金并處罰金為C32,查獲后用于尋租以減輕處罰的支出為F,因此影響預期收益的因素有T、P、C32、F(為研究上的方便,這里不考慮企業(yè)開展偷逃稅行為的額外成本支出,如設置兩套賬成本、心理成本等)。根據(jù)假設條件分析得出企業(yè)納稅人的得益矩陣,如圖1所示[1]:
從可以分析得出,納稅人的預期收益為:
U=T×(1-P)+(-C32)×P
=T(1-P)-C32×P=T(1-P)-λT×P
=T[1-(1+λ)P]
其中稅收處罰率λ=C32/T,當T[1-(1+λ)P]>0,即(1+λ)P<1的情況下,納稅人將獲取偷逃稅收益U>0,此時企業(yè)就有了偷逃稅的經(jīng)濟激勵;但企業(yè)并不一定選擇偷逃稅行為,其具體行為的選擇取決于納稅人的依法納稅意識和稅法遵從度[1]。
當T[1-(1+λ)P]<0,即(1+λ)P>1的情況下,納稅人偷逃稅收益U<0,此時企業(yè)偷逃稅行為是不經(jīng)濟的,但企業(yè)不一定選擇不偷逃稅。這里需要考慮一個特殊因素——稅務尋租,當不存在稅務尋租途徑時,由于偷逃稅的預期收益小于零,企業(yè)不會選擇完全不經(jīng)濟的偷逃稅行為;當存在稅務尋租途徑,企業(yè)的具體行為選擇取決于尋租支出F和逃稅支出T+C32之間的關系。若F>T+C32,則企業(yè)納稅人不會選擇偷逃稅行為,若F具體來說,在稅收處罰率λ既定的情況下,當查獲概率P<1/(1+λ)時,企業(yè)的理性納稅行為是偷逃稅行為;當查獲概率P>1/(1+λ)時,企業(yè)的理性納稅行為是納稅遵從,但在存在稅務尋租的特殊情況下企業(yè)的納稅遵從也有可能轉化為偷逃稅行為。在企業(yè)偷逃稅行為被查獲的概率P既定的情況下,當稅收處罰率λ<(1-P)/P時,企業(yè)傾向于偷逃稅的理性納稅行為;當稅收處罰率λ>(1-P)/P時,企業(yè)傾向于依法納稅。因此,為有效遏制納稅人的偷逃稅行為,稅務部門應從兩個方面著手:一是加大稅收稽查力度,二是加大稅收處罰力度,提高違法行為的查獲概率和稅收處罰率,從而促使納稅人依法納稅。
二、企業(yè)稅務籌劃與稅務機關的博弈分析
嚴格意義上講,稅務籌劃是符合國家立法意圖的一種合法行為,但這種“合法性”客觀上還需要稅務行政執(zhí)法部門的“確認”,而在這一確認過程中客觀存在著稅務行政執(zhí)法的偏差,使得企業(yè)稅務籌劃的成功與否存在很大程度的不確定性。對企業(yè)和稅務機關來說,二者之間的信息不對稱主要表現(xiàn)在企業(yè)無法準確預測稅務機關對企業(yè)稅務籌劃行為的認定態(tài)度,稅務機關也不可能完全掌握企業(yè)所有真實的納稅信息[2]。因此,企業(yè)納稅主體與稅務機關成為非完全信息博弈下的雙方主體。
假定企業(yè)所處的環(huán)境是一個穩(wěn)定的經(jīng)濟環(huán)境,則企業(yè)優(yōu)先選擇開展稅務籌劃,模型中只考慮稅務機關行為對企業(yè)稅務籌劃的影響,此時的博弈雙方是企業(yè)和稅務機關[3]。博弈模型的建立:局中人(1)企業(yè),局中人(2)稅務機關。博弈雙方的策略:企業(yè)為籌劃或不籌劃,稅務機關為稅務稽查或不稽查。這里仍作如下假設:企業(yè)開展稅務籌劃的直接成本為C1,機會成本為C2,稅務籌劃被稅務機關認定為違法行為的風險成本即加收滯納金和稅收處罰的金額為C32;企業(yè)稅務籌劃的節(jié)稅利益為T;稅務機關進行稅務稽查的稽查成本為C。
當企業(yè)選擇了開展稅務籌劃,稅務機關具有進行稅務稽查或不進行稅務稽查這兩個選擇。當稅務機關不進行稅務稽查時,企業(yè)的收益函數(shù)為U=T-C1-C2;當稅務機關進行稅務稽查時,如果認為企業(yè)的稅務籌劃是合法的,此時企業(yè)的收益函數(shù)為U=T-C1-C2;如果認為企業(yè)的稅務籌劃是違法的,此時企業(yè)的收益函數(shù)為U=-C1-C2-C32[4]。
由于受稅收征管力量和水平的影響,稅務機關客觀上并不對每個企業(yè)開展稅務稽查。假設企業(yè)估計稅務機關開展稅務稽查的概率為P1,不開展稅務稽查的概率為1-P1;稅務機關開展稅務稽查的情況下,對企業(yè)稅務籌劃“合法性”的認定概率為P2,對企業(yè)稅務籌劃“非合法性”的認定概率為1-P2,則企業(yè)開展稅務籌劃的期望收益為:
U=(T-C1-C2)×(1-P1)+(T-C1-C2)×P1×P2+(-C1-C2-C32)×P1×(1-P2),企業(yè)不開展稅務籌劃的期望收益為:U=0。
(一)稅務機關的策略選擇
盡管稅務機關開展稅務稽查的目的在于嚴格稅收征管,監(jiān)督企業(yè)依法納稅,現(xiàn)實中并不一定遵循成本收益原則,但為了研究上的方便,這里假定稅務機關也是理性經(jīng)濟人,在選擇稅務稽查時遵循成本收益原則。當企業(yè)開展稅務籌劃時,稅務機關開展稅務稽查的期望收益為:U=-C×P2+(T+C32-C)×(1-P2);稅務機關不開展稅務稽查的期望收益為:U=0。當企業(yè)不開展稅務籌劃時,稅務機關開展稅務稽查的期望收益為:U=-C;不開展稅務稽查的期望收益為:U=0。從以上分析可以看出,當企業(yè)開展稅務籌劃時,只有當稅務機關的期望收益U=-C×P2+(T+C32-C)×(1-P2)>0,即P2<(T+C32-C)/(T+C32)時,稅務機關應選擇稅務稽查策略;當企業(yè)不開展稅務籌劃時,稅務機關應采取不稽查策略。
(二)企業(yè)稅務籌劃的一般策略選擇
當稅務機關開展稅務稽查時,若企業(yè)估計稅務機關對企業(yè)的稅務籌劃認定為合法時,企業(yè)將選擇籌劃策略以取得稅收收益,此時企業(yè)稅務籌劃的期望收益為:U=T-C1-C2,且U>0;若企業(yè)估計被認定為違法行為時,企業(yè)將選擇不籌劃策略,此時企業(yè)稅務籌劃的期望收益為:U=-C1-C2-C32<0。即當稅務機關開展稅務稽查情況下,企業(yè)的收益函數(shù):
P2>(C1+C2+C32)/(T+C32),
此時企業(yè)應選擇開展稅務籌劃策略;當稅務機關不開展稅務稽查時,因為T-C1-C2>0,企業(yè)應選擇稅務籌劃策略。只有當企業(yè)開展稅務籌劃的期望收益:
P1×(1-P2)<(T-C1-C2)/(T+C32),
此時企業(yè)選擇稅務籌劃策略。
結合前面對稅務機關與企業(yè)稅務籌劃的策略選擇分析,只有當(C1+C2+C32)/(T+C32)
三、企業(yè)特殊策略選擇的經(jīng)濟博弈分析
這里的特殊策略選擇是指企業(yè)納稅人在一定的外部環(huán)境下,為減輕稅收負擔所選擇的合法籌劃或非法籌劃,即選擇合法的稅務籌劃行為還是違法的偷逃稅行為[5]。假定在相對穩(wěn)定的稅收環(huán)境下,企業(yè)欲通過一定手段減輕自身稅負,模型中只考慮稅務機關行為對企業(yè)行為選擇的影響,此時的博弈雙方是企業(yè)和稅務機關。博弈模型的建立:局中人(1)企業(yè),局中人(2)稅務機關。博弈雙方的策略:企業(yè)為偷逃稅或稅務籌劃,稅務機關為稅務稽查或不稽查。
這里仍作如下假設:節(jié)稅額為T,稅務機關的稽查概率為P3,并假定企業(yè)的偷逃稅行為一旦稽查即被查出,而企業(yè)的稅務籌劃行為被認定為合法;偷逃稅被查獲后應補繳稅款為T,加收滯納金并處罰金為C32,企業(yè)開展稅務籌劃的直接成本為C1,機會成本為C2。因此影響偷逃稅行為預期收益的因素有T、P3、C32,影響稅務籌劃行為預期收益的因素有T、C1、C2(這里不考慮企業(yè)開展偷逃稅行為的額外成本支出,也不考慮現(xiàn)實中可能存在的稅務尋租成本)。為研究上的方便,現(xiàn)引入三個相對率指標反映這些不同的影響因素:一是稅收處罰率λ,即λ=C32/T;二是稅務籌劃節(jié)稅成本率δ,即δ=(C1+C2)/T,三是稅務稽查概率P3。可以分析得出納稅人偷逃稅的預期收益為:
U1=T×(1-P3)+(-C32)×P1
=T(1-P3)-C32×P3
納稅人稅務籌劃的預期收益為:
若U2=(T-C1-C2)×(1-P3)+(T-C1-C2)×P3=(T-C1-C2);
則U1-U2=(C1+C2)-(T+C32)×P3。
當U1=U2,即:
(C1+C2)-(T+C32)×P3=0時,企業(yè)采取偷逃稅行為與開展稅務籌劃行為取得的預期收益是一致的。對該式進行調(diào)整分析,兩邊均除以T,則得出δ-(1+λ)P3=0。在λ和P3既定的條件下,當U1-U2>0,即稅務籌劃節(jié)稅成本率δ>(1+λ)P3時,企業(yè)偷逃稅行為的預期收益大于開展稅務籌劃的預期收益,此時企業(yè)的最佳選擇是偷逃稅行為;當U1-U2<0,即稅務籌劃節(jié)稅成本率δ<(1+λ)P3時,企業(yè)開展稅務籌劃的預期收益大于偷逃稅行為的預期收益,此時企業(yè)的最佳策略選擇是開展稅務籌劃。因此,企業(yè)應盡可能降低稅務籌劃節(jié)稅成本率,以提高稅務籌劃行為的經(jīng)濟效益。
在δ和P3既定的條件下,當U1-U2>0,即稅收處罰率λ<(δ-P3)/P3時,企業(yè)偷逃稅行為的預期收益大于開展稅務籌劃的預期收益,此時企業(yè)的最佳選擇是偷逃稅行為;當U1-U2<0,即稅收處罰率λ>(δ-P3)/P3時,企業(yè)開展稅務籌劃的預期收益大于偷逃稅行為的預期收益,此時企業(yè)的最佳策略選擇是開展稅務籌劃。因此,稅務機關應加大稅收處罰力度,遏制納稅人的偷逃稅行為,促進企業(yè)開展合法的稅務籌劃行為。
在δ和λ既定的條件下,當U1-U2>0,即稅務稽查概率P3<δ/(1+λ)時,企業(yè)偷逃稅行為的預期收益大于開展稅務籌劃的預期收益,此時企業(yè)的最佳選擇是偷逃稅行為;當U1-U2<0,即稅務稽查概率P3>δ/(1+λ)時,企業(yè)開展稅務籌劃的預期收益大于偷逃稅行為的預期收益,此時企業(yè)的最佳策略選擇是開展稅務籌劃。因此,稅務機關應加大稅務稽查力度,引導企業(yè)減輕稅收負擔的方式由違法的偷逃稅行為轉向合法的稅務籌劃行為。
四、結語
經(jīng)濟激勵是影響企業(yè)理性納稅行為的根本誘因。偷逃稅作為一種違法行為,其可能的預期收益客觀上受稅務機關查獲概率、稅收處罰力度等因素的影響。企業(yè)稅務籌劃作為一項合法的理財行為,其預期收益客觀上受稅務籌劃節(jié)稅成本率、稅務機關對稅務籌劃的合法性認定等因素的影響。因此,為了有效遏制或減少納稅人的偷逃稅行為,引導和促進企業(yè)開展合法的稅務籌劃行為,稅務機關應加大稅務稽查力度,加大對偷逃稅等違法行為的稅收處罰力度,減少納稅人偷逃稅的收益預期,有效降低納稅人偷逃稅行為的內(nèi)在經(jīng)濟激勵。同時,加強稅務機關人員的職業(yè)道德與業(yè)務素質(zhì)教育,從根本上堵住納稅人稅務尋租的源頭,科學認定納稅人的稅務籌劃行為,從而切實體現(xiàn)稅收執(zhí)法的嚴肅性和公正性。對于企業(yè)納稅人來說,應在依法納稅的基礎上運用科學的稅務籌劃手段減輕自身稅收負擔,盡可能減少稅務籌劃成本支出,降低稅務籌劃節(jié)稅成本率,以取得較好的稅務籌劃效果。在此基礎上,納稅人依法開展稅務籌劃、依法納稅,稅務機關依法征稅,這樣才能真正體現(xiàn)和諧的稅收征納關系,實現(xiàn)“稅企雙贏”的最佳效果。
參考文獻:
[1]張斌.博弈論在稅收籌劃中的運用[J].商業(yè)經(jīng)濟,2004(12):56-58.
[2]張曉美.企業(yè)稅收籌劃研究——基于風險控制、效應的探討[D].重慶:重慶大學碩士學位論文,2005.
[3]王曉芳,肖琳玲.稅收籌劃博弈分析[J].合作經(jīng)濟與科技,2007(2):56-57.
[關鍵詞]新景區(qū);競爭策略;博弈
[中圖分類號]F272 [文獻標識碼]A [文章編號]1005-6432(2012)13-0005-02
1 引 言
隨著旅游業(yè)的發(fā)展,旅游資源得到不斷的開發(fā),新的旅游景區(qū)也層出不窮,截至2012年,全國共有A級景區(qū)總數(shù)達2569家。由于如此眾多的景區(qū)存在,造成了景區(qū)間競爭關系的進一步復雜,同時對景區(qū)間競爭的研究也顯得更加重要起來。
關于景區(qū)間的競爭策略,很多學者進行了不同方面的研究。在多種研究方法中,博弈論由于本身就是研究利益相關的理性局中人,如何進行策略選擇,兩者具有很大的相似性,于是博弈論開始被應用于景區(qū)的競爭策略研究。
本文主要研究的是在壟斷旅游市場背景下,新景區(qū)進入市場競爭前面臨的選擇和策略。本文通過引入旅游經(jīng)濟學需求、供給理論和博弈論知識,分析景區(qū)進入前后的市場變化和利潤變化,為接下來的博弈分析提供依據(jù),對新景區(qū)旅游發(fā)展策略進行指導。
2 新景區(qū)潛在競爭策略博弈分析
在新景區(qū)進入壟斷旅游市場面臨競爭前,首先要分析已有的市場結構、市場供需情況,并預測新景區(qū)的進入帶來的市場結構的變化,并進行利潤函數(shù)的預測分析,在博弈行為中求得最優(yōu)解,做出相關市場策略的制定。下面首先進行經(jīng)濟學相關條件的設定。
2.1 相關條件的設定
假定參加旅游活動的旅游者都是理性消費者,即會自由選擇同樣花費下獲得最多旅游產(chǎn)品享受(包括獲得旅游享受收益的數(shù)量和質(zhì)量);景區(qū)是“理性經(jīng)濟人”管理下的景區(qū),景區(qū)行為為理性經(jīng)濟行為。
區(qū)域內(nèi)只有一個景區(qū)A,對區(qū)域內(nèi)旅游需求完全壟斷,景區(qū)B試圖進入?yún)^(qū)域旅游市場,但景區(qū)B與景區(qū)A之間所開發(fā)的旅游產(chǎn)品替代性難以判斷,為了便于比較分析,本文研究中設定了兩種極端可能。即:兩個景區(qū)旅游產(chǎn)品屬于同類型產(chǎn)品,具有完全替代性,景區(qū)B的進入導致對游客對景區(qū)A的需求減少;兩個景區(qū)旅游產(chǎn)品屬于互補型產(chǎn)品,即完全沒有替代性,產(chǎn)品互補,景區(qū)B的進入對景區(qū)A旅游需求的影響很小(研究中假定可以忽略)。
2.2 利潤分析及博弈策略分析
(1)兩景區(qū)旅游產(chǎn)品屬于同類型產(chǎn)品。兩景區(qū)生產(chǎn)同類型產(chǎn)品,且屬于同一區(qū)域,所以假定景區(qū)B的邊際成本等于景區(qū)A的邊際成本,都為c,兩個景區(qū)的價格也同為p,產(chǎn)出分別為qA和qB。對于景區(qū)B進入市場競爭后的決策行為景區(qū)A可以進行預測。
由此我們可以得出:后進入旅游市場的景區(qū)B,生產(chǎn)規(guī)模為景區(qū)A的1/2時,景區(qū)利潤最大。
在現(xiàn)實旅游市場競爭中,作為市場領先者的景區(qū),在競爭博弈中擁有先動優(yōu)勢,既可以通過保護自身旅游知識產(chǎn)權,來增加旅游市場進入壁壘,打擊追隨者的模仿;也可以實行品牌戰(zhàn)略,推廣景區(qū)的知名度,建立旅游者對景區(qū)形象的良好認可,從而影響旅游者的選擇,爭取更多的潛在旅游市場。而作為追隨者(或者叫模仿者)的新景區(qū)在建立之初,也有一些后動優(yōu)勢,追隨者存在旅游產(chǎn)品開發(fā)的“搭便車”行為,可以大大減少先期投資;追隨者進入旅游市場后,可以開發(fā)差異化的旅游產(chǎn)品,從而增強競爭力,擺脫追隨者的陰影,成為旅游地新的寡頭景區(qū)。
西遞、宏村是皖南古村落的代表,在2000年被聯(lián)合國教科文組織列入世界文化遺產(chǎn)名錄,成為皖南古村落旅游的先行者。此后,一批具有同樣徽風特色的古村落開始不斷開發(fā),南平、關麓等作為旅游市場的追隨者開始進入,這些村落的旅游資源特色基本一致,內(nèi)部差異性較小,所以旅游市場規(guī)模難以擴大。而同為古村的塔川,推出了差異性的旅游產(chǎn)品,在粉墻黛瓦的徽派建筑之上,強調(diào)自然生態(tài)的完美結合,成為獨具魅力的山間村落,并被攝影家們推崇為中國三大秋色觀賞景區(qū)之一,從而贏得了相當數(shù)量的旅游愛好者,擺脫了古村旅游追隨者的陰影,樹立了自己的旅游形象。
(2)兩景區(qū)旅游產(chǎn)品屬于互補型產(chǎn)品。兩景區(qū)生產(chǎn)互補型產(chǎn)品,產(chǎn)品互補替代,則景區(qū)B的進入并不影響景區(qū)A的供給函數(shù),景區(qū)A和景區(qū)B成為不同旅游客源市場的壟斷景區(qū),但假定景區(qū)擴大規(guī)模和宣傳力度后,必定贏得更多旅游者的青睞,增加旅游收入,但不減少其他旅游景區(qū)的游客數(shù)量和收入。此時,旅游知名度的競爭成為主要競爭,因為景區(qū)成了該地區(qū)知名景區(qū)后,旅游市場規(guī)模更大,獲得政策性的旅游宣傳更多,從而獲得更大的知名度和更多的利潤,景區(qū)發(fā)展?jié)摿Υ蟆?/p>
此時對于景區(qū)B的進入,景區(qū)A可采取兩種不同的策略:擴大景區(qū)規(guī)模和宣傳,提高旅游服務質(zhì)量,鞏固該地區(qū)知名景區(qū)的地位或不擴大景區(qū)規(guī)模,放任景區(qū)B的進入。景區(qū)B也會再相應做出新的決策,下圖詳細表示了兩景區(qū)的博弈策略。
景區(qū)博弈分析樹
收益組合(b,a)表示:景區(qū)A放任景區(qū)B的進入,景區(qū)B獲得一定的旅游市場,并得到收益為b,景區(qū)A未受景區(qū)B進入影響,依然擁有a的收益,還將是該區(qū)域的知名景區(qū)。此時,如果景區(qū)B采取擴大景區(qū)規(guī)模的策略,則會得到更多的收益b1,并將逐步超越景區(qū)A的知名度,成為該區(qū)域的知名景區(qū)。
而如果景區(qū)A在景區(qū)B進入旅游市場后,采取了擴大規(guī)模的策略,則可以鞏固景區(qū)A的知名景區(qū)地位,并獲得更多的收益a1。景區(qū)B在景區(qū)A擴大規(guī)模后,長遠發(fā)展將會遭遇瓶頸,最優(yōu)的選擇是進行二期開發(fā),進一步擴大規(guī)模,與景區(qū)A實現(xiàn)綜合實力的競爭,但如果景區(qū)B在進入旅游市場后,未能在新的旅游產(chǎn)品推廣中得到較為客觀的收益,即景區(qū)B的旅游產(chǎn)品未能得到旅游者的特別青睞,此時的景區(qū)B則不宜立刻擴大景區(qū)規(guī)模,而應從旅游產(chǎn)品的設計中總結得失,并進行更為細致的市場分析。
該博弈分析過程,與現(xiàn)實中主題公園與傳統(tǒng)旅游景區(qū)之間的競合博弈相類似。傳統(tǒng)景區(qū)擁有一定的知名度和影響力,而主題公園作為資源類型不同的景區(qū),存在較大的潛在客源市場。成功的主題公園往往富有活力,存在不斷的創(chuàng)新精神,在傳統(tǒng)景區(qū)缺乏變化時,主題公園就可趁機投入生產(chǎn),擴大宣傳,從而爭取更多客源市場,并取代傳統(tǒng)景區(qū),成為區(qū)域內(nèi)新的知名景區(qū)和名牌景區(qū)。
常州市中華恐龍園這一主題公園的建立,便使傳統(tǒng)景區(qū)常州紅梅公園的景區(qū)地位降低。自2000年常州中華恐龍園開館以來,就得到政府的支持,其主館建筑是中國國土資源部、中國地質(zhì)博物館與常州市人民政府的合作共建項目。常州中華恐龍園的游客量自開館以來逐年上升,2008年游客量已超過200萬人次,特別在2006年紅梅公園免費開放后,中華恐龍園更是成為常州市旅游宣傳的名牌,并成為帶動常州旅游業(yè)發(fā)展的龍頭。而現(xiàn)在中華恐龍園二期工程已經(jīng)結束,景區(qū)規(guī)模不斷擴大,更加成為常州旅游的支柱。
3 結 論
本文通過對新景區(qū)旅游競爭策略的博弈分析,得出以下結論:生產(chǎn)同類型旅游產(chǎn)品的兩景區(qū)間的競爭,作為追隨者的新景區(qū),應利用后動優(yōu)勢,合理選擇生產(chǎn)規(guī)模,并主動利用差異性旅游產(chǎn)品的開發(fā),來擺脫追隨者的陰影,超越領先景區(qū);生產(chǎn)互補型旅游產(chǎn)品的兩景區(qū)間的競爭,更多關注的是知名度的競爭,只有不斷地進行創(chuàng)新的擴大化生產(chǎn),不斷提高旅游服務質(zhì)量,才能打敗競爭對手,成為區(qū)域內(nèi)的核心景區(qū),成為區(qū)域旅游宣傳的名牌。
1944 年馮?諾伊曼(Neumann)和奧?摩根斯坦(Morgenstern)合作出版了《博弈論與經(jīng)濟行為》一書,標志著博弈理論的正式提出。博弈論又稱對策論(GameTheory),是在研究各方策略相互影響的條件下,理性決策人的決策行為的一種理論,是分析博弈行為和博弈決策的一門科學。
一場博弈主要由以下五個因素構成:一是博弈的參與者,又叫博弈方或局中人,是指博弈中能獨立決策,選擇最大化效用并承擔結果的參加者。二是博弈的策略,在博弈中由參與者做出的策略選擇,直接、實用地針對某一個具體問題采取的應對方法。三是收益,是參加者選擇策略并加以實施后的結果, 是參與人從博弈中獲得的效用水平高低的體現(xiàn)。四是博弈的次序,博弈雙方在策略選擇和行動中的順序。在博弈中,即使同樣的博弈方、同樣的策略,博弈順序的不同也會對博弈的結果產(chǎn)生重要的影響。五是博弈的均衡,指所有參與者的最優(yōu)戰(zhàn)略組合。一般而言,一個博弈至少應該具備前三個要素。
博弈論起發(fā)于數(shù)學領域,盛行于經(jīng)濟領域,在20世紀50年代得到較大發(fā)展,和其他學科之間的關系也逐漸深入。20世紀90年代以來博弈論領域的經(jīng)濟學家已經(jīng)三次獲得經(jīng)濟學諾貝爾獎,該理論已經(jīng)對經(jīng)濟學產(chǎn)生了重大的影響。隨著博弈論研究的日益深入和理論框架的不斷完善,經(jīng)濟學家和管理者們逐漸把這一理論引入到經(jīng)濟、政治、外交、軍事、教育等領域中。在高校輔導員激勵管理過程中,如何借鑒和運用博弈論的管理理念與方法,提高高校輔導員激勵管理的效度,是本文探討的主要內(nèi)容。
一、高校輔導員激勵管理引入博弈論的必要性
(一)博弈論可以滿足高校輔導員隊伍 管理方式創(chuàng)新的迫切需求
輔導員是開展大學生思想政治教育的骨干力量, 是大學生日常思想政治教育和管理工作的組織者、實施者和指導者。輔導員隊伍的整體素質(zhì),對思想政治教育的效果和學生素質(zhì)有著重要影響。隨著社會經(jīng)濟的發(fā)展,以及我國高校發(fā)展和改革的不斷推進,高校輔導員的作用也愈加重要。而近些年來輔導員隊伍中面臨的一些問題,如工作任務重、薪酬待遇較差、人員積極性不高、職業(yè)發(fā)展困擾較多等都極大地影響著這支隊伍的穩(wěn)定性,給高校輔導員隊伍管理和思想政治教育工作帶來嚴重的挑戰(zhàn)。而能根據(jù)環(huán)境變換而做出應對策略的博弈管理可以滿足高校尋求輔導員隊伍管理的新方式的迫切需求。
(二)博弈論可以豐富高校輔導員激勵管理理念
隨著輔導員在高校人才培養(yǎng)中發(fā)揮的作用日益重要,全社會對輔導員的重視程度正不斷提高,黨和國家注重從各個層面對輔導員進行激勵,以期充分調(diào)動他們的工作積極性和保證這支隊伍的穩(wěn)定性。國內(nèi)外專家學者從心理學、管理學等多個視角開展了對高校輔導員激勵機制的研究。從目前我國高校輔導員激勵管理研究的現(xiàn)狀來看,國內(nèi)外研究者主要從工作制度、措施、環(huán)境以及輔導員需要等因素研究輔導員激勵,把激發(fā)輔導員工作的積極性和創(chuàng)造力,挖掘其工作潛能,作為輔導員激勵問題研究的主要出發(fā)點。這些激勵機制的形成與應用一定程度上緩解了高校輔導員激勵管理中的問題。但是隨著環(huán)境和輔導員需求的不斷變化,高校輔導員激勵管理需要更多更豐富的先進理論來作為指導。博弈論作為近些年來在諸多領域被廣泛應用,越來越受到大家重視的科學理論,可以極大的豐富高校輔導員激勵管理理念。
(三)博弈論與高校輔導員激勵管理存在契合
在目標上,博弈論的假定前提是“理性的經(jīng)濟人”,博弈的參與者都要追求各自利益的最大化。而在高校輔導員激勵管理中,學校和輔導員作為博弈的雙方,為了自身利益的最大化,不可避免的會產(chǎn)生重復博弈。而輔導員與輔導員之間,因為職務晉升、工作分配等問題的存在,也勢必會產(chǎn)生智豬博弈。但若滿足或構建一定的條件,學校與輔導員,輔導員與輔導員之間的合作共贏依然是有可能的。而這點則與博弈論有著契合之處。
綜上所述,把博弈論引入到高校輔導員激勵管理中,不僅是新形勢下滿足高校輔導員激勵管理尋求創(chuàng)新方式的迫切需求,而且為解決高校輔導員激勵機制問題提供了一種新的思維方式和理念,這為消除傳統(tǒng)高校輔導員激勵機制中存在的弊端和解決其內(nèi)在矛盾提供了有效途徑,是提高高校輔導員激勵管理效度的必然選擇。
二、高校輔導員激勵管理中的博弈關系分析
輔導員在高校這樣一個特定的環(huán)境中,較容易因為學校管理者恰當?shù)募畲胧┒a(chǎn)生積極的行為動機,進而影響他們的工作表現(xiàn)與積極性。高校在實際管理中,可以遵循博弈規(guī)則來研究激勵管理,使得所采取的激勵措施符合管理實踐的需要。
1.學校與輔導員
站在博弈論的觀點考慮,高校作為博弈的一方,希望能夠以最少的勞動力成本(最低的工資)獲得最大的產(chǎn)出(輔導員受到激勵后所采取的積極行動帶來的工作成效),這是其利益最大化的選擇;而博弈的另一方―――輔導員,希望以最少的付出(付出最少的時間和精力)換取最大的回報(高額的工資、成績的取得、精神的滿足感與成就感),這是其利益最大化的選擇。所以,投入與回報是這一博弈中的兩個關鍵所在。處于長期重復博弈中的兩個對策者―――高校與輔導員,想要獲得個人利益及整體利益的最大化,選擇適當?shù)暮献鞑呗允潜匾?。而這種合作的關系,正是博弈論的一種―――重復博弈。
2.輔導員與輔導員
在高校中,除了學校與輔導員的重復博弈外,基于輔導員彼此之間的角色定位不同,做事能力、人際關系等因素的不同,輔導員與輔導員之間,也客觀存在著博弈關系。如,不同職位的輔導員之間,就存在著不平等的博弈―――在同一團隊中的輔導員由于工作態(tài)度與能力不同而出現(xiàn)的“搭便車”式(智豬博弈)的不均衡的博弈關系―――這種強勢與弱勢的不平衡,往往造成輔導員隊伍中的弱勢方(小豬)采取坐享其成的等待型的最佳策略,而強勢方(大豬)的輔導員則往往疲于做事,這樣最終不利于輔導員的均衡發(fā)展;另外,不是同一團隊的輔導員之間也有可能存在著不均衡的關系―――人際關系好的輔導員往往可以得到領導和同事更多的庇護及賞識,而人際關系不好的輔導員往往會因此采取消極的應對策略,更加消極的對待工作。
三、博弈論視角下高校輔導員激勵管理的有效路徑
通過以上對學校與輔導員、輔導員與輔導員之間的博弈關系分析得知,對高校輔導員的激勵對策和措施不能依賴傳統(tǒng)的激勵機制,而需要從多方面考慮切合這一群體特點的因素,,在滿足個體需求時充分調(diào)動其工作的積極性,同時需耍調(diào)動其他方面的各耍素形成合力,構建并完善輔導員激勵機制,提高其工作的有效性。
(一)以物質(zhì)激勵為基礎,建立透明、合理的薪酬制度,
物質(zhì)是人類生存和發(fā)展的基本需求,是馬斯洛需求層次理論的基礎。隨著當前社會經(jīng)濟的發(fā)展和居民收入水平的增加,輔導員的低收入與其工作的高付出不成正比,這成為影響高校輔導員隊伍穩(wěn)定性的重要原因。根據(jù)博弈論原理改革高校薪酬制度,建立合理的薪酬級別,充分體現(xiàn)出薪酬制度的保障功能與激勵功能。
一方面高校應提高輔導員的整體工資水平,滿足他們追求“合理利益的最大化”,使他們能安心于本職工作。同時,高校還應突出薪酬制度的透明與合理性,這樣有利于輔導員明確行為與后果, 努力與回報之間的關系, 有利于維持競爭的公平性和透明性,促進輔導員之間積極競爭關系的發(fā)展。
(二)以精神激勵為突破口,滿足輔導員的情感需求
情感作為一種巨大的精神力量,能夠直接影響人的行為方式。高校在進行物質(zhì)激勵的同時,也要發(fā)揮精神獎勵的重要性,給予輔導員更多的人文關懷。隨著當前學生工作環(huán)境的復雜多變,學生特點的多樣化,社會對輔導員要求的提高,導致輔導員面臨的工作量和工作壓力持續(xù)加大,工作積極性下降。高校管理者應充分認識輔導員在高校思想政治教育工作中的重要性,積極加強與輔導員的情感交流,工作中尊重他們的勞動成果,生活中幫助他們解決實際困難,積極建立一種彼此信任、團結和諧的工作氛圍,使輔導員能夠更加舒心的開展工作。
(三)以公平、合作、共贏為目標,完善與改進輔導員考核辦法
對輔導員工作考核的準確與公正,也是影響輔導員激勵的重要因素。因此,對輔導員工作的考核一定要多渠道、全方位進行評定和測量,同時要堅持定性與定量相結合的原則。高校應引入公平的競爭機制,堅持“公平公正、論功行賞”的競爭原則,對于考核優(yōu)秀的輔導員給予獎勵,通過頒發(fā)榮譽證書、發(fā)放一定數(shù)額的獎金、給予進修機會等特別獎勵,使其感到一種精神上的滿足,從而更加努力地工作。對于考核較差的輔導員給予適當?shù)膽土P,激發(fā)他們工作的責任感。這樣既可以維持學校與輔導員之間的合作關系(雙方共贏),又保持了輔導員之間競爭的公平性(多勞多得)。
(四)以輔導員職業(yè)生涯規(guī)劃為導向,完善培養(yǎng)機制
近些年來由輔導員在工作中成就感普遍偏低,職業(yè)受挫感較易產(chǎn)生,自認為職業(yè)前景黯淡等原因所帶來的職業(yè)倦怠成為影響輔導員隊伍穩(wěn)定性的另一重要因素。鑒于此,高校應按照《教育部關于加強高等學校輔導員、班主任隊伍建設的意見》中明確提出“要統(tǒng)籌規(guī)劃專職輔導員的發(fā)展。鼓勵和支持一批骨干攻讀相關學位和業(yè)務進修,長期從事輔導員工作、向職業(yè)化、專家化方向發(fā)展”的要求,幫助輔導員落實自身職業(yè)生涯發(fā)展規(guī)劃,確立職業(yè)發(fā)展目標。一方面完善輔導員的培訓機制,鞏固和完善現(xiàn)有的多形式、多層次的輔導員培訓體系,不斷提高他們的思想政治素質(zhì)與管理能力,提升輔導員的職業(yè)認同感;另一方面要積極探索輔導員的流動機制,拓寬輔導員的發(fā)展道路,支持有能力的輔導員轉任道行政、教師和科研等崗位。