99热精品69堂国产-97超级碰在线精品视频-日韩欧美中文字幕在线视频-欧美日韩大尺码免费专区-最新国产三级在线不卡视频-在线观看成人免费视频-亚洲欧美国产精品完整版-色综久久天天综合绕视看-中文字幕免费在线看线人-久久国产精品99精品国产

歡迎來到優(yōu)發(fā)表網(wǎng)!

購物車(0)

期刊大全 雜志訂閱 SCI期刊 期刊投稿 出版社 公文范文 精品范文

博弈論方法范文

時(shí)間:2023-08-21 16:58:22

序論:在您撰寫博弈論方法時(shí),參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。

博弈論方法

第1篇

關(guān)鍵詞:博彝論公選課;教學(xué)內(nèi)容與方法改革;措施

中圖分類號:G420 文獻(xiàn)標(biāo)志碼:A 文章編號:1002-0845(2012)01-0042-03

博弈論是當(dāng)代西方經(jīng)濟(jì)學(xué)體系中最重要的理論課之一,其應(yīng)用前景非常廣泛。幾乎所有社會(huì)科學(xué)領(lǐng)域中都活躍著與博弈論交叉的分支學(xué)科,為滿足當(dāng)代大學(xué)生對博弈論知識的需求,高校加強(qiáng)博弈論公選課建設(shè)迫在眉睫。鑒于此,筆者面向全校開設(shè)了“博弈論與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)”和“博弈問題及其啟示”兩門通識選修課程。

一、博弈論公選課教學(xué)中存在的問題

由于博弈論與經(jīng)濟(jì)學(xué)、管理學(xué)和數(shù)學(xué)等學(xué)科有著十分密切的關(guān)系,所以國內(nèi)本科院校的博弈論課程主要面向經(jīng)濟(jì)、金融、管理或數(shù)學(xué)專業(yè)開設(shè),教學(xué)的對象通常是本專業(yè)或本學(xué)科相關(guān)專業(yè)的學(xué)生,很少面向全校開設(shè)公選課,這主要緣于以下兩個(gè)方面的原因:第一,博弈理論的建立只有六七十年的歷史。國內(nèi)高校博弈論課程開設(shè)時(shí)間最長的也不到十年,上述情況導(dǎo)致了課程建設(shè)的經(jīng)驗(yàn)不足、水平不一。第二,研究博弈理論往往需要借助數(shù)學(xué)的方法,所以,博弈論課程的講授與學(xué)習(xí)離不開數(shù)學(xué)工具和經(jīng)濟(jì)學(xué)知識,課程內(nèi)容不得不受制于較高的知識門檻。因而,國內(nèi)博弈論公選課的建設(shè)尚處于起步階段。

筆者在連續(xù)四個(gè)學(xué)期開設(shè)博弈論公選課后發(fā)現(xiàn),該課程教學(xué)中存在的主要問題如下:

1 學(xué)生問的差異較大

由于博弈論公選課面對的本科生縱跨二、三、四三個(gè)年級。橫跨本校全部學(xué)科的所有專業(yè),導(dǎo)致學(xué)生的認(rèn)知平臺(tái)和知識面存在較大差異,學(xué)習(xí)目的和價(jià)值取向呈現(xiàn)出多元性,學(xué)生在學(xué)習(xí)態(tài)度、學(xué)習(xí)習(xí)慣和學(xué)習(xí)能力方也存在較大差別。

2 理論學(xué)習(xí)需要有一定的經(jīng)濟(jì)學(xué)基礎(chǔ)和數(shù)學(xué)基礎(chǔ)

博弈論是從經(jīng)濟(jì)學(xué)的角度提煉出個(gè)體最優(yōu)決策問題后,利用數(shù)學(xué)模型對其進(jìn)行描述,再運(yùn)用數(shù)學(xué)工具對其理論進(jìn)行研究。2007年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主羅杰?邁爾森(Roger B.Myerson)認(rèn)為,“博弈論是對理人或決策者之間相互沖突及合作的數(shù)學(xué)模型進(jìn)行的研究”。雖然博弈論具有廣泛的應(yīng)用范圍和較強(qiáng)的解釋能力。但它的標(biāo)準(zhǔn)表達(dá)是函數(shù)形式和集合論形式的,研究方法和分析過程依賴于數(shù)學(xué)工具。所以,學(xué)習(xí)博弈論既要有相關(guān)的經(jīng)濟(jì)學(xué)知識,又要有一定的數(shù)學(xué)基礎(chǔ)。正因如此,學(xué)生在公選課中接觸博弈論時(shí)會(huì)覺得比較抽象。

3 課程的知識容量受限

為了照顧學(xué)生差異,筆者在教學(xué)過程中會(huì)盡可能詳細(xì)地為學(xué)生進(jìn)行講解,因而不得不壓縮知識的容量,這導(dǎo)致了一部分經(jīng)濟(jì)學(xué)和數(shù)學(xué)基礎(chǔ)較好的學(xué)生“吃不飽”的問題。筆者嘗試通過布置課后練習(xí)的辦法來解決這一問題,但效果不是很明顯?;蛟S一個(gè)不可回避的重要原因是,有限的課余時(shí)間和較快的學(xué)習(xí)節(jié)奏限制了多數(shù)學(xué)生對公選課知識的進(jìn)一步學(xué)習(xí)。

4 缺少合適的教材

缺少合適的教材也是博弈論公選課教學(xué)中存在的主要問題之一。筆者認(rèn)為,博弈理論的應(yīng)用性和公選課內(nèi)容的時(shí)效性是激發(fā)學(xué)生學(xué)習(xí)興趣的、切入點(diǎn),教材的編寫應(yīng)將二者有機(jī)結(jié)合起來,方能發(fā)揮最大的功效,然而目前的教材往往只能體現(xiàn)前者卻難以涵蓋后者。

二、課程內(nèi)容與教學(xué)方法改革的措施

1 抓住學(xué)生的共性

大學(xué)生具有強(qiáng)烈的關(guān)注現(xiàn)實(shí)問題的意愿,對社會(huì)熱點(diǎn)問題表現(xiàn)出極高的興趣,尤其在理解焦點(diǎn)問題時(shí)具有很強(qiáng)的可塑性和認(rèn)知共性。因而應(yīng)牢牢抓住這一共性,迎合學(xué)生在知識需求上的實(shí)用化和功利化的特點(diǎn),從當(dāng)前豐富的信息資源中尋找承載博弈論知識的現(xiàn)實(shí)問題,以期收到事半功倍的教學(xué)效果。在教學(xué)實(shí)踐中,筆者把豐田汽車賠償、西南五省大旱、相親類節(jié)目“非誠勿擾”、2008股市大跌等現(xiàn)實(shí)熱點(diǎn)都搬上了講臺(tái)。下面,筆者就通過教學(xué)實(shí)例進(jìn)行說明。

在講授2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主托馬斯?謝林(Thomas C.Schelling)的博弈承諾及其可信性概念時(shí),筆者以制定《反國家分裂法》為典型案例進(jìn)行分析。由于祖國統(tǒng)一問題是所有國人關(guān)心的國家大事,大學(xué)生也不例外,所以講授過程非常順利,以致學(xué)生在課后反饋中把這一案例列為講授最成功的部分。接著,為了講解如何應(yīng)用可信承諾處理現(xiàn)實(shí)問題,筆者選擇了電視連續(xù)劇《老大的幸?!返谒募械囊粋€(gè)視頻片段,進(jìn)一步強(qiáng)化了知識點(diǎn)。實(shí)踐證明,人物生動(dòng)的形象在給課堂增添活躍氣氛的同時(shí),也很好地承載了傳遞知識的作用,以縮影的形式把可信承諾的概念和應(yīng)用可信承諾策略的方法植入了學(xué)生的頭腦中。最后,筆者以拆遷補(bǔ)償合同簽訂中的一種可信承諾策略為例,對本節(jié)課進(jìn)行了總結(jié),并請學(xué)生加以點(diǎn)評。由于拆遷問題是當(dāng)前社會(huì)的焦點(diǎn)問題,所以學(xué)生對點(diǎn)評表現(xiàn)出極大的興趣。這樣,通過抓住學(xué)生的認(rèn)知共性,展示了可信承諾策略在焦點(diǎn)問題上能夠?qū)⒘觿葑優(yōu)閮?yōu)勢的強(qiáng)大作用,成功地引導(dǎo)學(xué)生了解并掌握了博弈承諾及其可信性概念。

2 增強(qiáng)主題的典型性和知識模塊的簡潔性

以經(jīng)典博弈問題為主題有利于組織素材、選擇教學(xué)內(nèi)容;簡潔地安排知識模塊、弱化知識的層次性有利于照顧各類學(xué)生在知識面、綜合能力和認(rèn)知水平上的差異;少而精地選擇課程內(nèi)容有利于突出重點(diǎn);多角度地反復(fù)講解有利于降低知識門檻,提高學(xué)習(xí)的效果。

例如,在主題選擇上,筆者以多數(shù)學(xué)生熟知的“囚徒困境”作為第一主題;以試驗(yàn)性強(qiáng)、易于展開的“理性基礎(chǔ)和有限理性”作為第二主題;以現(xiàn)實(shí)性突出的“重復(fù)動(dòng)態(tài)博弈”作為第三主題。由于“囚徒困境”與經(jīng)濟(jì)學(xué)中的“理性人假設(shè)”密不可分,所以第一主題既能讓學(xué)生感受到博弈問題的趣味性和深刻性,又能激發(fā)他們對該主題的進(jìn)一步思考,使他們逐漸認(rèn)識到“理性人假設(shè)”所具有的超越現(xiàn)實(shí)、過于理想的特性,從而部分地為第二和第三主題做好鋪墊。另外,有大量關(guān)于“囚徒困境”和理性問題的課外資料易于獲得,這為學(xué)生在課程初期進(jìn)行興趣驅(qū)動(dòng)的導(dǎo)讀創(chuàng)造了條件。

在知識模塊設(shè)置上,筆者采取“自成模塊、減少關(guān)聯(lián)”的策略。例如,針對非常重要的“信息不對稱”主題,我們選擇了以二手車市場為核心,構(gòu)建了包含藥品市場、電腦市場和就業(yè)市場等典型主題的知識模塊。一方面,這些市場為學(xué)生所熟知,易于接受;另一方面,這些市場中包含著非常典型的“信息不對稱”因素,因而通過對市場現(xiàn)象的自然描述完全可以弱化學(xué)生對經(jīng)濟(jì)學(xué)市場知識的依賴。為了弱化知識的層次性,突出重點(diǎn)內(nèi)容,筆者舍棄了理論體系中的某些知識模塊,例如“海薩尼轉(zhuǎn)換”、“斯賓塞信號傳遞模型”和“斯蒂格利茨信息甄別模型”等。

3 重視案例應(yīng)用,尤其應(yīng)重視與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主有關(guān)的案例

博弈論有一個(gè)顯著特點(diǎn),那就是它“聲名顯赫”,并且與

諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的關(guān)系密切。許多諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主都曾涉足博弈論領(lǐng)域,在博弈論的建立和發(fā)展中直接或間接做出過貢獻(xiàn)?!懊曉谕狻睘椴┺恼摴x課的開設(shè)提供了有利條件,也為課程的講授提供了獨(dú)特的視角和豐富的素材。正因如此,筆者才面向全校開設(shè)了博弈論與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)公選課。下面,以1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主約翰?福布斯?納什(John Forbes Nash Jr.)為例,詳細(xì)說明如何應(yīng)用與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主有關(guān)的案例以及這樣做的優(yōu)點(diǎn)。

納什是博弈理論發(fā)展的劃時(shí)代人物,納什均衡是博弈論的核心概念,兩者都是公選課中必須包含的內(nèi)容。為此,筆者設(shè)計(jì)了以下三個(gè)環(huán)節(jié):1)借助“囚徒困境”和“情侶博弈”講授納什均衡及其不唯一性;2)播放電影《美麗心靈》,并進(jìn)行討論和點(diǎn)評;3)布置以納什為主題的案例設(shè)計(jì)作業(yè),讓同學(xué)在課堂上演講。第一部分是講解的重點(diǎn),講好納什均衡意味著博弈論課程成功了一半。第二部分可以把人格培養(yǎng)和素質(zhì)教育有效融合起來?!睹利愋撵`》不僅能讓人體悟到學(xué)生心靈中因愛而生的溫暖,還能給出人生原本就是一場博弈的警示,體現(xiàn)出“大人物小故事”的精髓??v然納什這樣的天才也有無法擺脫的困境,何況他人?所以,在人生的博弈中,既要承認(rèn)能力的差異,又要找尋屬于自己的色彩。同時(shí)還應(yīng)看到,縱然如納什般為頑疾所纏都可以逐漸康復(fù),何況其他挫折?所以,要以積極、樂觀、健康的心態(tài)對待人生,要終身學(xué)習(xí)而不輕言放棄!第三部分是對學(xué)生的啟發(fā)環(huán)節(jié)。該環(huán)節(jié)不僅要培養(yǎng)學(xué)生對本課程的興趣,加深學(xué)生對知識的理解,還要通過為其提供上臺(tái)演講、展示成果的機(jī)會(huì),鍛煉他們的邏輯思維能力和表達(dá)能力。值得一提的是,很多學(xué)生在設(shè)計(jì)案例時(shí)自學(xué)了有名的“智豬博弈”和“戀愛博弈”等經(jīng)典模型,鞏固了納什均衡概念,還有學(xué)生甚至對納什曾經(jīng)設(shè)計(jì)過的一種“六連棋”博弈游戲(筆者對此也知之甚少)進(jìn)行了分析。

4 重視學(xué)科交叉,尤其應(yīng)重視學(xué)科交叉視闕下的學(xué)術(shù)前沿成果

博弈論已逐漸成為一門為諸多學(xué)科提供思維方法和分析技巧的學(xué)問,可以說,所有與生命有關(guān)的學(xué)科都蘊(yùn)藏著博弈論的應(yīng)用空間。在公選課中,應(yīng)重視從學(xué)科交叉的視角供給知識,廣泛培養(yǎng)各專業(yè)學(xué)生對課程的興趣。例如,筆者選擇生物演化理論和博弈論交叉所產(chǎn)生的演化博弈論作為知識模塊,以人類社會(huì)的同性戀演化作為典型主題,挑選最前沿的學(xué)術(shù)研究案例作為教學(xué)的主要內(nèi)容為學(xué)生進(jìn)行講解,擴(kuò)展了學(xué)生的知識面。

在演化博弈論的開創(chuàng)性著作《演化與博弈論》一書中,作者約翰?梅納德?史密斯(JohnMaynardSmith)用精妙的語言、深入淺出的分析和豐富有趣的案例把博弈論的思想融入到生物演化中,推動(dòng)了對“動(dòng)物為什么如此”這一問題的深入研究,揭示了動(dòng)物群體行為演變的動(dòng)力學(xué)機(jī)制。筆者首先以“哺乳動(dòng)物一雄多雌”案例作為引導(dǎo),簡單介紹演化博弈論在性選擇和性別比問題上的研究視角以及邏輯結(jié)構(gòu),然后立刻引出了人類面臨的一個(gè)有關(guān)性的問題――同性戀演化主題下的性問題:從進(jìn)化論的角度來看,男男同性戀的存在完全沒有任何意義,這是因?yàn)橥詰傧啾扔诋愋詰俣猿晒Ψ敝澈蟠目赡苄蕴?,那么為什么同性戀的基因沒有被淘汰?顯然,這一問題接近現(xiàn)實(shí)熱點(diǎn),對學(xué)生極具誘惑力,而且還具有很強(qiáng)的學(xué)術(shù)延伸性。為了講解同性戀基因延續(xù)的演化博弈機(jī)制,筆者借助2010年2月24日美國心理科學(xué)雜志上發(fā)表的關(guān)于薩摩亞島上男男同性戀的最新研究成果,利用最前沿的學(xué)術(shù)案例詳細(xì)分析了“親族選擇”假說下的演化博弈機(jī)制。教學(xué)實(shí)踐表明,通過這樣的內(nèi)容設(shè)計(jì),來自不同專業(yè)的學(xué)生的學(xué)習(xí)興趣都被調(diào)動(dòng)起來,加深了他們對博弈論的理解,順利實(shí)現(xiàn)了教學(xué)的目標(biāo)。

5 重視開放性,尤其應(yīng)重視教學(xué)信息交流反饋的開放性

信息交流有利于幫助學(xué)生鞏固所學(xué)內(nèi)容,讓有興趣的學(xué)生通過查閱相關(guān)資料,獲得知識上的感悟和能力上的提升,并逐步脫穎而出。信息反饋有助于教師突出教學(xué)的亮點(diǎn),發(fā)現(xiàn)教學(xué)中存在的不足,以便在今后的教學(xué)中加以改進(jìn)。

教學(xué)實(shí)踐中,筆者讓學(xué)生通過電予郵件的形式反饋“課堂心得”,并要求他們回答以下三個(gè)問題:

(1)這次課對你影響最深或最成功的是哪部分?

(2)最失敗或可有可無的又是哪部分?

(3)對本次課你有什么意見和建議?

這三個(gè)問題一方面可以督促學(xué)生對課堂內(nèi)容加以回顧、梳理,另一方面,又可以從中發(fā)現(xiàn)筆者在教學(xué)中存在的不足之處。事實(shí)上,在交流和反饋中,許多同學(xué)都針對課程的內(nèi)容、進(jìn)程和教師的教學(xué)習(xí)慣、技能等提出了中肯的批評和建議,幫助教師提高教學(xué)水平。這些批評和建議包括“講課的速度有點(diǎn)偏快”、“思考時(shí)間較少”、“有些理論過于深?yuàn)W”、“希望針對時(shí)事展開分析”、“希望多些互動(dòng)”、“理論是需要加強(qiáng)的”等,當(dāng)絕大多數(shù)學(xué)生贊成“少一點(diǎn)數(shù)學(xué)知識”并希望“講得詳細(xì)點(diǎn)”時(shí),筆者采納了這一建議,并列出了幾本偏重?cái)?shù)學(xué)工具的參考書讓那些“吃不飽”的學(xué)生自學(xué)。

學(xué)生給予的溫馨鼓勵(lì)也讓筆者感覺“很給力”。例如,“本節(jié)課內(nèi)容很充實(shí),希望老師保持下去”、“老師的努力我們都看到了,希望老師以后做得更好”等話語激勵(lì)著筆者,使筆者能夠維持濃厚的教學(xué)熱情使其永不衰減,并且有信心進(jìn)一步提高自身的專業(yè)能力,挑戰(zhàn)自我的職業(yè)水平。

教學(xué)探索與實(shí)踐的過程是循序漸進(jìn)的過程,學(xué)生在這一過程中所起到的作用是巨大的。只要教師能夠及時(shí)、充分地了解學(xué)生的需求,不斷總結(jié)、深化課程教學(xué)改革的經(jīng)驗(yàn),就一定能取得更大的成效。

三、下一步的設(shè)想

筆者秉承“以人為本,以學(xué)生的發(fā)展為中心”的教育理念,希望博弈論公選課能為學(xué)生打開“半”扇窗,培養(yǎng)他們對博弈理論的興趣,激發(fā)學(xué)生課后自主學(xué)習(xí)的潛能,做到既為學(xué)生提供基本知識,又幫助學(xué)生脫穎而出。

教學(xué)實(shí)踐表明,的確有不少學(xué)生通過自主學(xué)習(xí)脫穎而出。以下是某學(xué)生的反饋:“最近看了一本《博弈三國》,該書用博弈論的方式對三國故事進(jìn)行解析,感覺博弈論有一種奇妙的功能,就是能把復(fù)雜問題簡單化,而且解析后的過程、緣由都一清二楚了?!备袑W(xué)生覺得自己“在研究中發(fā)現(xiàn)了對自己有用的東西,受益匪淺”。也有在深入思考后對教學(xué)內(nèi)容提出反詰者:“從平常感知上來說,同性戀的基因遺傳與博弈基本無關(guān)……博弈是一種研究競爭參加者為爭取最大利益應(yīng)當(dāng)如何做出決策的數(shù)學(xué)方法……無法說這樣一種與母系基因聯(lián)系較為緊密的基因遺傳行為可以用博弈的方式去解決,只能說同性戀的基因遺傳在某種程度上體現(xiàn)了社會(huì)的平衡態(tài)?!辈还苓@些反饋的具體情境如何,它們至少說明,應(yīng)從公選課的現(xiàn)實(shí)性、延伸性、前沿性和開放性出發(fā),強(qiáng)化學(xué)生的共性。弱化學(xué)生的差異性,充分利用教學(xué)內(nèi)容的充實(shí)性和教學(xué)方法的靈活性,謹(jǐn)慎且大膽地進(jìn)行教學(xué)改革,為滿足高等教育通識選修課的教學(xué)需求,進(jìn)一步提高教學(xué)的水平與質(zhì)量,提供一些思路和經(jīng)驗(yàn)。

第2篇

納什均衡是現(xiàn)代博弈論中的核心內(nèi)容和重要基礎(chǔ),許多理論研究和應(yīng)用都是圍繞這一基本理論展開或與此相關(guān)的。隨著博弈論的發(fā)展和博弈研究的不斷深入,人們意識到這種理論和日常經(jīng)濟(jì)生活的聯(lián)系越來越緊密。博弈論可以揭示眾多經(jīng)濟(jì)問題內(nèi)在規(guī)律和根源,幫助人們分析經(jīng)濟(jì)關(guān)系,認(rèn)識經(jīng)濟(jì)現(xiàn)象,評判經(jīng)濟(jì)效率,指導(dǎo)人們進(jìn)行科學(xué)的經(jīng)濟(jì)決策,無論對企業(yè)等實(shí)際經(jīng)濟(jì)部門的經(jīng)營活動(dòng),還是對政府的管理和政策制度制定,博弈論都有重要的指導(dǎo)意義。要用博弈論解決現(xiàn)實(shí)經(jīng)濟(jì)中的決策問題,就必須解決博弈模型的理論抽象和架設(shè)與經(jīng)濟(jì)問題實(shí)際情況的差距等問題,而解決這些問題的關(guān)鍵在于如何運(yùn)用數(shù)模的思想抽象出問題中的得益矩陣。本文在博弈論的核心內(nèi)容納什均衡的基礎(chǔ)上,介紹了純戰(zhàn)略納什均衡和混合戰(zhàn)略納什均衡的相關(guān)理論,針對日常生活中的污水排放問題進(jìn)行了分析。

二、納什均衡在經(jīng)濟(jì)生活中的具體運(yùn)用――污水排放問題

博弈的分類方法是多種多樣的。根據(jù)參與人的多少,可將博弈分為二人博弈和多人博弈;根據(jù)參與人是否合作,可將博弈分為合作博弈和非合作博弈;根據(jù)博弈結(jié)果的不同,又可分為零和博弈、常和博弈與變和博弈。一般地,將不允許存在有約束力協(xié)議的博弈稱為“非合作博弈”,與此相對,允許存在有約束力協(xié)議的博弈稱為“合作博弈”?!凹{什均衡”是非合作博弈理論中最重要的一個(gè)解概念。政府應(yīng)該怎樣治理污水排放是當(dāng)今一個(gè)熱點(diǎn),也是本文所探討的問題。政府和企業(yè)之間的關(guān)系可以運(yùn)用經(jīng)濟(jì)學(xué)上的監(jiān)督博弈來處理。

這個(gè)博弈的參與人包括政府和企業(yè),政府的戰(zhàn)略選擇是檢查或不檢查,企業(yè)的戰(zhàn)略選擇是排污或不排污。假設(shè)A1是企業(yè)治理污水(不排污)所增加的生產(chǎn)成本,如果排污的話,則可以將A1據(jù)為所有;A2是政府檢查所需成本;W是政府對企業(yè)排污所收取的罰款金額;G是企業(yè)排污所造成的污染而對社會(huì)利益的損害;假設(shè)W>A1,且W>A2+G,即政府對排污企業(yè)采取重罰措施。下表即為一個(gè)對應(yīng)不同戰(zhàn)略組合的得益矩陣。

在得益矩陣中,用p代表檢查排污的概率,β代表企業(yè)排污的概率。給定p,政府檢查(p=1)和不檢查(p=0)的期望分別為:

E(1,β)=(W-A2-G)γ+(-A2)(1-β)=(W-G)β+A2

E(0,β)=-Bβ+0(1-β)=-Bβ

由E(1,β)=E(0,β),得β*=A2/W??梢圆扇煞N舉措:

采取重罰措施;即降低檢查成本A2。另外,給定政府檢查的概率θ,企業(yè)選擇排污(β=1)和不排污(β=0)的期望收益分別為:

E1(p,1)=(A1-W)p+C1(1-p)=A1-W?p

E1(p,0)=0

由E1(P,1)=E(P,0)得P*=A1/G,即在現(xiàn)實(shí)經(jīng)濟(jì)中有許多企業(yè)和企業(yè)排污所取得的罰款金額W有關(guān),對排污的懲罰越重,企業(yè)因排污所獲得的生產(chǎn)成本越少,企業(yè)的排污概率就越小。

實(shí)際上,政府在治理企業(yè)排污的時(shí)候,應(yīng)設(shè)法考慮收益權(quán)的收益問題。由于國民待遇的要求,不可能因企業(yè)性質(zhì)不同而采取不同的罰款數(shù)量。所以解決這個(gè)問題只能采用行政手段。

同時(shí)也要注意地方政府在治理污水中的角色。首先,地方政府的行為要受制于中央政府既定的制度。其次,地方政府亦可親自組織創(chuàng)新或擔(dān)當(dāng)起制度創(chuàng)新的重任。最后,地方政府是制度的推行維護(hù)者,對違法排污者實(shí)施重罰。

三、主要結(jié)論和后續(xù)工作展望

第3篇

[關(guān)鍵詞]博弈論;理性人假定;公共知識;社會(huì)科學(xué)方法論

[中圖分類號]C3

[文獻(xiàn)標(biāo)識碼]A

[文章編號]1671-511X(2012)04-0020-03

博弈論是研究理性人的互動(dòng)的理論,或者說研究交互決策的理論。1928年,馮·諾依曼證明了博弈論的基本原理,宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦合著的《博弈論與經(jīng)濟(jì)行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)應(yīng)用于經(jīng)濟(jì)領(lǐng)域,奠定了這一學(xué)科的基礎(chǔ)和理論體系。1950-1951年,約翰·納什利用不動(dòng)點(diǎn)定理證明了均衡點(diǎn)的存在,為博弈論的一般化奠定了堅(jiān)定的基礎(chǔ)。塞爾頓、哈桑尼、謝林、奧曼等人的研究也大大推動(dòng)了博弈論的發(fā)展。因此,盡管博弈論是一門新生的學(xué)科,但是它今天已經(jīng)發(fā)展成為有較完善的理論體系的科學(xué)。

今天,博弈論已經(jīng)成為社會(huì)科學(xué)的通用方法論。盡管它是演繹科學(xué),對社會(huì)現(xiàn)象有強(qiáng)大的解釋力,然而,由于其理想主體的假定使得其演繹出的理論解與實(shí)際博弈結(jié)果存在差異。許多實(shí)驗(yàn)經(jīng)濟(jì)學(xué)家通過博弈實(shí)驗(yàn)研究實(shí)際中人們的博弈過程,分析博弈論的演繹解與博弈實(shí)驗(yàn)結(jié)果之間的差異。如2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)就頒發(fā)給了丹尼爾·卡尼曼和邁農(nóng)·史密斯,他們是實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的先驅(qū)。今天在西方學(xué)術(shù)界通過實(shí)驗(yàn)來驗(yàn)證博弈的理論結(jié)果已經(jīng)成為一種潮流。本文下面設(shè)計(jì)并進(jìn)行了一個(gè)博弈實(shí)驗(yàn),通過分析實(shí)驗(yàn)結(jié)果與理論解的差異,分析博弈論作為社會(huì)科學(xué)方法論的局限性,并提出改進(jìn)的可能路徑。

一、博弈實(shí)驗(yàn)及結(jié)果分析

1 實(shí)驗(yàn)描述

我們設(shè)計(jì)了如下的一個(gè)博弈實(shí)驗(yàn)。該實(shí)驗(yàn)的參與人是南京大學(xué)選修文化素質(zhì)課“邏輯與科學(xué)方法基礎(chǔ)”的大學(xué)生,他們是二三年級的學(xué)生,文理科學(xué)生均有。

該實(shí)驗(yàn)是以試題的形式進(jìn)行的,該試題作為期末試卷中的最后一道題。該題目為:

在0-100之間選擇一個(gè)數(shù)字,規(guī)則是:若你選擇的數(shù)字“是或最接近”在座同學(xué)所選擇的數(shù)字的平均數(shù)的2/3(即在座同學(xué)所選數(shù)的總和除以總?cè)藬?shù)之后所得數(shù)字的2/3,如:若平均數(shù)為90,你應(yīng)當(dāng)選2/3×90=60),你將獲勝。請給出你選擇的理由。

實(shí)驗(yàn)說明:

(1)實(shí)驗(yàn)參與者即參加考試的學(xué)生,事前不知道這是一個(gè)實(shí)驗(yàn);

(2)該課程教師以講座的形式給實(shí)驗(yàn)參與者傳授過博弈論知識,但沒有提到所進(jìn)行的博弈;

(3)因?yàn)椋?),他們中的大多數(shù)掌握“博弈”、“公共知識”等概念;

(4)試卷是保密的,沒有任何學(xué)生預(yù)先知道考試內(nèi)容,考試過程中學(xué)生間無任何交流;

(5)該博弈的理論解(即納什均衡)為0或1。

2 實(shí)驗(yàn)結(jié)果

對于考試中的每個(gè)學(xué)生,在這個(gè)博弈實(shí)驗(yàn)中他能夠獲勝的關(guān)鍵是,他要準(zhǔn)確猜測他人是如何選擇的,一旦他猜測正確,他將他猜測的平均數(shù)乘以2/3便是獲勝答案。

共有176人參加了考試。排除掉5個(gè)不明確的選擇,供分析的實(shí)際選擇數(shù)為171個(gè)(其中3個(gè)選擇非整數(shù))。實(shí)驗(yàn)結(jié)果為(按照數(shù)字大小排序):

“0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。

3 結(jié)果分析

在這些所選擇的數(shù)字中,最大的數(shù)字為75,最小的數(shù)字為0。171個(gè)數(shù)字相加后的平均數(shù)為21.91,本博弈勝出解:21.84×2/3=14.61。

這個(gè)博弈中,0和1是均衡解(下一部分將分析),它們是“理論解”。在該實(shí)驗(yàn)中,0是所選最多的數(shù)字,共有46人選擇,比例為26.9%;選1的為14人,比例為8.2%。兩者相加共有60人,比例為35.1%。

從上述數(shù)據(jù)可以看出,在這場博弈中,“實(shí)驗(yàn)解”為14.61,最接近該數(shù)的是14或15,這和“理論解”的“0”或“1”不同。在本實(shí)驗(yàn)中,沒有人選擇14,而選擇15的有3人,這3人是該實(shí)驗(yàn)的勝出者。

若按照區(qū)間來統(tǒng)計(jì),實(shí)驗(yàn)結(jié)果的分布情況見表1。本博弈實(shí)驗(yàn)的“實(shí)驗(yàn)解”14.61落在11-20之間。若我們把11-20看成是勝出區(qū)間,則有7人勝出。

對于這些選擇,有以下值得注意的幾點(diǎn):

第一,67以上的選擇都是不理性的,因?yàn)閰⒓涌荚嚨膶W(xué)生數(shù)為150-200之間,這是公共知識,即使所有的學(xué)生都選擇100,勝出的數(shù)字都不會(huì)超過67。但是還有3位學(xué)生選擇了大于67的數(shù)字,其中選擇的最大數(shù)為75。他們在給出這些選擇時(shí)沒有給出理由。

第二,分析學(xué)生所給出這些選擇的理由,可以看出,絕大部分選擇者在進(jìn)行他們的選擇時(shí)考慮到了他人的選擇以及他人的推理。不同的人對他人的假定不同,所進(jìn)行推理的步驟也不同。如選擇67的學(xué)生假定了他人都選擇100,因而選擇67是最優(yōu)選擇;再比如選擇30-40之間的數(shù)字的同學(xué),其理由大體上有兩個(gè):或者認(rèn)為平均數(shù)集中在50-60之間,其2/3就集中在35-40之間;或者認(rèn)為都選100的話,66.7是最優(yōu)選擇,都選擇66.7的話,44是最優(yōu)選擇,而都選44的話,33是最優(yōu)選擇。

第三,有三個(gè)區(qū)間處的選擇比例較高:0-10間為38.6%,21-30間為17.6%,31-40間為25.7%。從所給理由可看出,不同區(qū)間的選擇者考慮群體的互動(dòng)推理的步驟存在差別,如0-10區(qū)間的選擇者考慮他人的推理步驟比31-40區(qū)間的選擇者多些。

第四,值得注意的是,11-20區(qū)間里的選擇較少(事實(shí)上是,在這個(gè)博弈中所選擇的數(shù)字落在這個(gè)區(qū)間是最有可能勝出的)。原因可能是,一旦選擇者進(jìn)行了多步的互動(dòng)推理,他們便能夠?qū)⑦@樣的推理進(jìn)行下去,從而將選擇向理論解0或1靠近。

第五,有一些“智慧的”選擇者,他們知道理論解,但他們知道存在不完全理性的選擇,因而他們沒有選擇理論解。盡管他們的選擇沒有勝出,他們的推理是有智慧的。這里,本文選擇了其中2個(gè)。一位選擇22的學(xué)生是這樣給出他所選擇的理由的:“作為理性人,我不會(huì)選擇大于2/3×100的數(shù),因?yàn)榧词顾腥硕歼x擇最大數(shù),平均數(shù)的2/3也不會(huì)超過2/3×100。如果大家和我一樣理智,那么大家都不會(huì)選擇大于2/3×100,那么我不會(huì)選擇大于100×2/3×2/3。因?yàn)樗麄冞x擇最大的他們可能會(huì)選的數(shù),平均數(shù)的2/3也不會(huì)超過2/3×2/3×100。依此類推,如果全班都充分理智,那么全班最終都會(huì)選擇1,然而我不認(rèn)為班里的人都是足夠理智,故平均數(shù)的2/3會(huì)大于1。根據(jù)兩次游戲,平均數(shù)的2/3在20~30。如果是我,我會(huì)選擇靠近20的數(shù),那我就22吧?!币粋€(gè)選擇10的學(xué)生的理由是:“如果其他人都是隨機(jī)選擇,那么平均數(shù)最后可能接近于50,50×2/3≈33。但是,如果所有人都選擇接近33的數(shù),那么33為平均數(shù),33×2/3≈22……如此推理應(yīng)該為1。但是并非所有人均是理性、均會(huì)如此計(jì)算。我對南大有信心,所以,我將數(shù)字選得接近1一點(diǎn),選10。”

第六,有一些選擇是沒有考慮到他人的選擇。如有這樣一些理由:“大家都認(rèn)為60是及格分,所以我選擇59”,“58是我的幸運(yùn)數(shù)字”,等等。

二、博弈的理論解分析

本實(shí)驗(yàn)是一個(gè)多人完全信息靜態(tài)博弈:參與者同時(shí)選擇行動(dòng),然后根據(jù)所有參與者的選擇,每個(gè)參與者得到各自的結(jié)果,每一參與者的收益函數(shù)在所有參與者之間是公共知識。

在這個(gè)實(shí)驗(yàn)中,參加考試的176位學(xué)生是參與者,每個(gè)考生同時(shí)對0-100之間的數(shù)字進(jìn)行選擇行動(dòng),即每個(gè)參與者的策略空間Si∈(0,100),即有101種可能的策略。根據(jù)所有考生的選擇,每個(gè)考生最后得出自己的結(jié)果,對每個(gè)考生來說,結(jié)果無非就是,自己的選擇是“大家所選數(shù)字的平均數(shù)的2/3”,勝出;要么與“大家所選數(shù)字的平均數(shù)的2/3”不一致,失敗。

我們假定該博弈的參與人都是絕對理性人(事實(shí)上,這個(gè)要求在實(shí)際中難以達(dá)到,這也是本文要得到的一個(gè)結(jié)論)。

我們來分析絕對理性人的推理過程。

在這個(gè)博弈中策略組合有176×101種,每種策略組合下,每個(gè)人的收益是公共知識。如:如所有人都選100,平均數(shù)為100,此時(shí)每人都失敗,勝出結(jié)果是100×2/3=67;如175人都選100,有一個(gè)人選擇了67,那么選100的人失敗,而選擇67的人勝出……所以這些是理性參與人的公共知識。

我們看到,任何人都不應(yīng)該選67或以上,或者選擇67或以上是非理性的,因?yàn)樗x擇的數(shù)字的最大平均數(shù)為100,此時(shí)勝出的數(shù)字為67,因此選擇67以上而獲勝的可能性是沒有。因此,作為理性人他們都不會(huì)選擇67或以上。

每個(gè)人都不會(huì)選擇67或以上,這本身也是公共知識。在這樣的公共知識的前提下,45以上的選擇都是不合理的,因?yàn)閷γ總€(gè)人而言,只有在他人都選擇67以上,我選擇45或以上才是合理的(67的2/3約為45)。

每個(gè)人都不會(huì)選擇45或以上,這本身也是公共知識。于是,每個(gè)人都認(rèn)為不應(yīng)該選擇30或以上。

……

結(jié)論是:每個(gè)人選擇0或1是合理的,它們是該博弈的理論解。

事實(shí)上,每個(gè)人選擇0或都選擇1是納什均衡:對每個(gè)人而言,在其他人不改變選擇的情況下,當(dāng)下的選擇是最優(yōu)的。

在所有人均選擇0的情況下,因?yàn)閷τ诿總€(gè)人而言,若所有人都選擇0的話,0便成為平均數(shù),該數(shù)的2/3還是0。這樣,他選擇0是最優(yōu)選擇:在他人不改變選擇的情況下,他改變選擇將失敗。因此這點(diǎn)構(gòu)成納什均衡。

在所有人均選擇1的情況下,同樣,對于每個(gè)人而言,在其他人選擇1的情況下,平均數(shù)1的2/3為0.67,此時(shí)1最接近該數(shù)。因此,他選擇1是最優(yōu)選擇,并且若他改變了他的選擇他將失敗。因此,這點(diǎn)也構(gòu)成納什均衡。

當(dāng)然,面對多個(gè)納什均衡,作為理性的參與人作何選擇才能勝出呢?具體到這個(gè)博弈中,每個(gè)人要考慮的是,他選擇0還是選擇1才能勝出呢?

他會(huì)這樣思考:沒有理由認(rèn)為其中一個(gè)比另外一個(gè)更有可能勝出,這樣,選擇0或1勝出的概率為50%,但是,他人能夠與我有同樣的想法。既然如此,期望平均數(shù)應(yīng)該為0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,選擇0是最優(yōu)選擇。

從上面的分析可見,盡管0和1是納什均衡點(diǎn),但選擇。是最優(yōu)選擇。

三、改進(jìn)博弈論的可能路徑

本文已經(jīng)表明,上述博弈是一個(gè)完全信息靜態(tài)博弈,然而,本實(shí)驗(yàn)的實(shí)驗(yàn)解(14.61)與理論解(0或1)之間發(fā)生偏離。本文認(rèn)為,有兩個(gè)主要原因:

第一,博弈論中所假定的理想主體與實(shí)際中的決策主體不相符合。理想的博弈參與人是絕對理性人;他們能夠進(jìn)行任何有窮步驟的推理,能夠分析所有有窮可能的情況,并且他們的推理、分析是在瞬時(shí)完成的,而實(shí)際博弈中人們是有界理性的。在我們的博弈實(shí)驗(yàn)中若參與者是理想主體,他們能夠做本文上一部分那樣的分析,他們應(yīng)當(dāng)知道0和1是均衡解,也能夠預(yù)測O是最有可能實(shí)現(xiàn)的結(jié)果。本實(shí)驗(yàn)表明,并不是所有人都能夠做出這樣分析的。并且,在實(shí)際中存在完全非理性的選擇,如本實(shí)驗(yàn)中選擇大于67的3人,這不是完全偶然現(xiàn)象。

第4篇

一、抓住學(xué)生的共性

大學(xué)生具有強(qiáng)烈的關(guān)注現(xiàn)實(shí)問題的意愿,對社會(huì)熱點(diǎn)問題表現(xiàn)出極高的興趣,尤其在理解焦點(diǎn)問題時(shí)具有很強(qiáng)的可塑性和認(rèn)知共性。因而應(yīng)牢牢抓住這一共性,迎合學(xué)生在知識需求上的實(shí)用化和功利化的特點(diǎn),從當(dāng)前豐富的信息資源中尋找承載博弈論知識的現(xiàn)實(shí)問題,以期收到事半功倍的教學(xué)效果。在教學(xué)實(shí)踐中,筆者把豐田汽車賠償、西南五省大旱、相親類節(jié)目《非誠勿擾》、2008股市大跌等現(xiàn)實(shí)熱點(diǎn)都搬上了講臺(tái)。下面,筆者就通過教學(xué)實(shí)例進(jìn)行說明。

在講授2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主托馬斯?謝林(Thomas C. Schelling)的博弈承諾及其可信性概念時(shí),筆者以制定《反國家分裂法》為典型案例進(jìn)行分析。由于祖國統(tǒng)一問題是所有國人關(guān)心的國家大事,大學(xué)生也不例外,所以講授過程非常順利,以致學(xué)生在課后反饋中把這一案例列為講授最成功的部分。接著,為了講解如何應(yīng)用可信承諾處理現(xiàn)實(shí)問題,筆者選擇了電視連續(xù)劇《老大的幸?!返谒募械囊粋€(gè)視頻片段,進(jìn)一步強(qiáng)化了知識點(diǎn)。實(shí)踐證明,人物生動(dòng)的形象在給課堂增添活躍氣氛的同時(shí),也很好地承載了傳遞知識的作用,以縮影的形式把可信承諾的概念和應(yīng)用可信承諾策略的方法植入了學(xué)生的頭腦中。最后,筆者以拆遷補(bǔ)償合同簽訂中的一種可信承諾策略為例,對本節(jié)課進(jìn)行了總結(jié),并請學(xué)生加以點(diǎn)評。由于拆遷問題是當(dāng)前社會(huì)的焦點(diǎn)問題,所以學(xué)生對點(diǎn)評表現(xiàn)出極大的興趣。這樣,通過抓住學(xué)生的認(rèn)知共性,展示了可信承諾策略在焦點(diǎn)問題上能夠?qū)⒘觿葑優(yōu)閮?yōu)勢的強(qiáng)大作用,成功地引導(dǎo)學(xué)生了解并掌握了博弈承諾及其可信性概念。

二、增強(qiáng)主題的典型性和知識模塊的簡潔性

以經(jīng)典博弈問題為主題有利于組織素材、選擇教學(xué)內(nèi)容,簡潔地安排知識模塊、弱化知識的層次性有利于照顧各類學(xué)生在知識面、綜合能力和認(rèn)知水平上的差異,少而精地選擇課程內(nèi)容有利于突出重點(diǎn),多角度地反復(fù)講解有利于降低知識門檻,提高學(xué)習(xí)的效率。

例如:在主題選擇上,筆者以多數(shù)學(xué)生熟知的“囚徒困境”作為第一主題,以試驗(yàn)性強(qiáng)、易于展開的“理性基礎(chǔ)和有限理性”作為第二主題,以現(xiàn)實(shí)性突出的“重復(fù)動(dòng)態(tài)博弈”作為第三主題。由于“囚徒困境”與經(jīng)濟(jì)學(xué)中的“理性人假設(shè)”密不可分,所以第一主題既能讓學(xué)生感受到博弈問題的趣味性和深刻性,又能激發(fā)他們對該主題的進(jìn)一步思考,使他們逐漸認(rèn)識到“理性人假設(shè)”所具有的超越現(xiàn)實(shí)、過于理想的特性,從而部分地為第二和第三主題做好鋪墊。另外,有大量關(guān)于“囚徒困境”和理性問題的課外資料易于獲得,這為學(xué)生在課程初期進(jìn)行興趣驅(qū)動(dòng)的導(dǎo)讀創(chuàng)造了條件。

在知識模塊設(shè)置上,筆者采取“自成模塊、減少關(guān)聯(lián)”的策略。例如:針對非常重要的“信息不對稱”主題,我們選擇以二手車市場為核心,構(gòu)建包含藥品市場、電腦市場和就業(yè)市場等典型主題的知識模塊。一方面,這些市場為學(xué)生所熟知,易于接受,另一方面,這些市場中包含著非常典型的“信息不對稱”因素,因而通過對市場現(xiàn)象的自然描述完全可以弱化學(xué)生對經(jīng)濟(jì)學(xué)市場知識的依賴。為了弱化知識的層次性,突出重點(diǎn)內(nèi)容,筆者舍棄了理論體系中的某些知識模塊,如“海薩尼轉(zhuǎn)換”“斯賓塞信號傳遞模型”和“斯蒂格利茨信息甄別模型”。

三、重視案例應(yīng)用,尤其應(yīng)重視與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主有關(guān)的案例

博弈論有一個(gè)顯著特點(diǎn),那就是它“聲名顯赫”,并且與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的關(guān)系密切。許多諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主都曾涉足博弈論領(lǐng)域,在博弈論的建立和發(fā)展中直接或間接作出過貢獻(xiàn)?!懊曉谕狻睘椴┺恼摰脑幱?jì)公選課的開設(shè)提供了有利條件,也為課程的講授提供了獨(dú)特的視角和豐富的素材。

納什是博弈理論發(fā)展的劃時(shí)代人物,納什均衡是博弈論的核心概念,兩者都是公選課中必須包含的內(nèi)容。為此,筆者設(shè)計(jì)以下三個(gè)環(huán)節(jié):(1)借助“囚徒困境”和“情侶博弈”講授納什均衡及其不唯一性;(2)播放電影《美麗心靈》,并進(jìn)行討論和點(diǎn)評;(3)布置以納什為主題的案例設(shè)計(jì)作業(yè),讓學(xué)生在課堂上演講。

第一部分是講解的重點(diǎn),講好納什均衡意味養(yǎng)博弈論課程成功了一半。第二部分可以把人格培養(yǎng)和素質(zhì)教育有效融合起來,《美麗心靈》不僅能讓人體會(huì)到學(xué)生心靈中因愛而生的溫暖,還能給出人生原本就是一場博弈的警示,體現(xiàn)出“大人物小故事”的精髓??v然納什這樣的天才也有無法擺脫的困境,何況他人?所以,在人生的博弈中,既要承認(rèn)能力的差異,又要找尋屬于自己的色彩。同時(shí)還應(yīng)看到,縱然如納什般為頑疾所纏都可以逐漸康復(fù),何況其他挫折?所以,要以積極、樂觀、健康的心態(tài)對待人生,終身學(xué)習(xí)而不輕言放棄。第三部分是對學(xué)生的啟發(fā)環(huán)節(jié)。該環(huán)節(jié)不僅要培養(yǎng)學(xué)生對本課程的興趣,加深學(xué)生對知識的理解,還要通過為其提供上臺(tái)演講、展示成果的機(jī)會(huì),鍛煉他們的邏輯思維能力和表達(dá)能力。值得一提的是,很多學(xué)生在設(shè)計(jì)案例時(shí)自學(xué)了有名的“智豬博弈”和“戀愛博弈”等經(jīng)典模型,鞏固了納什均衡概念,還有學(xué)生甚至對納什曾經(jīng)設(shè)計(jì)過的一種“六連棋”博弈游戲進(jìn)行了分析。

四、重視學(xué)科交叉,尤其應(yīng)重視學(xué)科交叉視閾下的學(xué)術(shù)前沿成果

博弈論己逐漸成為一門為諸多學(xué)科提供思維方法和分析技巧的學(xué)問,可以說,所有與生命有關(guān)的學(xué)科都蘊(yùn)藏著博弈論的應(yīng)用空間。在公選課中,應(yīng)重視從學(xué)科交叉的視角供給知識,廣泛培養(yǎng)各專業(yè)學(xué)生對課程的興趣。例如:筆者選擇生物演化理論和博弈論交叉所產(chǎn)生的演化博弈論作為知識模塊,以人類社會(huì)的同性戀演化作為典型主題,挑選最前沿的學(xué)術(shù)研究案例作為教學(xué)的主要內(nèi)容,為學(xué)生進(jìn)行講解,擴(kuò)展了學(xué)生的知識面。

在演化博弈論的開創(chuàng)性著作《演化與博弈論》一書中,作者約翰?梅納德?史密斯(John Mavnard Smith)用精妙的語言、深入淺出的分析和豐富有趣的案例把博弈論的思想融入到生物演化中,推動(dòng)了對“動(dòng)物為什么如此”這一問題的深入研究,揭示了動(dòng)物群體行為演變的動(dòng)力學(xué)機(jī)制。筆者首先以“哺乳動(dòng)物一雄多雌”案例作為引導(dǎo),簡單介紹演化博弈論在性選擇和性別比問題上的研究視角以及邏輯結(jié)構(gòu),然后立刻引出了人類面臨的一個(gè)有關(guān)性的問題――同性戀演化主題下的性問題:從進(jìn)化論的角度來看,男男同性戀的存在完全沒有任何意義,這是因?yàn)橥詰傧啾扔诋愋詰俣猿晒Ψ敝澈蟠目赡苄蕴?,那么為什么同性戀的基因沒有被淘汰?顯然,這一問題接近現(xiàn)實(shí)熱點(diǎn),對學(xué)生極具誘惑力,而且還具有很強(qiáng)的學(xué)術(shù)延伸性。為了講解同性戀基因延續(xù)的演化博弈機(jī)制,筆者借助2010年2月24日美國心理科學(xué)雜志上發(fā)表的關(guān)于薩摩亞島上男男同性戀的最新研究成果,利用最前沿的學(xué)術(shù)案例詳細(xì)分析了“親族選擇”假說下的演化博弈機(jī)制。教學(xué)實(shí)踐表明,通過這樣的內(nèi)容設(shè)計(jì),來自不同專業(yè)學(xué)生的學(xué)習(xí)興趣都被調(diào)動(dòng)起來,加深了他們對博弈論的理解,順利實(shí)現(xiàn)了教學(xué)的目標(biāo)。

五、重視開放性,尤其應(yīng)重視教學(xué)信息交流反饋的開放性

信息交流有利于幫助學(xué)生鞏固所學(xué)內(nèi)容,讓有興趣的學(xué)生通過查閱相關(guān)資料,獲得知識上的感悟和能力上的提升,并逐步脫穎而出。信息反饋有助于教師突出教學(xué)的亮點(diǎn),發(fā)現(xiàn)教學(xué)中存在的不足,以便在今后的教學(xué)中加以改進(jìn)。

教學(xué)實(shí)踐中,筆者讓學(xué)生通過電子郵件的形式反饋“課堂心得”,并要求他們同答以下三個(gè)問題:(1)這次課對你影響最深或最成功的是哪部分?(2)最失敗或可有可無的又是哪部分?(3)對本次課你有什么意見和建議?

這三個(gè)問題一方而可以督促學(xué)生對課堂內(nèi)容加以回顧、梳理,另一方而又可以從中發(fā)現(xiàn)自己在教學(xué)中存在的不足之處。事實(shí)上,在交流和反饋中,許多學(xué)生都針對課程的內(nèi)容、進(jìn)程和教師的教學(xué)習(xí)慣、技能等提出中肯的批評和建議,幫助教師提高教學(xué)水平。這些批評和建議包括講課的速度有點(diǎn)偏快、思考時(shí)間較少、有些理論過于深?yuàn)W、希望針對時(shí)事展開分析、希望多些互動(dòng)、理論是需要加強(qiáng)的等,當(dāng)絕大多數(shù)學(xué)生贊成“少一點(diǎn)數(shù)學(xué)知識”并希望“講得詳細(xì)點(diǎn)”時(shí),筆者采納了這一建議,并列出了幾本偏重?cái)?shù)學(xué)工具的參考書,讓那些“吃不飽”的學(xué)生自學(xué)。

教學(xué)探索與實(shí)踐的過程是循序漸進(jìn)的過程,學(xué)生在這一過程中所起到的作用是巨大的。只要教師能夠及時(shí)、充分地了解學(xué)生的需求,不斷總結(jié)、深化課程教學(xué)改革的經(jīng)驗(yàn),就一定能取得更大的成效。

在缺少合適的教材這一問題上,筆者設(shè)想,可以采取靈活性較強(qiáng)的活頁方式(如當(dāng)前許多大學(xué)英語教材中都有活頁內(nèi)容)改變這一現(xiàn)狀?;铐摲绞郊瓤梢酝怀鲋黝}的典型性,又可以涵蓋即時(shí)事件,滿足學(xué)生的需要。同時(shí),教材活頁的積累還能為課程建設(shè)尤其是優(yōu)質(zhì)博弈論公選課教材的編著奠定基礎(chǔ)。

只要教師能夠了解學(xué)生的需求,選擇恰當(dāng)?shù)慕虒W(xué)方式、方法,不斷加以分析、總結(jié),進(jìn)一步完善教學(xué)環(huán)節(jié),激發(fā)學(xué)生的學(xué)習(xí)興趣,就一定能順應(yīng)高等教育教學(xué)改革的趨勢,在確保教學(xué)質(zhì)量的基礎(chǔ)上,逐漸把博弈論的詭計(jì)公選課建設(shè)好。

參考文獻(xiàn):

[1]顧建民.高等教育學(xué)[M].杭州:浙江人學(xué)出版社,2008.

[2]裘松良.轉(zhuǎn)型期高校教育研究與實(shí)踐[M].北京:高等教育出版社,2010.

[3]胡劍鋒.高校經(jīng)管類教育研究與實(shí)踐[M].杭州:浙江人學(xué)出版社,2011.

[4]潘月明,郭秀芝.人學(xué)英語口語公選課教學(xué)模式設(shè)計(jì)與實(shí)踐[J].高等教育學(xué)刊,2009(2).

[5]川浦徐進(jìn).本科博弈論教學(xué)過程中的案例運(yùn)用[J].江南人學(xué)學(xué)報(bào):教育科學(xué)版,2009(12).

[6]葉國榮,等.高校本科生教育中研究型教學(xué)模式探討[J].中國高教研究,2009 (3).

第5篇

所謂“博弈”(Game),是指某些個(gè)人或組織作出相互有影響的決策,它不僅包括撲克、橋牌等游戲,也包含現(xiàn)實(shí)生活中大量的合作和沖突現(xiàn)象。博弈論又稱“對策論”,研究的核心是決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題。

博弈論的原始思想萌芽于2000多年前,中國春秋戰(zhàn)國時(shí)代的典籍如《孫子兵法》、《孫臏兵法》中都充滿了博弈的案例。“田忌與齊王賽馬”就是我國耳熟能詳?shù)牟┺膶?shí)例之一,但這不過是博弈思想的雛形,現(xiàn)代意義上的博弈論則是20世紀(jì)的貢獻(xiàn)了。一般認(rèn)為,1944年同馮·諾伊曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作發(fā)表的《博弈論與經(jīng)濟(jì)行為》(The Theory of Games and Economic Behavior)提出合作博弈的基本模型,標(biāo)志著現(xiàn)代博弈論的開始。50年代,博弈論巨匠輩出,納什(Nash)提出了非合作博弈論,塔科爾(Tucker)定義了“囚徒困境”,從而奠定了現(xiàn)代非合作博弈的理論基石。60后代,澤爾騰(Selten)將納什均衡引入動(dòng)態(tài)分析,創(chuàng)立了“精煉納什均衡”的概念;海薩尼(Harsanyi)則把不完全信息引入博弈論研究,隨后出現(xiàn)了不完全信息博弈論。至此,博弈論的理論構(gòu)架基本完成。

博弈論可以劃分為合作博弈(cooperative game)和非合作博弈(non-cooperative game)。二者的區(qū)別主要在于參與人能否在行為時(shí)達(dá)成有約束力的協(xié)議,達(dá)成則是合作博弈;反之,不能強(qiáng)制他方遵守協(xié)議,各參與人只能選擇自己的最優(yōu)戰(zhàn)略,則是非合作博弈。合作博弈強(qiáng)調(diào)團(tuán)體理性、效率、公平和公正;非合作博弈則強(qiáng)調(diào)個(gè)人理性、個(gè)人最優(yōu)決策。我們談到的博弈多指非合作博弈。

博弈有兩種劃分:從參與人出場的先后順序來看,博弈分為靜態(tài)博弈(static game)和動(dòng)態(tài)博弈(dynamic game)。靜態(tài)博弈指博弈參與人同時(shí)選擇行動(dòng)或非同時(shí)行動(dòng)但對前者行動(dòng)一無所知;動(dòng)態(tài)博弈指參與人行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者的選擇。從參與人對其他參與人的知識來分析,博弈分為完全信息博弈和不完全信息博弈,前者指每一個(gè)參與人對其他參與人的特征、戰(zhàn)略和支付函數(shù)有確切的了解;后者則恰好相反。將兩種分析結(jié)合起來,我們就有四種類型的博弈:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動(dòng)態(tài)博弈。

1.完全信息靜態(tài)博弈:納什均衡

完全信息靜態(tài)博弈講的是,假設(shè)博弈中所有參與人事先達(dá)成一項(xiàng)協(xié)議,規(guī)定每個(gè)人的行為規(guī)則,那么,在沒有外在強(qiáng)制性約束時(shí),參與人是否會(huì)自覺遵守協(xié)議。如果參與人自覺遵守該協(xié)議,則構(gòu)成一個(gè)納什均衡:給定其他參與人遵守協(xié)議的情況下,沒有人積極偏離協(xié)議規(guī)則。換言之,如果一個(gè)協(xié)議不構(gòu)成納什均衡,它就不可能自動(dòng)實(shí)施,因?yàn)橹辽儆幸粋€(gè)參與人會(huì)違背這個(gè)協(xié)議,不滿足納什均衡要求的協(xié)議是沒有意義的?!扒敉嚼Ь场?Prisoner's Dilemma)和“性別戰(zhàn)”(Battle of theSexes)是任何一本博弈論著作都會(huì)提到的納什均衡特例。

2.完全信息動(dòng)態(tài)博弈:子博弈精煉納什均衡

動(dòng)態(tài)是世間萬物的基本特征。完全信息靜態(tài)博弈只是一種獨(dú)特的理想狀態(tài)。在現(xiàn)實(shí)中,當(dāng)后一個(gè)參與人行動(dòng)時(shí),自然會(huì)根據(jù)前者的選擇而調(diào)整自己的選擇,而前者也會(huì)理性地預(yù)期到這一點(diǎn),所以不可能不考慮自己的選擇對他人的影響。1965年,澤爾騰通過對動(dòng)態(tài)博弈的分析,提出了“子博弈精煉納什均衡”的概念,它要求任何參與人在任何時(shí)間、地點(diǎn)的決策都是最優(yōu)的,決策者應(yīng)該隨機(jī)應(yīng)變,而不是固守前謀。這就推導(dǎo)出子博弈的概念。當(dāng)參與人的戰(zhàn)略在每一個(gè)子博弈中都構(gòu)成納什均衡時(shí),則形成“子博弈精煉納什均衡”。也就是說,組成“子博弈精煉納什均衡”的戰(zhàn)略必須在每一個(gè)子博弈中都是最優(yōu)的。

3.不完全信息靜態(tài)博弈:貝葉斯納什均衡

不完全信息靜態(tài)博弈指的是,參與人共同行動(dòng),沒有機(jī)會(huì)觀察他人的選擇。每個(gè)參與人的最優(yōu)戰(zhàn)略只能是在給定自己的類型和他人類型依從戰(zhàn)略的情況下,最大化自己的期望效用。在項(xiàng)目投標(biāo)中各承包者的標(biāo)價(jià)高低之爭就是一個(gè)應(yīng)用例證。

4.不完全信息動(dòng)態(tài)博弈:精煉貝葉斯納什均衡

在不完全信息動(dòng)態(tài)博弈中,后行動(dòng)者觀察前者的選擇并獲得其偏好、戰(zhàn)略空間等信息,修正自己的判斷;而先行為者也知道自己行為的效用,會(huì)有意識地選擇某種行動(dòng)掩蓋或揭示自己的真實(shí)目的?!扒H技窮”就是一個(gè)不完全信息動(dòng)態(tài)博弈的例證。

國際機(jī)制理論的理性主義流派概述

當(dāng)前,國際機(jī)制的研究在理論與實(shí)踐層面都對國際關(guān)系理論學(xué)者形成沖擊,引起他們持續(xù)的濃厚興趣,并表現(xiàn)出非凡的整合能力,對國際機(jī)制研究的不同思路和方法加以整理和批評已經(jīng)成為學(xué)者們重視的工作。德國著名國際機(jī)制理論家沃科爾·利特伯格認(rèn)為,國際機(jī)制理論有兩種理性主義流派:新現(xiàn)實(shí)主義國際機(jī)制理論和新自由主義國際機(jī)制理論。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International

Regimes(London:Cambridge UniversityPress,1997),pp.1-2.)

新現(xiàn)實(shí)主義國際機(jī)制理論的基本出發(fā)點(diǎn)是行為體之間的權(quán)力資源分配極大地影響著機(jī)制的出現(xiàn)、某問題領(lǐng)域機(jī)制的存在及其性質(zhì),特別是合作中的利益分配;國家會(huì)考慮無政府狀態(tài)下的相對權(quán)力,對國際機(jī)制的效率形成制約。這些觀點(diǎn)都體現(xiàn)在霸權(quán)穩(wěn)定理論中。利特伯格認(rèn)為,霸權(quán)穩(wěn)定理論是“基于權(quán)力的國際機(jī)制理論的經(jīng)典理論模式”,(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theoriesof International

Regimes(London:Cambridge University Press,1997),pp.86.)而克勞福德認(rèn)為,霸權(quán)穩(wěn)定理論是新現(xiàn)實(shí)主義對機(jī)制產(chǎn)生最權(quán)威、最普遍認(rèn)同的解釋。(注:Robert Crawford,Regime Theory inthe Post-Cold War World:Rethingking Neoliberal Approaches toInternational Relations(Dartmouth:Darmouth Publishing Company,1996),p.57.)霸權(quán)穩(wěn)定理論的基本機(jī)制理論主張是:霸權(quán)國家建立了自己的霸權(quán)體系,并制定該體系的基本原則、規(guī)則、規(guī)范和決策程序,霸權(quán)國的實(shí)力與威望是其他國家接受這些國際機(jī)制的重要前提;霸權(quán)國利用這些機(jī)制維持霸權(quán)體系,最大限度地獲得自己的利益;同時(shí),為了維持該體系,它愿意向體系內(nèi)的其他國家提供“公共商品”(Public Goods),容忍“搭便車行為”(Free-rider);霸權(quán)國的衰落或急劇變化,則該體系的國際機(jī)制發(fā)生相應(yīng)變化。

新自由主義機(jī)制理論在過去10多年影響巨大,成為分析國際機(jī)制的主流理論。其基本機(jī)制理論主張是:國家是追求絕對收益的理性自我主義者,只關(guān)心自己的得失;承認(rèn)權(quán)力在國際機(jī)制中的作用,但認(rèn)為國際機(jī)制是國際關(guān)系中的獨(dú)立變量(independent variable),強(qiáng)調(diào)國際機(jī)制在幫助國家實(shí)現(xiàn)共同利益中的重大作用;活躍在特定問題領(lǐng)域的國家擁有只能通過合作才能實(shí)現(xiàn)的共同利益;不確定性是國際機(jī)制形成理論的核心,世界政治存在廣泛的不確定性。國際機(jī)制幫助達(dá)成政府之間意愿的契合。行為體相信這種安排會(huì)幫助達(dá)成互利的安排。換言之,沒有國際機(jī)制,則協(xié)議無法達(dá)成。國際機(jī)制正是通過降低不確定性來促進(jìn)國際合作的。新自由主義機(jī)制理論是國際機(jī)制理論的主流學(xué)派,其影響也最大。該派理論用相互依賴的概念將現(xiàn)實(shí)主義和自由主義結(jié)合起來,具有重要的理論整合意義。

博弈論與國際機(jī)制理論

在過去十多年里,國際機(jī)制理論在國際合作的分析中獨(dú)占翹楚,而博弈論在分析社會(huì)、經(jīng)濟(jì)和政治現(xiàn)象中應(yīng)用最為廣泛。兩種理論都以探討無政府狀態(tài)下的競爭與合作問題為核心命題。這種平行并非巧合,因?yàn)闄C(jī)制理論從博弈論中借取了許多知識能量。理解促進(jìn)合作的戰(zhàn)略邏輯是解釋無政府狀態(tài)下國際機(jī)制起作用的關(guān)鍵。在討論霸權(quán)、問題聯(lián)系、相對收益和相互依賴時(shí),博弈論的解釋力有目共睹。這些恰恰是國際機(jī)制理論討論的重心問題。(注:Andrew Kydd and Duncan Snidal,"Progress in Game-Theoritical Analysis of International Regimes",in Regime Theory and International

Relations,ed.Volker Rittberger(Oxford:Clarendon Press,1993),pp.112.)

早期的博弈論分析國際合作的總體問題,其目標(biāo)在于探究國際合作在無政府狀態(tài)下如何發(fā)生,但對國際機(jī)制的特殊作用關(guān)注不夠,國際機(jī)制在合作中的作用沒有得到突出和明確的分析??死辜{、基歐漢等使用博弈論分析國際機(jī)制的作用,促使現(xiàn)實(shí)主義和自由制度主義的國際機(jī)制理論逐步成熟。

第6篇

關(guān)鍵詞:群體決策;信息集結(jié);博弈論;信息獲?。粚徸h;透明性

一、引言

群體決策的研究涉及多個(gè)學(xué)科,不同學(xué)科對群體決策的研究所采取的方法和著重點(diǎn)不一樣。在經(jīng)濟(jì)學(xué)、政治學(xué)、管理學(xué)領(lǐng)域?qū)θ后w決策的研究側(cè)重于偏好的集結(jié),較少考慮影響偏好形成的潛在背景信息。其中社會(huì)選擇理論與公共選擇理論利用數(shù)學(xué)分析的方法和福利經(jīng)濟(jì)學(xué)的一些基本原理,研究如何“公平合理地”將群體成員的偏好集結(jié)為群體的偏好并據(jù)以作出群體的選擇,這方面的研究源于Condorcet投票悖論的提出,從20世紀(jì)50年代開始經(jīng)過Arrow、Sen、Gibbard和Satterthwaite等人的進(jìn)一步發(fā)展,已形成完整的理論體系,通過對理性社會(huì)選擇本質(zhì)的剖析,促進(jìn)了人們對選舉、立法以及政治機(jī)構(gòu)運(yùn)作等問題的理解。

在管理科學(xué)領(lǐng)域,對群體決策的研究主要強(qiáng)調(diào)如何通過對群體成員以不同形式表達(dá)的偏好的集結(jié),使得群體成員就最終決策達(dá)成某種程度上的一致,而一致性則意味著“正確性”,這方面最具代表性的是社會(huì)決策圖式理論。

在社會(huì)心理學(xué)領(lǐng)域?qū)θ后w決策的研究主要采用實(shí)驗(yàn)性方法,通過對群體成員之間交互過程的分析研究群體決策的信息集結(jié)有效性,一般假定群體成員具有共同的目標(biāo),很少考慮決策過程中的策略,心理學(xué)研究的主要成果是對群體思維和群體極化現(xiàn)象的分析。

近年來國外出現(xiàn)了不少用博弈論作為理論工具研究群體決策信息集結(jié)問題的文獻(xiàn),這些文獻(xiàn)主要發(fā)表于經(jīng)濟(jì)學(xué)、政治學(xué)與政治經(jīng)濟(jì)學(xué)期刊,通過對群體決策過程中群體成員的動(dòng)機(jī)和理的分析,給出了一些與人們的直覺完全相反的結(jié)論。筆者將對此領(lǐng)域的研究進(jìn)展從決策信息的獲取、審議過程中信息的披 露、透明性的影響與最優(yōu)決策規(guī)則四個(gè)方面進(jìn)行評述。需要說明的是,這四個(gè)方面緊密關(guān)聯(lián),特別是決策群體成員的信息披露動(dòng)機(jī)直接受到?jīng)Q策過程對公眾是否透明以及最終的投票表決規(guī)則的影響,而群體成員的信息獲取動(dòng)機(jī)則部分地取決于信息披露動(dòng)機(jī),但由于利用博弈論分析群體決策問題的復(fù)雜性,現(xiàn)有的文獻(xiàn)主要還是相對集中于其中的一兩個(gè)方面。

文[1]是注意到此領(lǐng)域較早的綜述性文章,該文發(fā)表于1999年,討論了當(dāng)時(shí)出現(xiàn)不久的研究政治機(jī)構(gòu)信息集結(jié)作用的文獻(xiàn),其中對最先考慮策略性投票表決行為的文[2-5]等進(jìn)行了簡要介紹。同年9月份,《美國國家科學(xué)院院刊》發(fā)文評述了研究選舉的信息集結(jié)作用及因投票者私有信息的不準(zhǔn)確而導(dǎo)致的策略性投票表決行為的成果[6],其中提及的部分研究工作尚處于未發(fā)表狀態(tài)。文[7]對研究貨幣政策委員會(huì)決策過程中的動(dòng)機(jī)問題的文獻(xiàn)進(jìn)行了系統(tǒng)討論。文[8]總結(jié)了貨幣政策委員會(huì)決策機(jī)制設(shè)計(jì)應(yīng)該考慮的各種因素,對與群體決策相關(guān)的經(jīng)濟(jì)學(xué)與社會(huì)心理學(xué)理論與實(shí)驗(yàn)分析文獻(xiàn)進(jìn)行了評述,其中討論了信息集結(jié)問題。應(yīng)該說文[9]是目前評述基于博弈論的群體決策信息集結(jié)研究文獻(xiàn)較為全面和細(xì)致的文章,該文從策略性投票、信息獲取、利益沖突和交流四個(gè)方面進(jìn)行了詳細(xì)評述,并討論了此領(lǐng)域的研究成果對貨幣政策委員會(huì)決策機(jī)制設(shè)計(jì)的參考價(jià)值。

本研究與文[9]的差別在于:第一,文[9]的討論基本上局限于基于博弈論的群體決策信息集結(jié)研究本身,而筆者從研究方法、研究對象與研究成果等方面將基于博弈論的群體決策信息集結(jié)研究與經(jīng)濟(jì)學(xué)、政治學(xué)、管理學(xué)以及社會(huì)心理學(xué)領(lǐng)域?qū)θ后w決策的傳統(tǒng)主流研究進(jìn)行了對比,分析了博弈論作為理論工具研究群體決策信息集結(jié)問題的優(yōu)缺點(diǎn),并深入探討了現(xiàn)有研究工作存在的不足之處,也即指出了此領(lǐng)域可能的研究方向,因此,筆者的深度與廣度有所超越。第二,文[9]對此領(lǐng)域研究成果的評述思路稍顯混亂,文獻(xiàn)分類較不合理。第三,筆者特別關(guān)注了研究決策過程的透明性對群體成員信息獲取與信息披露動(dòng)機(jī)以及投票表決行為的影響的文獻(xiàn),而文[9]對此幾乎沒有涉及。第四,文[9]發(fā)表后此領(lǐng)域出現(xiàn)了不少具有重要參考價(jià)值的文獻(xiàn),筆者對這些最新的文獻(xiàn)給予了較為詳細(xì)的評述。

二、決策信息的獲取

(一) Condorcet陪審團(tuán)定理與搭便車問題

與決策問題相關(guān)的各類信息一般以分散的、局部的形式存在于社會(huì)系統(tǒng),群體決策的意義之一,是可能更充分地利用這些信息,因而更有可能作出正確的決策。不考慮其他因素,僅從信息集結(jié)的角度看,讓更多擁有信息的個(gè)體參與決策可以改善決策質(zhì)量,這種觀點(diǎn)符合人們的直覺,其形式化證明出自18世紀(jì)Condorcet給出的陪審團(tuán)定理。該定理認(rèn)為:群體決策可以有效集結(jié)信息,在多數(shù)決定規(guī)則下,增加群體成員數(shù)量可以增加作出正確決策的概率,并且隨著成員數(shù)量趨于無窮,作出正確決策的概率趨于1。

Condorcet陪審團(tuán)定理及其后來的很多拓展往往都有個(gè)潛在的假設(shè):群體決策者所掌握的與決策問題相關(guān)的信息是事前外部給定的,或是以零成本獲得的[9]。但對于許多現(xiàn)實(shí)決策情形,信息并不是不需要投入成本和努力就能輕易得到的,如審稿專家需要付出一定的時(shí)間和精力才能決定稿件是否符合錄用標(biāo)準(zhǔn),因此決策者必須決定是否付出以及付出多少代價(jià)以獲取信息。而在群體決策中,與決策問題相關(guān)的信息是公共物品,因而存在典型的所謂社會(huì)惰化(social loafing)現(xiàn)象或搭便車問題(freerider problem)。

文[10]對陪審團(tuán)決策中的信息獲取問題進(jìn)行了研究,認(rèn)為陪審員的信息準(zhǔn)確程度取決于陪審團(tuán)的大小,更大的陪審團(tuán)的陪審員具有更少的動(dòng)機(jī)認(rèn)真聽取審判過程,所以更大的陪審團(tuán)作出正確判決的概率可能更小,從而導(dǎo)致陪審團(tuán)定理不再成立。文[11-17]進(jìn)一步研究了群體決策中的理性無知(rational ignorance)問題,對仍能有效集結(jié)信息時(shí)信息獲取成本或成本函數(shù)需要滿足的條件進(jìn)行了分析,這些文獻(xiàn)針對多數(shù)決定規(guī)則,假定所有群體成員具有完全相同的決策偏好。其中文[11,13-15]證明,當(dāng)全體或部分群體成員的信息獲取成本函數(shù)在獲取零信息處的二階導(dǎo)數(shù)為零,則Condorcet陪審團(tuán)定理仍然有效。

另外,文[18]通過一個(gè)僅有兩個(gè)成員的群體決策模型,指出群體成員間的交流可能會(huì)惡化信息獲取中的搭便車問題。在該文中,決策成員首先收集關(guān)于一項(xiàng)工程實(shí)施后果的信息,然后相互交流,再投票表決是否實(shí)施該項(xiàng)工程。文章指出,如果交流的作用僅限于信息集結(jié),則交流可能會(huì)減少作出正確決策的概率,特別是當(dāng)高質(zhì)量的信息很容易獲得時(shí),交流會(huì)減少?zèng)Q策成員收集信息的動(dòng)機(jī),加劇信息收集中的搭便車問題,但當(dāng)信息收集需要付出高昂的代價(jià)時(shí),更多的交流通常會(huì)增加作出正確決策的概率。

(二)搭便車問題避免措施

因?yàn)樾畔@取活動(dòng)一般是不可觀測的,搭便車者可以通過提供一個(gè)虛假的信息假裝已經(jīng)給予了足夠的投入,所以無法通過有效的懲罰措施以阻止搭便車問題,只能夠從決策群體的成員組成和決策規(guī)則等方面考慮避免該問題的發(fā)生。

文[19-20]的研究結(jié)論從決策群體人員組成方面為避免信息獲取中的搭便車問題提供了理論參考,指出具有極端偏好的成員相對來說更具有收集高成本信息的動(dòng)機(jī),但這兩篇文獻(xiàn)的研究內(nèi)容不屬于嚴(yán)格意義上的群體決策,因?yàn)槠渲械奈瘑T會(huì)成員僅負(fù)責(zé)收集與報(bào)告信息,自身并沒有決策權(quán)。在文[19]中,委員會(huì)成員在信息收集之前相互間沒有偏好差異,在投入不可觀測的努力收集信息后形成各自不同的政策偏好,該文證明最優(yōu)的委員會(huì)規(guī)模和總的社會(huì)剩余有時(shí)會(huì)隨委員會(huì)成員偏好差異期望值的增大而增大,因?yàn)轭A(yù)期的偏好差異為成員提供了收集信息的動(dòng)機(jī)。文[20]指出,如果信息收集的成本較低,委員會(huì)成員的偏好應(yīng)該與決策者的偏好類似,這是因?yàn)橐环矫媾c決策者偏好類似的成員會(huì)收集決策者想要的信息,另一方面由于偏好類似所以在報(bào)告時(shí)不會(huì)產(chǎn)生信息的扭曲問題;如果信息收集的成本較高,則委員會(huì)應(yīng)該由具有極端偏好的成員組成,只有這些成員才具有足夠強(qiáng)烈的動(dòng)機(jī)付出代價(jià)收集信息,但因?yàn)樾湃螁栴},他們往往只會(huì)收集硬信息,即客觀上可驗(yàn)證的信息。對于在投票表決前需要對決策選項(xiàng)進(jìn)行審議的群體決策來說,文[20]的研究結(jié)論尤其具有參考價(jià)值。

從群體決策機(jī)制設(shè)計(jì)的角度看,如果存在信息獲取問題,則機(jī)制設(shè)計(jì)者必須既要考慮如何提供充分的激勵(lì)促使群體成員獲取信息,又要考慮如何有效集結(jié)成員所獲得的信息,以最大化群體決策的期望效用。

文[21]證明,采用適當(dāng)保守的決策規(guī)則可以促進(jìn)群體成員收集證據(jù),從而改善決策質(zhì)量。文[22-23]對存在信息獲取時(shí)的群體決策最優(yōu)規(guī)則與最優(yōu)群體成員數(shù)量進(jìn)行了研究。文[22]指出,盡管一致性規(guī)則使每個(gè)群體成員的投票選擇對最終結(jié)果都具有決定性影響力,但一致性規(guī)則并不能為獲取信息提供適當(dāng)?shù)募?lì),而且一致性規(guī)則特別不適合于信息較不準(zhǔn)確的情形,也即更需要群體決策的情形,在只考慮單調(diào)純策略均衡的條件下,除非群體成員的信息足夠準(zhǔn)確,否則一致性規(guī)則或接近于一致性規(guī)則的規(guī)則不可能最優(yōu)。文[23]認(rèn)為,為了提供足夠的信息獲取激勵(lì),對于相當(dāng)普遍的決策情形,事前最優(yōu)的決策機(jī)制事后可能是非最優(yōu)的,即不必然利用了所有群體成員獲取的信息導(dǎo)致從統(tǒng)計(jì)學(xué)角度有最優(yōu)的信息集結(jié),該事前最優(yōu)的決策機(jī)制是在激勵(lì)成員獲取信息與最大程度提取成員信息之間折中的產(chǎn)物。需要指出的是,文[21-23]均假定決策群體成員具有相同的偏好。

三、審議過程中信息的披露

決策群體,尤其是規(guī)模較小的群體,一般會(huì)在投票表決前對決策選項(xiàng)進(jìn)行審議,交流各自的私有信息。信息的共享能引起成員信念的收斂。但群體成員通常代表著不同的利益集體,具有不同的利益追求或偏好,因而具有操縱或隱藏私有信息的動(dòng)機(jī),從而限制了信息共享的可能性,成員間策略性的信息操縱與反操縱甚至導(dǎo)致比純粹偏好沖突更大程度上的意見不一致。

絕大多數(shù)群體決策文獻(xiàn)對審議(deliberation)、交流(communication)、辯論(debate)、廉價(jià)磋商(cheap talk)等類似表述用語沒有進(jìn)行明確的區(qū)分,雖然這些用語在不同場合有一些微妙甚至較大的差異,如文[24]認(rèn)為審議是辯論的子集。

研究審議對群體決策的影響的文獻(xiàn)一般將決策過程建模為兩階段博弈:先審議后正式投票表決,通過對貝葉斯Nash均衡策略和均衡存在條件的分析,研究審議是否以及如何對群體決策發(fā)生作用。這類文獻(xiàn)一般假定無論是以公共利益還是以私人利益作為評判標(biāo)準(zhǔn),好的決策選擇總是部分取決于世界的真實(shí)狀態(tài),而世界的真實(shí)狀態(tài)對決策群體成員來說無法確切知道,他們僅不對稱地掌握了有關(guān)世界真實(shí)狀態(tài)的部分信息。在正式投票表決之前的審議過程可以使群體成員有機(jī)會(huì)告訴其他成員他們所掌握的私有信息,然后,根據(jù)各自已掌握的關(guān)于世界真實(shí)狀態(tài)的部分信息,群體成員形成自己對世界真實(shí)狀態(tài)的判斷,進(jìn)而根據(jù)自己的評判標(biāo)準(zhǔn)形成各自的決策選擇偏好,如果他們的決策選擇偏好不一致,就有可能在審議的過程中不披露自己的真實(shí)信息,或提供虛假的信息以誘導(dǎo)其他成員作出對自己有利的決策選擇。因此,此類文獻(xiàn)注重從信息集結(jié)角度對完全信息披露均衡和完全信息集結(jié)均衡的分析。

Coughlan在文[25]中認(rèn)為,當(dāng)所有群體成員的決策偏好完全相同或足夠接近,在審議過程中每個(gè)成員都具有真實(shí)披露私有信息的動(dòng)機(jī)。文[26]則進(jìn)一步證明,只要群體成員主觀上認(rèn)為多數(shù)成員與他擁有共同偏好具有較大的可能性,客觀上的偏好差異不會(huì)影響信息的真實(shí)共享。然而,該文同時(shí)指出,審議并不總是能有效集結(jié)信息,特別是當(dāng)群體成員沒有較強(qiáng)的先驗(yàn)信念認(rèn)為自己的價(jià)值取向就是群體主流的價(jià)值取向時(shí),可能出現(xiàn)有意的相互欺騙。需要說明的是,在文[26]給出的模型中,所有群體成員的偏好或者完全相同,或者完全相反,與此相符的現(xiàn)實(shí)群體決策情形很少,甚至幾乎沒有。文[24,27-28]證明一致性規(guī)則在很多情況下為群體成員在審議過程中策略性地隱藏信息提供了動(dòng)機(jī),多數(shù)決定規(guī)則比一致性規(guī)則能引導(dǎo)出更多的信息共享。文[28]還證明,在相當(dāng)一般的條件下,審議使得除一致性規(guī)則以外的所有其他規(guī)則具有相同的序貫均衡集合,也即審議使得所有的無否決權(quán)規(guī)則在序貫均衡方面等價(jià),從而說明如果群體成員在投票表決前有向所有成員公開宣布各自私有信息的機(jī)會(huì),那么采用除一致性規(guī)則以外的其他任何決策規(guī)則,都會(huì)產(chǎn)生相同的決策結(jié)果。文[29]對陪審團(tuán)在審議階段信息的披露進(jìn)行了實(shí)驗(yàn)研究,以無約束力的意向性投票形式實(shí)現(xiàn)信息的交流,實(shí)驗(yàn)結(jié)果與理論分析基本近似。

另外,文[30]給出了一個(gè)兩成員的交流與決策模型,兩個(gè)成員投票表決是否組成具有不確定回報(bào)的合伙關(guān)系,他們的偏好不一致且為私有信息。文章分析了均衡的特征,發(fā)現(xiàn)在均衡時(shí)僅有部分信息被傳遞,交流對于雙方的福利是有益的。

對于很多現(xiàn)實(shí)決策問題,決策者可能擁有客觀上可驗(yàn)證的信息,即所謂硬信息(hard information)。文[31]對硬信息在具有偏好沖突的委員會(huì)中的交流進(jìn)行了研究,證明完全信息集結(jié)均衡在偏好為私有信息的情況下比在偏好為常識情況下更有可能存在,即允許更大程度上的偏好差異;另外該文證明,如果信息可驗(yàn)證,完全信息集結(jié)均衡的存在條件等同于完全信息披露均衡的存在條件。文[32]指出,在審議階段群體成員共享私有信息的動(dòng)機(jī)一定程度上取決于其私有信息的可驗(yàn)證性,如果決策成員能夠?yàn)樽约旱男畔⑻峁?yàn)證材料,則一致性規(guī)則比其他規(guī)則提供了更強(qiáng)的信息共享激勵(lì),更有可能實(shí)現(xiàn)完全信息共享。文章給出了在一致性規(guī)則下審議階段存在完全信息披露均衡的充分必要條件。

文[33]指出,盡管偏好與信息的差異可能使得部分成員在審議過程中具有錯(cuò)誤表達(dá)私有信息的動(dòng)機(jī),但給予群體成員適當(dāng)?shù)耐獠考?lì)能消除此類動(dòng)機(jī),促進(jìn)信息與偏好的完全集結(jié),而且隨著群體規(guī)模的擴(kuò)大,外部激勵(lì)的強(qiáng)度可以很小,外部激勵(lì)的具體措施包括對成員決策能力的肯定等。

四、透明性的影響

隨著社會(huì)的進(jìn)步,公眾對涉及自身利益的重要決策過程的透明性提出了越來越高的要求。透明的決策過程意味著公眾可以評價(jià)決策群體成員的偏好、能力與貢獻(xiàn),從而引起決策者對自身聲譽(yù)的關(guān)注,而對聲譽(yù)的關(guān)注既可能促進(jìn)信息的獲取和真實(shí)信息的披露,但也有可能導(dǎo)致信息傳遞與投票表決行為的扭曲。

在文[34]中,委員會(huì)成員在前一時(shí)期表現(xiàn)出的決策能力影響了他在后一時(shí)期能否獲得連任,而作為委員會(huì)成員可為其帶來一定的效用。該文證明公開個(gè)人投票記錄可以促進(jìn)委員會(huì)成員努力獲取信息。文[35]認(rèn)為,僅公布最終決策結(jié)果,不公開個(gè)人投票記錄,會(huì)誘導(dǎo)委員會(huì)成員按照現(xiàn)有偏見作出投票選擇,因此,委員會(huì)的決策傾向于保守化,向公眾公開成員的投票記錄則能夠減少現(xiàn)有偏見對決策的影響。該文同時(shí)認(rèn)為,群體決策機(jī)制的設(shè)計(jì)應(yīng)該不僅考慮決策過程的透明性,也要考慮決策規(guī)則的適當(dāng)性,如果決策規(guī)則選擇合適,則不透明的決策過程可能比透明的決策過程得到更好的決策結(jié)果。在文[34-35]所給出的模型中,都沒有考慮委員會(huì)成員在投票表決前可能會(huì)相互交流各自的私有信息。

在文[36]中,委員會(huì)代表公眾對一項(xiàng)新工程的實(shí)施與否進(jìn)行表決,委員會(huì)成員既關(guān)心工程的實(shí)際價(jià)值,又關(guān)心委員會(huì)在公眾中的聲譽(yù),如果維持現(xiàn)狀,不實(shí)施新工程,則暴露出委員會(huì)成員意見的不一致,從而給委員會(huì)的聲譽(yù)帶來負(fù)面影響,而公眾僅能注意到委員會(huì)的決策結(jié)果,事后不能觀測到工程的實(shí)際價(jià)值。該文證明,在審議階段,部分成員對聲譽(yù)的過分關(guān)注可能使他們不愿真實(shí)披露私有信息,而是夸大工程的價(jià)值,導(dǎo)致更容易采取實(shí)施新工程的決策。文[37]認(rèn)為,公開委員會(huì)的具體審議記錄可能會(huì)降低決策質(zhì)量。由于委員會(huì)成員關(guān)心公眾對其決策能力的判斷,使得他們在正式會(huì)議交流過程中可能隱藏內(nèi)部存在的意見分歧,公眾對于決策過程透明性的要求,可能導(dǎo)致委員會(huì)在正式會(huì)議之前組織秘密的非正式預(yù)備會(huì)議,將真正實(shí)質(zhì)性的討論從公開的正式會(huì)議階段轉(zhuǎn)移到秘密的預(yù)備會(huì)議階段,從而對公眾消除委員會(huì)內(nèi)部意見的不一致,而非正式的會(huì)議更具有不穩(wěn)定性,因此,透明性要求并不一定能增加社會(huì)福利。

在文[38-40]中,外部利益關(guān)聯(lián)者可以觀察到公開委員會(huì)每個(gè)成員的具體投票記錄和決策結(jié)果,但對于秘密委員會(huì)則只能看到最終決策結(jié)果,而委員會(huì)成員既關(guān)心決策結(jié)果又關(guān)心外部利益關(guān)聯(lián)者所給予的回報(bào)。文[38]和[39]認(rèn)為,不公布委員會(huì)成員的個(gè)人投票記錄可以減少外部利益關(guān)聯(lián)者對決策的影響,在某些情況下秘密委員會(huì)優(yōu)于公開委員會(huì)。文[39]還特別指出,由于隨著群體成員數(shù)量的增加,單個(gè)成員的投票對最終決策具有決定性影響的概率減小,對單個(gè)成員而言不誠實(shí)投票的代價(jià)隨之減小,所以對于公開委員會(huì)來說,其成員更容易因外部利益關(guān)聯(lián)者承諾給予的回報(bào)而不誠實(shí)投票,因此Condorcet陪審團(tuán)定理可能不再成立。在文[40]中,對于秘密委員會(huì),外部利益關(guān)聯(lián)者可以根據(jù)投票表決規(guī)則的閾值和最終決策結(jié)果對委員會(huì)成員的投票作出推斷。文章分析了秘密委員會(huì)的最優(yōu)決策規(guī)則,指出決策規(guī)則中增加選擇某一選項(xiàng)需要的投票比例可能會(huì)導(dǎo)致該選項(xiàng)更容易成為最終決策結(jié)果,傳統(tǒng)看法認(rèn)為降低決策規(guī)則的閾值可以防止委員會(huì)過于保守的看法未必正確,但對于公開委員會(huì)則不存在此問題。文[41]雖然不是直接研究透明性,但其研究結(jié)論與此處內(nèi)容相關(guān),該文通過一個(gè)博弈模型,說明在特定情況下,外部利益集團(tuán)可以不用付出任何代價(jià)就能操縱委員會(huì)的決策。

另外,不少文獻(xiàn)從理論與實(shí)證兩方面研究了決策過程的透明性對貨幣政策委員會(huì)決策的影響。文[7,42]對這方面的文獻(xiàn)進(jìn)行了綜述。文[42]區(qū)分了三種類型的透明性:決策目標(biāo)透明性;知識透明性,這里的知識指決策所依據(jù)的經(jīng)濟(jì)數(shù)據(jù)或經(jīng)濟(jì)模型等;操作透明性,包括委員會(huì)會(huì)議記錄與投票記錄的透明性以及決策結(jié)果的透明性等。該文評述的文獻(xiàn)有部分運(yùn)用了博弈理論作為分析工具。文[7]專門討論了貨幣政策委員會(huì)決策過程中的動(dòng)機(jī)問題,指出貨幣政策委員會(huì)的最優(yōu)規(guī)模與透明性等仍有待進(jìn)一步研究。

類似于文[34],研究透明性對貨幣政策委員會(huì)決策信息集結(jié)有效性的影響的文獻(xiàn),一般認(rèn)為委員會(huì)成員希望得到社會(huì)公眾對其決策能力或決策偏好的正面評價(jià),從而獲得連任的機(jī)會(huì),如文[43]假設(shè)委員會(huì)成員希望公眾認(rèn)為他是通貨膨脹的強(qiáng)硬抵制者,而最近的文獻(xiàn)如文[44-46]等,則假設(shè)委員會(huì)成員希望公眾認(rèn)為他是具有較強(qiáng)決策能力者。文[44]認(rèn)為,公開審議過程的詳細(xì)記錄會(huì)使得貨幣政策委員會(huì)成員不愿意表達(dá)不同的意見,該文通過對美聯(lián)儲(chǔ)聯(lián)邦公開市場委員會(huì)在被要求公開會(huì)議記錄之前和之后的會(huì)議記錄的分析說明了理論結(jié)果的有效性。文[45-46]分析了投票記錄的公開對委員會(huì)成員投票表決行為的影響,認(rèn)為投票記錄對公眾的透明帶來的負(fù)面效應(yīng)占主導(dǎo)地位,透明性不能增加社會(huì)福利。

五、最優(yōu)決策規(guī)則

顯而易見,不同的決策規(guī)則極大地影響了群體決策的信息集結(jié)效率,尤其是決策群體成員的偏好或能力不完全一致時(shí),決策規(guī)則更是直接影響了群體成員的投票選擇行為,進(jìn)而影響了決策結(jié)果的正確性。前述文獻(xiàn)大多不同程度地討論了決策規(guī)則的比較和選擇,除此以外,另有部分文獻(xiàn)對各種情況下的最優(yōu)決策規(guī)則進(jìn)行了研究。

文[47-48]從最大化期望效用的角度對固定規(guī)模的委員會(huì)形式集體決策的最優(yōu)決策規(guī)則進(jìn)行了分析,文[49-50]研究了在特定約束條件下的最優(yōu)決策規(guī)則。然而,這些早期的文獻(xiàn)都有個(gè)潛在的假設(shè):決策成員僅按照自身獲得的信息作出投票選擇。文[2,51]等指出,即使決策群體成員的偏好完全一致,也不能保證一定能夠如Condorcet陪審團(tuán)定理所預(yù)測的那樣有效集結(jié)各成員的信息,因?yàn)槿后w成員僅根據(jù)自身信息作出非策略性的選擇不符合理性要求,當(dāng)且僅當(dāng)所使用的決策規(guī)則為集結(jié)群體成員私有信息的最優(yōu)規(guī)則時(shí),所有群體成員僅按自身信息投票才是Nash均衡,而最優(yōu)決策規(guī)則則取決于特定的決策情形。

文[52]證明,當(dāng)采用文[48]所定義的最優(yōu)決策規(guī)則時(shí),所有成員僅按照自身獲得的信息投票表決形成Nash均衡,但僅按自身信息投票可能不是有效的,因?yàn)椴糠殖蓡T聯(lián)合決定策略性投票可以增加期望效用。文[53]討論了投票者對不同決策選項(xiàng)具有可用基數(shù)表示的效用時(shí)的誠實(shí)投票問題,試圖給出當(dāng)決策機(jī)制允許多種消息類型時(shí)誠實(shí)投票的準(zhǔn)確定義。為使投票者具有誠實(shí)投票的動(dòng)機(jī),文[54]提出了一種在隨機(jī)選擇的投票表決集合上運(yùn)用多數(shù)決定規(guī)則得到最終決策的方法,在對所有投票者的表決結(jié)果運(yùn)用多數(shù)決定規(guī)則和僅對投票表決結(jié)果的隨機(jī)抽樣子集運(yùn)用多數(shù)決定規(guī)則之間進(jìn)行隨機(jī)選擇,可以激勵(lì)投票者誠實(shí)投票,從而得到Condorcet陪審團(tuán)定理的有效性收斂結(jié)果。

文[55]基于陪審員的私有信息和策略性表決行為構(gòu)建了一個(gè)陪審團(tuán)決策模型,證明一致同意規(guī)則可能會(huì)導(dǎo)致無辜被告得到有罪判決和有罪被告得到無罪判決這兩種錯(cuò)誤的概率都增加。文[56]分析了決策群體所投票表決的決策選項(xiàng)不獨(dú)立于投票表決規(guī)則的情形:給定決策群體的投票表決規(guī)則,提案者向決策群體提出一個(gè)要么完全接受要么完全拒絕的議案,群體投票表決是接受還是拒絕該議案。該文證明由于一致同意規(guī)則能促使提案者提出更有吸引力的議案,所以增加了決策群體的期望效用,在某些情況下,一致同意規(guī)則甚至是Pareto最優(yōu)的表決規(guī)則,因?yàn)樗苍黾恿颂岚刚叩钠谕в?,即使提案者與決策群體的利益追求可能完全相反??偨Y(jié)考慮一致性規(guī)則的文獻(xiàn)[22,24,27,28,32,55,56],可見博弈分析得到的結(jié)論往往與人們直觀上的認(rèn)識截然相反,一致性規(guī)則是不是合適的決策規(guī)則完全取決于特定的決策情形。

既然投票表決規(guī)則直接影響了投票者的投票選擇行為,那么,對于群體決策機(jī)制的設(shè)計(jì)者來說,他在選擇投票表決規(guī)則時(shí)是否需要考慮投票者在各種表決規(guī)則下的投票行為,換言之,機(jī)制設(shè)計(jì)者關(guān)于投票者在各種規(guī)則下的博弈行為的信念是否會(huì)影響到最優(yōu)決策規(guī)則的選擇。文[57-58]對此問題進(jìn)行了研究,其中假設(shè)群體成員的決策偏好完全一致。文[57]分析了決策成員的能力存在差異且這種差異是常識的情況下的投票表決規(guī)則,指出最優(yōu)的匿名單調(diào)投票規(guī)則并不取決于成員是否按照自身信息投票或策略性投票。類似于文[57]的結(jié)論,文[58]認(rèn)為,決策機(jī)制設(shè)計(jì)者對最優(yōu)投票表決規(guī)則的選擇與機(jī)制設(shè)計(jì)者關(guān)于投票者在不同表決規(guī)則下的投票行為的信念無關(guān),在該文中,機(jī)制設(shè)計(jì)者為決策群體選擇投票表決規(guī)則,其目的是為了最大化決策群體的期望福利,文章證明,僅從信息集結(jié)的角度看,關(guān)于投票者在各種表決規(guī)則下的投票行為的不同假設(shè)對于最優(yōu)決策規(guī)則的選擇來說,結(jié)論是一樣的,不同的行為假設(shè)導(dǎo)致相同的結(jié)論。對于具有相同偏好的決策群體來說,文[57-58]的研究結(jié)論大大簡化了決策規(guī)則的選擇。

現(xiàn)實(shí)中的決策群體往往存在具有極端偏好的成員,這些成員的存在為信息的有效集結(jié)帶來較大的困難。文[59]對存在極端偏好者和中立者的群體面對二分決策問題時(shí)的最優(yōu)決策規(guī)則進(jìn)行了研究,考慮了決策成員之間存在轉(zhuǎn)移支付的情況,指出最優(yōu)投票表決規(guī)則相對于轉(zhuǎn)移支付可能性的大小來說是非單調(diào)的。文[60]對由兩類具有完全相反的偏好的成員所組成的委員會(huì)決策進(jìn)行了分析,對比了一致性規(guī)則與非一致性規(guī)則的信息集結(jié)效率。文[61]給出了一個(gè)現(xiàn)實(shí)中較難接受的非單調(diào)性決策規(guī)則――超多數(shù)懲罰(supermajority penalty)規(guī)則,當(dāng)選擇某一選項(xiàng)的投票過多時(shí),將該選項(xiàng)作為群體決策最終結(jié)果的概率反而會(huì)下降,該文證明,當(dāng)對于每個(gè)選項(xiàng)都存在極端偏好者時(shí),超多數(shù)懲罰規(guī)則是最優(yōu)匿名激勵(lì)相容規(guī)則。

前述文獻(xiàn)都假定群體成員的偏好相互獨(dú)立,而文[62]對群體成員具有相互關(guān)聯(lián)但不完全相同的偏好的情況進(jìn)行了分析,其中的決策選擇空間是連續(xù)的,該文分別討論了采用平均規(guī)則與中值規(guī)則時(shí)所對應(yīng)博弈的對稱貝葉斯Nash均衡的存在性問題,并比較了這兩種規(guī)則在不同偏好關(guān)聯(lián)程度下的性能。

由于從眾心理,群體成員經(jīng)常會(huì)根據(jù)對其他成員行為的觀察相應(yīng)調(diào)整自己的行為。文[63-64]對從眾心理對群體決策的影響進(jìn)行了研究,其中假定群體成員一方面希望選出好的決策選項(xiàng),另一方面又希望自己成為勝出的一方。文[63]分析了群體規(guī)模較大時(shí)同時(shí)投票機(jī)制與順序投票機(jī)制的均衡特征和信息集結(jié)質(zhì)量,文[64]指出這種從眾心理導(dǎo)致同時(shí)存在多個(gè)均衡,而且對于這些均衡中的多數(shù),信息不能被有效集結(jié)。文[64]從某種程度上說明了最優(yōu)決策規(guī)則設(shè)計(jì)的困難。

六、現(xiàn)有研究工作的不足之處

其一,社會(huì)選擇理論與公共選擇理論以及管理學(xué)領(lǐng)域?qū)θ后w決策的研究,主要考慮偏好集結(jié)的有效性,而其中的偏好則是指對決策選項(xiàng)的偏好,這種偏好取決于決策者對最終結(jié)果的更根本意義上的偏好和對世界真實(shí)狀態(tài)的信念。在現(xiàn)實(shí)社會(huì)中,純粹以偏好的有效集結(jié)為終極目標(biāo)的重要群體決策問題幾乎不存在,例如社會(huì)選擇理論與公共選擇理論最重要的應(yīng)用領(lǐng)域――選舉,既是偏好集結(jié)(這里指更根本意義上的偏好),更是信息集結(jié)。僅考慮偏好的集結(jié)問題,不考慮偏好的形成過程以及信息在偏好形成過程中的潛在作用,無法分析群體內(nèi)外部交流與互動(dòng)等對決策的影響,無法解釋現(xiàn)實(shí)中的很多現(xiàn)象,因而對相關(guān)決策機(jī)制設(shè)計(jì)的指導(dǎo)作用較為有限。

其二,社會(huì)心理學(xué)從認(rèn)知的角度研究群體決策,其結(jié)論出自于對實(shí)驗(yàn)和經(jīng)驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)學(xué)分析,易于為人們接受。但由于從實(shí)驗(yàn)或經(jīng)驗(yàn)數(shù)據(jù)中利用統(tǒng)計(jì)學(xué)方法推導(dǎo)出群體的偏好分布參數(shù)極為困難,所以無法深入研究群體決策過程中因偏好不一致而導(dǎo)致的隱藏與扭曲私有信息等策略。

其三,與社會(huì)選擇理論和公共選擇理論一樣,用博弈論研究群體決策信息集結(jié)問題的文獻(xiàn)也是以理性選擇假設(shè)作為判斷與決策的微觀基礎(chǔ)。盡管所有群體成員嚴(yán)格按照貝葉斯規(guī)則更新自己的信念等完全理性假設(shè)對于心理學(xué)家和普通人來說都是難以接受的,但博弈論文獻(xiàn)還是以其數(shù)學(xué)分析的簡潔與嚴(yán)謹(jǐn)顛覆了很多直覺上的認(rèn)識,通過對群體決策者動(dòng)機(jī)的分析,有助于我們理解決策機(jī)制的哪些方面可能會(huì)引起不利于決策目標(biāo)實(shí)現(xiàn)的策略,進(jìn)而有助于決策機(jī)制的改進(jìn)。隨著群體成員偏好差異程度和決策問題重要程度的增加,審議方式和決策規(guī)則趨向于書面化和正規(guī)化,群體思維與群體極化現(xiàn)象將很少出現(xiàn),決策結(jié)果也將更接近于博弈分析的預(yù)測。

目前對群體決策信息集結(jié)問題的研究尚處于起步階段,還有很多不完善之處,在某些方面甚至存在根本性的缺陷。

第一,可能是受到信息經(jīng)濟(jì)學(xué)研究的誤導(dǎo),本領(lǐng)域的很多理論與實(shí)驗(yàn)分析文獻(xiàn),包括一些奠基性的文獻(xiàn),混淆了信息與在信息基礎(chǔ)上形成的判斷。真實(shí)信息的披露不會(huì)引起其他群體成員以及公眾對自己決策能力的負(fù)面評價(jià),更不會(huì)如判斷的披露那樣引起認(rèn)知上的從眾,如果決策者掌握了確鑿可靠的信息,則其不會(huì)因?yàn)槠渌嘶谄渌畔a(chǎn)生的不同看法而輕易改變自己的信念。

除個(gè)別文獻(xiàn)外,現(xiàn)有研究群體決策信息集結(jié)問題的文獻(xiàn)幾乎都是將審議完全等同于信息經(jīng)濟(jì)學(xué)領(lǐng)域的廉價(jià)磋商,將交流限制為每個(gè)群體成員同時(shí)向所有其他成員發(fā)送一輪公開的消息。在現(xiàn)實(shí)群體決策過程中,審議至少包括對各方面提供的信息的真實(shí)性的審議,以及對信息與世界真實(shí)狀態(tài)之間的邏輯關(guān)聯(lián)(即潛在的決策模型)的審議。因此,將審議建模為完全的廉價(jià)磋商的現(xiàn)實(shí)意義極為有限,對于偏好差異較大的群體更是如此。

第二,客觀上難以驗(yàn)證的信息的可接受性,取決于接收者對于信息發(fā)送者的偏好的信念,例如,人們有充分的理由懷疑壟斷企業(yè)單方面提供的企業(yè)運(yùn)營成本數(shù)據(jù)的真實(shí)性。另一方面,在很多情況下,信息的軟硬程度(可驗(yàn)證程度)與信息獲取者和信息接收者的成本投入相關(guān)。因此,群體成員獲取可驗(yàn)證信息與不可驗(yàn)證信息的動(dòng)機(jī),以及群體成員對信息軟硬程度的投入,既取決于是否有審議階段以及審議方式和決策規(guī)則,也取決于群體成員的偏好和群體成員關(guān)于群體偏好差異程度的先驗(yàn)信念。諸如此類問題現(xiàn)有文獻(xiàn)幾乎沒有涉及。

群體決策在現(xiàn)代社會(huì)無處不在,如政府部門對重大戰(zhàn)略性問題的決策、公司董事會(huì)對重要項(xiàng)目投資與實(shí)施問題的決策、審判委員會(huì)對犯罪嫌疑人的判決、專家對科學(xué)基金項(xiàng)目申請書的評審等。從組織或社會(huì)的目標(biāo)出發(fā),針對特定的決策問題,為了盡可能作出正確的決策,應(yīng)該如何組成決策群體,選擇何種決策規(guī)則?此類群體決策的科學(xué)化與民主化問題很久以來一直是管理、政治、法律和經(jīng)濟(jì)等領(lǐng)域討論的中心,其研究結(jié)果對于各類政治、社會(huì)、經(jīng)濟(jì)組織的運(yùn)行機(jī)制設(shè)計(jì)具有重要的意義。

中國學(xué)者對群體決策的理論與方法進(jìn)行了大量的研究,提出了不少新的概念和方法,作出了很多重要貢獻(xiàn),國家自然科學(xué)基金委員會(huì)對群體決策理論與方法研究也較為重視,曾將其列為優(yōu)先資助領(lǐng)域。但根據(jù)現(xiàn)有的各類文獻(xiàn)和歷年的基金項(xiàng)目研究摘要,總體感覺國內(nèi)對決策群體成員的動(dòng)機(jī)和理考慮較少,到目前為止還沒有發(fā)現(xiàn)國內(nèi)其他學(xué)者利用博弈論研究群體決策信息集結(jié)問題。

筆者試圖利用不完全信息博弈論和機(jī)制設(shè)計(jì)理論,研究決策群體成員的策略性信息獲取、信息傳遞和投票表決行為,揭示決策群體人員組成、審議方式、決策規(guī)則、透明性等決策機(jī)制的各個(gè)方面對群體決策的信息集結(jié)有效性的具體影響。并試圖從信息集結(jié)角度,為一些典型公共決策情形優(yōu)化決策機(jī)制。

參考文獻(xiàn):

[1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.

[2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.

[3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.

[4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.

[5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.

[6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.

[7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.

[8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.

[9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.

[10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.

[11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.

[12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.

[13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.

[14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.

[15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.

[16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.

[17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.

[18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.

[19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.

[20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.

[21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.

[22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.

[23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.

[24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.

[25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.

[26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.

[27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.

[28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.

[29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.

[30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.

[31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.

[32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.

[33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.

[34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.

[35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.

[36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.

[37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.

[38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.

[39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.

[40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.

[41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.

[42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.

[43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.

[44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.

[45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.

[46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.

[47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.

[48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.

[49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.

[50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.

[51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.

[52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.

[53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.

[54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.

[55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.

[56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.

[57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.

[58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.

[59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.

[60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.

[61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.

[62] GRNER H, KIEL A. Collective decisions with interdependent valuations[J]. European Economic Review, 2004, 48(5):1147-1168.

第7篇

關(guān)鍵詞:認(rèn)知無線電;功率控制;非合作博弈;納什均衡;效用函數(shù)

中圖分類號:TN014文獻(xiàn)標(biāo)識碼:A文章編號:1672-3198(2009)16-0265-02

0 前言

認(rèn)知無線電(cognitive radio,CR)是以軟件無線電(software radio)技術(shù)為基礎(chǔ)的能夠提高無線通信頻譜利用率的新技術(shù)。在很多國家,傳輸效率較高的頻段是以授權(quán)分配的方式分配給無線通信業(yè)務(wù)部門和運(yùn)營企業(yè)的,但這些頻段的授權(quán)用戶并不是在任何時(shí)刻都使用分配給他的頻段,因此不少傳輸效率很高的授權(quán)頻段會(huì)經(jīng)常處于空閑狀態(tài),這就浪費(fèi)了寶貴的頻譜資源。根據(jù)美國聯(lián)邦通信委員會(huì)(FCC)所進(jìn)行的大量研究表明,在大部分地區(qū),授權(quán)頻段的平均利用率在15%―85%之間,而一些傳輸效率較高的非授權(quán)頻段則過于擁擠。于是Joseph Mitola博士在1999年首先提出了認(rèn)知無線電概念,目的就是解決頻譜資源的有效利用問題。

博弈論(Game Theory)又被稱為對策論,是現(xiàn)代數(shù)學(xué)的一個(gè)分支,也是運(yùn)籌學(xué)的一個(gè)重要組成部分,是研究互動(dòng)決策的理論。John Nash博士在1950年提出了納什均衡(Nash equilibrium,NE)即非合作博弈均衡的概念。該理論指出,在一策略組合中,所有的參與者都面臨這樣一種情況,當(dāng)其他人不改變策略時(shí),他此時(shí)的策略是最好的,此時(shí)便達(dá)到了納什均衡。在納什均衡點(diǎn)上,每一個(gè)理性的參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng)。這種參與者為了各自利益的最大化不斷改變策略的做法,與CR中各認(rèn)知用戶為爭得傳輸效率的最大化對頻譜和功率不斷進(jìn)行調(diào)整的自適應(yīng)算法策略相符。因此,可以引入非合作博弈論模型對CR的頻譜分配和功率控制算法進(jìn)行檢測和優(yōu)化。

本文以認(rèn)知用戶的滿意度為設(shè)計(jì)目標(biāo),引入代價(jià)函數(shù)得到一種新的基于非合作認(rèn)知無線電功率控制的博弈模型,并結(jié)合對該模型的分析介紹了非合作博弈論在CR中的一般分析方法。

1 認(rèn)知無線電體系結(jié)構(gòu)

認(rèn)知無線電是對軟件無線的擴(kuò)展,因此具備軟件無線可重新配置的特點(diǎn),并且能夠?qū)崿F(xiàn)基于環(huán)境認(rèn)知的自動(dòng)配置。S•Haykin根據(jù)CR所必需的頻譜掃描、信號分析、參數(shù)測量、頻譜決策、協(xié)議分析等功能,給出了CR系統(tǒng)構(gòu)成的基本功能結(jié)構(gòu),該結(jié)構(gòu)將CR系統(tǒng)分為三個(gè)功能模塊。

(1)無線頻譜分析模塊。

該模塊通過接收環(huán)境中的射頻激勵(lì),并利用自身算法對激勵(lì)信號進(jìn)行動(dòng)態(tài)分析,實(shí)時(shí)提供對環(huán)境中頻譜空穴的檢測情況,搜集可使用的頻譜空穴的信息。

(2)無線信道估計(jì)模塊。

該模塊根據(jù)無線頻譜分析模塊的分析結(jié)果,對無線信道狀態(tài)和容量進(jìn)行估計(jì),為系統(tǒng)通信信道的選擇提供依據(jù)。

(3)傳輸功率控制和動(dòng)態(tài)頻譜管理模塊。

該模塊根據(jù)頻譜分析模塊和信道估計(jì)模塊的分析結(jié)果,選擇最優(yōu)的頻譜空穴進(jìn)行通信。在通信過程中對傳輸功率進(jìn)行實(shí)時(shí)控制,使得首要用戶和次要用戶均能達(dá)到最優(yōu)的通信水平。

S•Haykin給出的三個(gè)功能模塊共同構(gòu)成了CR系統(tǒng)的物理層,從各個(gè)模塊所具備的功能可以看出認(rèn)知無線電是應(yīng)用了多種現(xiàn)代信號處理技術(shù)的綜合性通信平臺(tái)。

2 非合作博弈論在認(rèn)知無線電中的分析方法

認(rèn)知無線電中的策略選擇問題及相關(guān)算法的設(shè)計(jì)是該技術(shù)的研究核心。利用非合作博弈論,可以按以下方法及步驟對自適應(yīng)算法進(jìn)行分析:

(1)該算法是否能達(dá)到納什均衡。即驗(yàn)證算法是否能達(dá)到納什均衡,具體步驟為:先將所研究的問題抽象為相應(yīng)的非合作博弈算法模型,然后證明該模型中NE的存在性和唯一性。

(2)該算法達(dá)到納什均衡(NE)后的穩(wěn)定狀態(tài)是否符合帕累托最優(yōu)(Pareto Optimality)。即根據(jù)系統(tǒng)的目標(biāo)函數(shù)衡量這一穩(wěn)定狀態(tài)是否是實(shí)際應(yīng)用環(huán)境中的最優(yōu)情況。

(3)該算法達(dá)到納什均衡和帕累托最優(yōu)的約束條件。

3 基于非合作博弈論的認(rèn)知無線電功率控制模型

在認(rèn)知無線電中,非授權(quán)用戶接入處于空閑狀態(tài)的授權(quán)用戶頻段,可以提高系統(tǒng)的頻譜利用率,但是該接入過程必然會(huì)導(dǎo)致授權(quán)用戶和非授權(quán)用戶之間的干擾。這是由于在CR系統(tǒng)中通常采用動(dòng)態(tài)功率控制以擴(kuò)大通信系統(tǒng)的工作范圍,而每個(gè)用戶的發(fā)射功率都會(huì)對其他用戶造成干擾。2003年,為了規(guī)范移動(dòng)頻段的非授權(quán)操作,美國聯(lián)邦通信委員會(huì)(FCC)提出了新的量化和管理干擾的指標(biāo)――干擾溫度。在給定干擾溫度和頻譜空穴的限制下控制發(fā)射功率,可以看做為一組策略問題,而且在實(shí)際環(huán)境中很好的符合了非合作博弈的模型。在CR中,每個(gè)用戶都從自身的利益出發(fā),追求功率的最大化,而任何用戶發(fā)射功率的增大都會(huì)對其他用戶利益造成影響。因此需要提供一種有效的算法對各個(gè)用戶的發(fā)射功率進(jìn)行動(dòng)態(tài)控制,以達(dá)到所有用戶的總利益最大化。

在CR中可以用信道利用率、系統(tǒng)吞吐量、系統(tǒng)信干比等指標(biāo)來衡量用戶的利益。假設(shè)以系統(tǒng)信干比來衡量,設(shè)計(jì)算法時(shí)就應(yīng)當(dāng)以系統(tǒng)的總干擾水平最小化為設(shè)計(jì)目標(biāo)。

通常把授權(quán)用戶稱為主要用戶(Primary User),非授權(quán)用戶稱為次要用戶(Secondary User)。假設(shè)通信環(huán)境中多個(gè)主要用戶和次要用戶同時(shí)工作,次要用戶具有認(rèn)知能力,即把次要用戶看做認(rèn)知用戶。假設(shè)認(rèn)知用戶i的發(fā)射功率為pi,傳輸增益為gi,且認(rèn)知用戶與基站存在通信鏈路,基站接收到的該用戶的功率為pigi,第j個(gè)主要用戶對第i個(gè)次要用戶的干擾為Qij并有M個(gè)主要用戶,則相應(yīng)的次要用戶在基站處的信干比(SNIR)為:

ri=WRi•pigi∑Nj=1,j≠ipigi+σ2+∑Mj=0Qij(1)

其中σ2為基站處背景噪聲,Ri為傳輸速率,W為第i個(gè)用戶在的擴(kuò)頻帶寬。

文獻(xiàn)提出的非合作的認(rèn)知無線電網(wǎng)絡(luò)的功率控制純策略的博弈模型(NPCG)定義了:參與者I={1,2,…,N}為認(rèn)知網(wǎng)絡(luò)中非授權(quán)用戶的集合;策略空間pi,認(rèn)知用戶在一次博弈中選擇的策略構(gòu)成功率矢量P={p1,p2,…,pN};用 表示用戶i的效用,即用戶i對所選策略的滿意程度,其中p-i是除i外其他N-1個(gè)用戶的功率。

在該模型中,每個(gè)認(rèn)知用戶的策略都是盡量增大功率,以獲得更高的效用。但當(dāng)功率超過干擾溫度后,整個(gè)系統(tǒng)的性能會(huì)迅速惡化,進(jìn)而造成每個(gè)用戶的效用都會(huì)降低。因此,必須選定合適的代價(jià)函數(shù),使用戶獲得更高效用時(shí)付出相應(yīng)的代價(jià)??紤]到在低于干擾溫度時(shí),用戶只需付出較小的代價(jià),而當(dāng)超過干擾溫度時(shí),每增加一定的效用必須讓用戶付出更高昂的代價(jià),筆者選擇SINR的正切函數(shù)做為代價(jià)函數(shù):

Ci=tg(kri)(2)

其中k為干擾系數(shù),在認(rèn)知用戶發(fā)射功率接近干擾溫度時(shí),kri的取值接近π2 。

在非合作的認(rèn)知無線電網(wǎng)絡(luò)的功率控制純策略的博弈模型的基礎(chǔ)上,結(jié)合式(2)筆者提出基于非合作的功率控制算法的數(shù)學(xué)模型:

ui(pi,p-i)=Ripif(ri)-λpiritgri(3)

其中piri表示增加單位信干比所要增加的功率,λ為懲罰因子,代表代價(jià)函數(shù)有效性的量度。該模型通過引入代價(jià)函數(shù)增加了懲罰機(jī)制,以此來控制認(rèn)知用戶為追求信干比一味增大發(fā)射功率的行為。當(dāng)功率超過干擾溫度后的嚴(yán)厲懲罰,會(huì)使所有認(rèn)知用戶意識到,犧牲一定的信干比可以帶來效用的最優(yōu),從而將發(fā)射功率控制在干擾溫度以下,避免了超過干擾溫度后系統(tǒng)性能迅速下降的惡性情況出現(xiàn)。

按照上節(jié)介紹的分析步驟對式(3)給出的模型進(jìn)行分析,討論該模型是否存在納什均衡(NE)以及是否符合帕累托最優(yōu)。對式(3)求一階導(dǎo)數(shù)后可求得微分方程的駐點(diǎn),進(jìn)而再求出二階導(dǎo)數(shù),易證式(3)的二階導(dǎo)數(shù)小于零。因此可得出該非合作博弈過程中NE的存在性和唯一性,所求得的駐點(diǎn)為唯一的納什均衡點(diǎn),同時(shí)該駐點(diǎn)即為所應(yīng)滿足的約束條件。

4 結(jié)論

認(rèn)知無線電概念提出的20年以來,隨著相關(guān)技術(shù)的研究不斷深入、相關(guān)傳輸標(biāo)準(zhǔn)的確立以及計(jì)算機(jī)處理能力的提高,CR的應(yīng)用越來越廣泛。本文首先介紹了CR物理層的基本結(jié)構(gòu),然后結(jié)合一種新的基于NPCG的非合作非合作功率控制模型的構(gòu)建,介紹了非合作博弈論在認(rèn)知無線電中的分析方法。綜上所述,我們有理由相信,隨著相關(guān)理論和技術(shù)的不斷進(jìn)步,非合作博弈論必將在認(rèn)知無線電的功率分配、頻譜分配以及其他核心研究方向發(fā)揮更大的作用。

參考文獻(xiàn)

[1]S.Haykin,Cognitive radio:Brain - Empowered Wireless Communications Selected Areas in Communications, IEEE Journal, 2005,23(2):201-220.

[2]FOSCHINI G J, MILJANIC Z, A Simple Distributed Autonomous Power Control Algorithm and Its Convergence[J]. IEEE Transactions on Vehicular Technology, 1993,(42):641-646.