“囚徒困境”在博弈論中是最基本的理論。指兩個共同犯罪的犯罪嫌疑人同時被抓,他們都存在兩種選擇,要麽坦白從寬,減輕處罰或無罪釋放,要麽抗拒抵賴,加重懲罰或因證據不足而釋放。但囚徒選擇哪一種好呢?這要從兩名囚徒選擇的條件和結果來分析。現在我們假定兩名囚徒分別為甲和乙兩人,如果甲選擇抵賴,這裏的結果就有兩種:如果乙選擇坦白,那麽甲將被加重懲罰;如果乙也選擇抵賴,那麽他們兩個都將因證據不足而被釋放。很明顯這需要他們兩個人的通力合作。但通常警方會把兩名囚徒羈押在不同的囚房裏,使這種合作難以順利進行而使得結果預測的不確定性加大,或者說增加了抵賴合作的風險性。如果基於人是自私的這一前提出發的話,那麽甲乙兩囚徒各自最好的選擇就是坦白從寬,因為不管甲乙兩人誰坦白,都將得到減輕懲罰的結果:如果甲坦白了,乙抵賴,甲將免於懲罰;如果乙也坦白了,那麽罪名各擔一半,從甲個人看來,也減輕了懲罰;而甲乙互換位置,結果依然是一樣。因此,在博弈論中認為他們兩者之間存在一個均衡點,即納什均衡點,我們把它稱為嚴格優勢策略。

但我們從上麵的分析也可以看出,這個均衡點是建立在兩個囚徒非合作的基礎上的,並且兩者的非合作還可以獲得一定的利益(從寬懲罰),如果沒有從寬懲罰的這一利益條件,那麽這個嚴格優勢策略也就不複存在。此時,兩個囚徒就很容易走向合作了。在我國曆史上出現的“合縱”和“連橫”的較量就充分地說明了這一點。

從當時的曆史來看。秦國在商鞅變法之後,一躍成為七國中實力最強的國家。社會上從此出現一種從來沒有過的長期緊張局麵,舊傳統的意識形態和政治知識都不能應付這個雷霆萬鈞的壓力。於是以秦國為對象,產生了兩種嶄新的但也恰恰針鋒相對的戰略思想和外交政策:一是合縱對抗政策,即圍堵政策,主張從北到南,各國締結軍事同盟,共同抵禦秦國的侵略,秦國如對某一國發動侵略,即等於向所有的盟國侵略,各國同時出兵作戰;另一是連橫和解政策,即和平共存政策,主張從西到東,各國同時跟秦國簽訂友好條約,保持雙邊的和平關係。

當時,東方的齊國與秦國旗鼓相當,雙方在不斷兼並周圍弱國、擴大勢力範圍的同時,誕生了“合縱”和“連橫”兩個中心——以齊國為中心的“合縱”和以秦國為中心的“連橫”。這就是我國曆史上所謂的“合縱”、“連橫”的外交鬥爭。

這裏的“合縱”、“連橫”就如囚徒的“抵賴”和“坦白”一樣。“合縱”就是指弱國聯合起來,阻止強國進行兼並,這是弱國保存自己最理想的策略。就如兩個囚徒同時抵賴可以使兩人都因證據不足而免於懲罰一樣的理想結果,但條件是他們必須同時抵賴即能夠合作。而“合縱”的對象有多個,就更需要多方麵的合作了。雖然這種合作是可以看得見的,可以協商的,不像兩個囚徒那樣是在黑暗中猜測。但結果卻很有相似之處。因為它成員多,而可變的人為因素也就更多了。“連橫”就是強國迫使弱國幫助它進行兼並。正如兩個囚徒的“坦白”,是他們單個的嚴格優勢策略,但結果仍然是要得到懲罰一樣,隻不過這個懲罰是由一個人來擔當還是由兩個人來擔當。而“連橫”也是一樣,它也是各個弱國的嚴格優勢策略,但就整個共同體來看,弱國仍然會被兼並,隻不過是被早兼並還是遲兼並的問題。其博弈矩陣如是下。

合縱連橫關係圖

從上麵的矩陣我們可以看出,“連橫”是秦國的嚴格優勢策略,不僅可以得到土地這個現實的收益值,而且獲得了統一中國這個未來的收益值。而“合縱”是齊國的嚴格優勢策略,它不僅保存齊國已有的現實利益,還可以限製或削弱秦國的實力,使自己得以長存。

從實際上看。“合縱”和“連橫”都是爭取暫時同盟者的外交手段,其目的是進一步兼並土地,擴張領土。從博弈論看來,就是強國和弱國都在進行博弈,都在進行嚴格優勢策略的博弈。而博弈的有序進行是必須基於一定的利益條件的,是根據利益條件這隻看不見的手來進行調節的。這也就決定了“合縱”和“連橫”的離散聚合了。

“合縱”和“連橫”有其存在的曆史必然性,同時也離不開這兩幕曆史劇的導演人——戰國時的文人說客,其中最重要的就是蘇秦和張儀。蘇秦在研究社會局勢和各國君主的心理後,提出對秦國采取合縱對抗政策。蘇秦先後到了韓國、魏國、齊國,最後再到楚國。六國完全同意簽署這個盟約,並一致任命蘇秦為他們的宰相,讓他擔任“縱約長”——南北合縱對抗盟約組織的秘書長,圍堵政策完成,第一次“合縱”形成。

這裏蘇秦的成功,在博弈論看來,其實就是兩個在困境中的囚徒合作的成功,隻不過這裏的囚徒不是一個,而是六個,但成功的條件卻是一樣的,要使兩個囚徒一起抵賴,就必須使兩個囚徒堅信,抵賴是他們惟一的出路,是他們最大的利益;而要六國“合縱”,也是一樣,必須使六國堅信“合縱”是它們惟一的出路,是它們最大的利益。站在當時六國的角度來看這是完全正確的。

隻有大政治家才能看到十年之後,隻有曆史學家才能看到三十年之後。各國有各國眼皮底下的現實利益,而人往往更相信眼前直接的現實利益。這就是“嚴格優勢策略”的特點。

秦國利用各國統治者的人性弱點,給以小恩小惠,然後各個擊破,所以說,秦國在政治博弈中明顯要比六國勝出一籌,因此,“合縱”也隻能是曇花一現了。

在蘇秦組成第一個“合縱”聯盟的同時,秦國立即采取行動。就在“合縱”的第二年,即公元前332年,秦國向魏國表示讓步,願把從前侵占魏國的襄陵(山西襄汾)地區七個城市歸還。那七個城市距魏國前首府安邑(山西夏縣)一百六十裏,是防務上最重要的屏障。如果能把它們收回,安邑就可以無憂了。

這是最大的現實利益,在博弈論看來,秦國是拋出了使人選擇“嚴格優勢策略”的利用條件,秦國成了“囚徒困境”中的警察。人有自私的本能,所以永遠都有傾向於“嚴格優勢策略”的自然選擇,這可能也是人的生存本能。魏國自然不能抵抗這個**,因為它更有利於魏國的生存,於是同意脫離合縱;而且為了擴張土地,魏國還向趙國發動攻擊。齊國在秦國的鼓勵下,認為可以從趙國瓜分到土地,就也參加到魏國這一邊。兩國軍隊雖然被趙國擊退,但第一次合縱對抗盟約隻維持一年便告瓦解,蘇秦在趙國無法解釋魏齊兩國的叛盟行動。隻好前往燕國,出任燕國宰相。秦國等到合縱對抗盟約瓦解了之後,卻拒絕歸還襄陵七城,魏國在大怒下攻擊秦國,又被秦國擊敗。這樣,第一次“合縱”就在六國的互相殘殺中轟然瓦解。

合縱對抗盟約固然瓦解,但這種觀念仍被認為是正確的指導原則。所以十五年後的公元前318年,這時各封國都已改製為獨立王國,魏、楚、韓、趙、燕五個國家痛恨秦國趁著盟約瓦解不斷向東擴張,於是再次締結第二次合縱對抗盟約,推舉楚王華槐擔任縱約長,集結五國聯軍,進攻秦王國東方邊界重鎮函穀關(河南靈寶東北)。這次雖然是以楚國為首,好像齊國沒有參加,但此時卻還存在另外一個聯盟,就是齊楚聯盟,這個聯盟在第一次“合縱”失敗後仍然存在,所以齊國並沒有在五國背後插刀。

這是一次聲勢浩大的軍事行動,人人都預料將爆發一場大戰。可是,秦國守關大將樗裏疾大開關門,出兵迎戰。五國聯軍震於秦軍的聲威,竟麵麵相覷,誰都不敢先行攻擊。從博弈規則看來。五國同心協力進攻就成了“囚徒”的抵賴,就整個團體而言,它們可能獲得最好的結果,而撤退是它們的“嚴格優勢策略”。從合作性博弈規則來看,五國結成了同盟,就已經是一種合作關係,達到了一個博弈均衡點,而在這個均衡狀態中,參與者誰先改變支付,誰就會得到利益。因此,在僵持了幾天之後,楚兵團因糧道被秦國切斷,在驚恐中第一個撤退,但它的損失應該是最小的,因為它沒有遭到追擊,而其他五國軍隊在跟著倉皇拔營回國時,就很可能遭到秦國的追擊,事實也是如此,最後一個撤退的損失最大。合縱對抗盟約又一次瓦解。

但“合縱”和“連橫”的真正關鍵是楚國。或者說齊秦鬥爭的焦點在於爭取楚國。因為楚國是南方的一個大國強國,楚國是領土最廣大、人力最雄厚的大國,秦國不敢輕視它,尤其恐懼楚國跟齊國聯合。在當時的條件下,秦國還沒有實力來戰勝齊楚兩國的聯盟。而強大的秦國對其他六國都是一個潛在的威脅,楚國在分析了各方麵的情況後,與齊歃血為盟,結成了“合縱”的局麵。正如我們前麵所分析的,因為生存的利害關係,促使了博弈雙方的兩個“囚徒”走上了“抵賴”的合作之路,而出現這種結果條件就是兩者利益完全捆綁,一榮俱榮,一損俱損。這是齊楚兩國在客觀理性上的分析而能夠通過協商來進行合作的結果。

但這種聯盟很明顯有一個前提,那就是秦國是齊楚的共同敵人,而在國家關係上是沒有永遠的敵人和朋友的,所以一旦敵人轉化為朋友,“合縱”這個聯盟也就霎時崩潰。而在此時,“連橫”高手張儀橫空出世,他正是深諸此道的博弈高手,正是他上演了一幕“一人打敗楚國”的神話。為了瓦解齊楚“合縱”聯盟,張儀入楚並口頭許願,以歸還楚國商於(在今河南淅川西南)六百裏的地方為代價。楚懷王信以為真,就和齊國斷交。這裏張儀運用的正是“囚徒困境”中的“坦白”利益條件,使楚國陷於“嚴格優勢策略”的選擇當中。

但這種嚴格優勢策略的選擇是要付出代價的,如果說囚徒之間的坦白隻是從此以後兩個人的私人關係的終結(當然不是絕對的),那麽,國與國在這種情況下是不可能在短時間內再進行合作了,齊楚“合縱”聯盟瓦解。

這時,齊秦鬥爭趨於白熱化。山東五國的“合縱”依然存在。公元前298年,齊、韓、魏、趙、中山五國聯軍攻入函穀關。秦國被迫退還韓、魏的一些地方,五國才退了兵。齊國成為關東各國的盟主。但這種同盟並不牢固,當利益條件再度改變時,山東五國的“合縱”也就不複存在了。公元前288年,秦昭王自稱西帝,尊齊滑王為東帝,用遠交近攻的策略拉攏齊國,破壞了關東的“合縱”聯盟。

在戰國這場“合縱”和“連橫”的曆史博弈中,秦國成了最終的“警察”,而其他六國則相繼淪為了“囚徒”,這六個“囚徒”在各自的曆史舞台上都進行了“嚴格優勢策略”的選擇,然而都沒有逃脫滅亡的曆史悲劇,正如博弈中“囚徒困境”中的囚徒不能逃脫懲罰一樣。在曆史的博弈中,國家眼前的利益和國家長遠的利益永遠是一個辯證的矛盾體,二者統一於國家的發展之中。當眼前利益跟長遠利益一致時,它就促進國家的發展;當眼前利益和長遠利益相悖時,就會阻礙國家的發展,甚至使國家走上滅亡。

“合縱”是六國的長存之道,也就是它們的長遠利益。但它在當時是難以直接地顯現出來;而“連橫”是六國的暫存之道,但這種暫存之道卻是不利於六國的長存之道,但這種利益是眼前可以看到的,而這種眼前利益正是博弈中的“嚴格優勢策略”,能使國家暫時地很好生存,但這種生存不是長存,從這個意義上說,生存未必是硬道理。長存才是硬道理。由此看來,在“合縱”和“連橫”這場曆史的較量中,“連橫”是取得了最終的勝利。“囚徒”分擔了罪名,“警察”得到了最大的實惠。