由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。 如何理解元博弈(meta-game)與普通博弈之間的區別? 試用你生活或工作中的實際例子或者熟悉的例子來說明什麼是元博弈。 子賽局完美均衡 純策略納什均衡(Pure Strategy Nash Equilibrium)純策略納什均衡是指在一個純策略組合中,如果給定其他的策略不變,該節點不會單方面改變自己的策略,否則不會 …

子賽局完美均衡

最經典的例子就是圍棋,盤面可能性目前還多到電腦無法窮舉。 2×2雙量矩陣博弈局中人1,2的收益矩陣分別是. 因為機率是連續的,所以即使策略集合是有限的,也會有無限多個混合策略。

子賽局完美均衡: 課程活動

以上面投资博弈为例,我们看这样一个策略组合:B在第一阶段选择“借”,在第三阶段选择“炸”;而A在第二阶段选择“分”。 虽然该策略是整个博弈的一个纳什均衡但这个策略组合中B的策略要求B在第三阶段单人子博弈中选择的“炸”策略不是该单人子博弈的一个纳什均衡,因为该单人子博弈的最优解,应该是“不炸”,否则B就是非理性的。 因此,根据子博弈精练纳什均衡的定义,这个策略组合就不是一个子博弈精练纳什均衡。 这也正是我们在前面分析该纳什均衡策略组合是不稳定的均衡的根本原因。 每个节点(称作决策节点)表示博弈进行中的每一个可能的状态。 博弈从唯一的初始节点开始,通过由参与者决定的路径到达终端节点,此时博弈结束,参与者得到相应的收益。

如果兩人均不招供,將最有利,只被判刑半年。 於是兩人同時陷入招供還是不招供的兩難處境。 但兩人無法溝通,於是從各自的利益角度出發,都依據各自的理性而選擇了招供,這種情況就稱為納許均衡點。 這時個體的理性利益選擇是與整體的理性利益選擇不一致的。

子賽局完美均衡: 战略管理咨询分析工具

或者都用混合策略,即參與者1在3/5的次數中選擇O(歌劇),參與者2在3/5次數中選擇F(足球)。 第二個賽局也是有先後順序的,但是虛線表示了第二個參與者的資訊集合。 通常用來表示第二個參與者做選擇的時候,不知道第一個參與者的選擇。 大意是:一個案子的兩個嫌疑犯被分開審訊,警官分別告訴兩個囚犯,如果你招供,而對方不招供,則你將被立即釋放,而對方將被判刑10年;如果兩人均招供,將均被判刑2年。

  • 感慨「這個年頭,『奪妻之恨』已經少見了,眼前上演的是一場火辣辣的『奪財之恨』」。
  • 賽局理論並沒有辦法精確的做出策略與預判,只能盡可能提高利益,而當賽局的狀態在單方面改變策略或者單方面的決策,並沒有辦法成功的改變整個賽局,此時的策略型態稱作「納許均衡」。
  • 2×2雙量矩陣博弈局中人1,2的收益矩陣分別是.
  • 在實驗設計部份,我們會先以四個元素定義一個「經濟學實驗」:真實誘因、對照組的設計、隨機分組、不欺騙受試者,並討論在這個定義下如何設計一個「好」的經濟學實驗。
  • 當參與人的戰略在每一個子博弈中都構成納什均衡時,則形成“子博弈精煉納什均衡”。
  • 只有當參與人的策略在每一個子博弈中都構成納什均衡叫做精煉納什均衡。

而且,由于先行动者拥有后行动者可能选择策略的完全信息,因而先行动者在选择自己的策略时,就可以预先考虑自己的选择对后行动者选择的影响,并采取相应的对策。 在上個禮拜的課程中,我們從實驗結果中,看到社會偏好如何影響人們的決策。 在這個禮拜的課程,我們將會從經濟理論的角度,來討論社會偏好。 我們在這個禮拜的課程,我們會比較三種社會偏好模型:Guilt-Envy、ERC,以及Fairness Equilibrium。

子賽局完美均衡: 企业战略环境分析

• Zero-Sum Games (零和賽局). – Rock-Scissor-Paper (剪刀石頭布). – Sports (PK, tennis serve… 完全信息靜態博弈只是一種獨特的理想狀態。 在現實中,當後一個參與人行動時,自然會根據前者的選擇而調整自己的選擇,而前者也會理性地預期到這一點,所以不可能不考慮自己的選擇對他人的影響。

當地方政府財政手段不透明化且中央政府的政策沒有動態一致性時,中央政府採用高分成策略是一種強優勢策略。 如果中央政府重視地方經濟發展,此時中央與地方的策略選擇會落在非帕累托效率的結果(高分成-對抗)。 無論中央政府在決定策略時是否信息完全,當中央政府重視地方經濟發展時,會採用低分成策略,當中央政府注意自己的利益時,會採用高分成策略。

子賽局完美均衡: 完全信息動態博弈

這種 A 方知道,B 方卻不知道的資訊,在海薩尼的非合作賽局中被稱為類型(types)。 A、B 企業都知道自己的類型(成本高、成本低),不知道另一方的類型,但卻能得知類型的分佈,如阻擾成本高的機率是 60%、阻擾成本低的機率是 40%。 比如《玩命關頭7》中,唐老大與戴克蕭開車互撞。 子賽局完美均衡 最好的情況是一個活著,另一個死亡,這就得賭誰先膽小偏移車道,所以奈許均衡有兩個:唐老大先偏移,戴克蕭直衝;唐老大直衝,戴克蕭先偏移,參賽者難以預測結果。 賽局理論最有名的例子,就是普林斯頓大學數學教授阿爾伯特.

子賽局完美均衡

既然培養思維的目的是理性,那我們要如何將這樣的理性思維,應用在決策與選擇上呢? 例如賽局理論中有名的命題「囚徒困境」,為了避免更大的弊處,而沒有選擇對於自身最有利的選項,事實上這很常出現在生活中的各種情境上。 逆向归纳法(Backward Induction)是求解子博弈精炼纳什均衡的最简便方法。 在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上去,这就是逆向归纳法。

子賽局完美均衡: 博弈论研究分析和运用

1965年,澤爾騰通過對動態博弈的分析,提出了“子博弈精煉納什均衡”的概念,它要求任何參與人在任何時間、地點的決策都是最優的,決策者應該隨機應變,而不是固守前謀。 當參與人的戰略在每一個子博弈中都構成納什均衡時,則形成“子博弈精煉納什均衡”。 也就是說,組成“子博弈精煉納什均衡”的戰略必須在每一個子博弈中都是最優的。 在解賽局均衡時,「優勢 」是一個非常重要的觀念,即:一個策略如果「在任何情況下都比另一策略差」,就不應該用,因為它無論如何都不會極大化你的報酬。 然而你自己會不會遵守極大化、使用優勢策略,跟「你相信別人會不會遵守極大化、使用優勢策略」不太一樣,因為後者牽涉到你對別人行為的「信念」。

在動態博弈中,參與人的行動有先後順序,後行動的參與人在自己行動之前就可以觀察到先行動者(參與人)的行為,併在此基礎上選擇相應的策略。 而且,由於先行動者擁有後行動者可能選擇策略的完全信息,因而先行動者在選擇自己的策略時,就可以預先考慮自己的選擇對後行動者選擇的影響,並採取相應的對策。 子博弈精煉納什均衡用於區分動態博弈中的”合理納什均衡”與”不合理納什均衡”,將納什均衡中包含有不可置信威脅策略的均衡剔除出去,就是說,使最後的均衡中不再包含有不可置信威脅策略的存在。 在上個禮拜的課程中我們可以發現,在輪流出招的優勢可解賽局中,人們的行為與其信念的層次有很大的關聯。 而在這個禮拜的課程中,我們將進一步討論,在兩人同時出招的賽局中,人們的行為是如何受到「多層次思考」的影響。

子賽局完美均衡: 博弈论笔记

按照子博弈的定义,我们还可以进一步讨论这个子博弈的子博弈问题。 在上面图的子博弈中,当A选择不分,轮到B选择“炸还是“不炸”的第三阶段,就是这个子博弈的子博弈,我们称后面这个子博弈为原博弈的“二级子博弈”。 下图中外、内两层虚线框分别表示博弈的两级子博弈。 此时这个两子博弈已经是一个单人博弈,不可能再有子博弈。 也就是说:如果信息集有多个节点,信息集所属的参与者就不知道能往哪个节点移动。 當甲、乙都採原價時,甲的利潤有 10 億,乙的利潤有 6 億。

  • 在這個禮拜的課程中,我們將會討論議價談判中的主要兩種實驗形式:「自由談判」與「制式談判」。
  • 在個別決策部份,我們將要介紹如何測量每個人的風險偏好與時間偏好,以及其背後的理論。
  • 囚徒困境是指囚徒們在無法溝通的情況下,因為出賣同夥可為自己帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。
  • 最好的情況是一個活著,另一個死亡,這就得賭誰先膽小偏移車道,所以奈許均衡有兩個:唐老大先偏移,戴克蕭直衝;唐老大直衝,戴克蕭先偏移,參賽者難以預測結果。
  • 行玩家得到第一個收益,列玩家則得到第二個 …
  • 定义2(子博弈):由一个动态博弈第一阶段以后的任一阶段开始的后续博弈阶段构成的,包含有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。

中文摘要既存的企業社會責任相關文獻中,大多數假定廠商最終目標是極大化自身利益,且少有文獻利用經濟學工具進行相關理論研究。 本文以一個雙佔、完全但非完美信息的兩階段動態賽局為基本框架,探討子賽局完美均衡下的CSR策略組合。 廠商的類型有二:手段利他或目的利他;目的利他廠商將消費者剩餘納入自身的目標函數中,手段利他廠商則否。 本文引入捐贈與販賣連結商品兩種類型的CSR投入選擇,探討在兩階段的動態賽局中,政府的稅制如何影響在均衡下的廠商CSR選擇。 本文所獲致的基本結論是:在一定條件下的數值範例中,政府的稅制工具變數以及相關的市場特質參數,會影響廠商的均衡CSR類型選擇。

子賽局完美均衡: 重點七十五: 動態賽局、子賽局完美均衡(SPNE)

在賽局理論中,納許均衡(英語:Nash equilibrium,或稱納許均衡點)是指在包含兩個或以上參與者的非合作賽局(Non-cooperative game)中,假設每個參與者都知道 … Nash均衡是賽局理論中一個很重要的概念。 題目2 (是非題), 子賽局完美均衡一般是動態賽局納許均衡的子集合,較納許均衡更精煉,特別是均衡太多的時候,子賽局完美均衡可以帶來更多的 … 倒推法的邏輯基礎是動態博弈中先行動的參與人,在前面階段進行選擇行為時必然會考慮後行動的參與人在後面階段中的行為選擇。 因此只有在最後一階段的參與人才能不受其他參與人的制約而可以直接做出選擇。

每週將會有習題練習以及指定閱讀的期刊論文。 你將會參與一些線上的實驗、報告論文並且互評其他同學的報告。 子賽局完美均衡 子博弈在动态博弈中是很普遍的,完美信息多阶段动态博弈基本上都有一级或多级子博弈。

子賽局完美均衡: 企业高效经营管理的工具方法合集

澤爾騰(Reinhard Selten)為賽局引入動態的概念,提出「子賽局完美 … 事實上,這樣兩人都選擇坦白的策略以及因此被判兩年的結局被稱作是「納許均衡」(也叫非合作均衡),換言之,在此情況下,無一參與者可以「獨自行動」(即單方面改變決定)而增加收穫。 如果参与者1选择D,参与者2为了最大化收益,会选择U’,最后参与者1只能得到1。 但是如果参与者1选择U,参与者2为了最大化收益,会选择D’ ,此时参与者1得到2。 所以参与者1会选择U,参与者2选择D’ 。 同時,賽局理論原先假設資訊完全透明,跟現實世界的情況不盡相符。

子賽局完美均衡: 企业财务分析报告模板

課程資訊頁面以表格形式顯示課程表,以及課程分級的基準。 您可以新增您對課程結構、課程政策或其他任何東西的任 何其他評論、說明或想法。 子賽局完美均衡 臉部肌膚是否淨白、有無斑點生成,一直都是愛美女性相當在意的問題。 自從第一台「光回春」概念的脈衝光機引進國內後,相關科技不斷創新,目前新世代彩衝光科技研發,能擴大改善肌膚問題,讓變美可以更輕鬆無…

子賽局完美均衡: 子賽局完美均衡題目2023-在Facebook/IG/Youtube上的焦點新聞和熱門話題資訊-2022-07(持續更新)

显然,图中虚线框中的部分完全满足这个定义,是这个三阶段博弈的一个子博弈。 完美信息的博弈是指在博弈的任何阶段,每个参与者都清楚博弈之前发生的所有行动,也即每个信息集都是一个单元素集合。 参与者在一个特定的决策节点上可能有无数种可能的行动可以选择。 其表示方法是用弧形来连接从该决策节点延伸出的两条边。 如果行动空间是在两个数字之间的闭联集(continuum),那么把这两个表示上下界限的数字分别放在弧的上方和下方,并用一个变量来表示其支付。

然而納許對平衡的定義比庫爾諾的更為廣泛,也比帕勒托效率平衡的定義更為廣泛,因為納許的定義沒有針對「形成哪種平衡最為理想」作出評判。 定义2(子博弈):由一个动态博弈第一阶段以后的任一阶段开始的后续博弈阶段构成的,包含有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。 本書介紹人的決策,除了受理性控制外,尚會被其他人的行為所影響。 結果導致有些個人、組織能順利合作,有些卻彼此衝突。

子賽局完美均衡: 資訊集合 (賽局理論)

但假如甲航空公司通過計算後發現,無論自己降價後因為搶奪乙的市占率,無論乙有沒有降價,都可以得到更多的利潤,因此甲一定會降價。 奈許均衡是建立在參與者同時行動的前提上,也就是靜態賽局。 但現實社會中,不論企業或個人決策都有先後之分。 例如參與者的心理與人格特質、當時的社會與賽局產生的環境、參與者面對賽局的認知與情緒、其他影響因素等,這些非理性條件的變數很大,有時候甚至超越了理性條件的組成,在這種時候賽局理論即不成立。

在市場進入博弈中,在給定企業B已經進入的情況下,在位者的“鬥爭”,“高價”策略已不再是最優的,這種“鬥爭”是不可置信的威脅,因為鬥爭的結果是沒有利潤;而合作會帶來50單位利潤。 所以,(進入,高價)不是一個精煉納什均衡。 剔除這個均衡,可以證明,(進入,高價)是唯一的子博弈精煉納什均衡。 人們在做決策的時候真的只會在乎自己的報酬嗎? 在很多情況下我們發現,人們的實際行為與經濟理論的預測似乎不太相符,但不見得是因為他們沒有極大化自己的效用,而是因為人們的效用跟別人所得到的報酬有關。

子賽局完美均衡: 企业经营计划与预算管理

澤爾騰則在60年代中期將納什均衡概念引入動態分析。 子賽局完美均衡 在1965年發表《需求減少條件下寡頭壟斷模型的對策論描述》一文,提出了“子博弈精煉納什均衡”的概念,又稱“子對策完美納什均衡”。 這一研究對納什均衡進行了第一次改進,選擇了更具說服力的均衡點。 子賽局完美均衡 海薩尼在60年代末把不完全信息引入博弈分析。

子賽局完美均衡: 1 Def 模型

其實這是一個很早就被廣泛使用的概念,1913年澤梅羅(E. Zermelo)就曾使用倒推法來證明國際象棋的最優策略解。 臺大位居世界頂尖大學之列,為永久珍藏及向國際展現本校豐碩的研究成果及學術能量,圖書館整合機構典藏(NTUR)與學術庫(AH)不同功能平台,成為臺大學術典藏NTU scholars。 期能整合研究能量、促進交流合作、保存學術產出、推廣研究成果。 即是說:如果資訊集合有多個節點,資訊集合所屬的參與者就不知道能往哪個節點移動。 不過在同一篇論文裡,Daskalakis也指出,在參與者匿名的情況下,則僅需多項式時間即可逼近納許均衡。

子賽局完美均衡: 工具

題目 2 (是非題), 子賽局完美均衡一般是動態賽局納許均衡的子集合,較納許均衡更精煉,特別是均衡太多的時候,子賽局完美均衡可以帶來更多的預測能力。 用逆向歸納法求解子博弈精煉納什均衡;承諾行動與子博弈精煉納什均衡;逆向歸納法與子博弈精煉均衡存在的問題。 由於剔除了不可置信的威脅,在許多情況下,精煉納什均衡也就縮小了納什均衡的個數。 跳到 例子 – 假設一收益矩陣表示如右(為一協調賽局)。

所以,1994 年另一位諾貝爾經濟學獎的約翰. 海薩尼(John Harsanyi)為了分析不完全訊息之下的非合作賽局理論,提出「貝氏奈許均衡(Bayesian-Nash equilibrium)」。 當某個組合是奈許均衡時,任何一個參賽者單獨改變自己的策略,並不會使自己的報酬提高。 從前面的故事來說,囚犯困境便是奈許均衡。 也是因為有了這個定理,討論均衡才有意義,奈許均衡才成為不合作賽局的理論基礎,獲頒 1994 年諾貝爾經濟學獎。 從表2可以知道,該博弈有兩個納什均衡,即(A開發,B不開發)和(A不開發,B開發),我們無法確定是開發商A選擇開發,開發商B選擇不開發,還是恰恰相反的結果。

Similar Posts