博弈论学习笔记1

1.有关囚徒困境与博弈标准式

两个犯罪嫌疑人被捕并受到指控，但除非至少一个人招认犯罪，警方并无充足证据将其按罪判刑。警方把他们关入不同牢室，并对他们说明不同行动带来的后果。如果两人都不坦白，将均被判为轻度犯罪，入狱一个月；如果双方都坦白招认，都将被判入狱6个月；最后，如果一人招认而另一人拒不坦白，招认的一方将马上获释，而另一人将判入狱9个月——所犯罪行6个月，干扰司法加判3个月。

囚徒困境可以用下面的 双变量矩阵表 来表示


		囚徒1	囚徒1
		不坦白	坦白
囚徒2	不坦白	(-1, -1)	(0,-9)
囚徒2	坦白	(-9, 0)	(-6,-6)

其中囚徒1的后果在前面，囚徒2的后果在后面

博弈论标准式

博弈论标准式的表述包含:

博弈的参与者
每一参与者可供选择的战略集
针对所有参与者可供原则的战略组合

经过一系列复杂的定义得到

在一个n人博弈的标准式表述中,参与者的战略空间为 $S_1,...,S_n$ 收益函数为 $u_1,...,u_n$ 我们用

G = \{S_1,...,S_n;u_1,...,u_n\}

表示此博弈

严格劣战略

在囚徒困境中，对于囚徒i来说，沉默相比招认是劣战略——对囚徒j可以选择的每一战略，囚徒i选择沉默的收益都低于选择招认的收益。

由此可推导出:

在标准式的博弈 $G = S_1,...,S_n;u_1,...,u_n$ 中，令 $S_i^{'}$ 和 $S_i^"$ 代表参与者i的两个可行战略（即 $s^{'}_i$ 和 $s^"_i$ ；是 $S_i$ 中的元素）.如果对其他参与者每一个可能的战略组合,i选择 $s^{'}_i$ 的收益都小于其选择 $s^"_i$ 的收益，则称战略 $s^{'}_i$ 相对于战略 $s^"_i$ 是严格劣战略：

u_i (s_1,...,S_{i-1},s^{'}_i,s_{i+1},...,S_n) < u_i (s_1,...,s_{i-1},s^{"}_i,s_{i+1},...,S_n)

对其他参与者在其战略空间 $S_1，…，S_{i-1}，S_{i+1}，…，S_n$ 中每一组可能的战略 $（s_1，…，S_{i-1}，s_{i+1}，…，s_n）$ 都成立。

也就是说严格劣战略基本上就是最劣解

理性的参与者不会选择严格劣战略，因为他（对其他人选择的战略）无法作出这样的推断，使这一战略成为他的最优反应。这样，在囚徒的困境中，一个理性的参与人会选择招认，于是（招认，招认）就成为两个理性参与者的结果，尽管（招认，招认）带给双方的福利都比（沉默，沉默）要低。


		参与人1
		不坦白	坦白
参与人2	不坦白	(-1, -1)	(0,-9)
	坦白	(-9, 0)	(-6,-6)

纳什均衡

每一参与者要选择的战略必须是针对其他参与者选择战略的最优反应，这种理论推测结果可以叫做“战略稳定”或“自动实施”的，我们把这一状态称为纳什均衡。

定义在n个参与者标准式博弈 $G=\left\{S_1，…，S_n；u_1，…，u_n\right\}$ 中，如果战略组合满足对每一参与者i，是（至少不劣于）他针对其他n-1个参与者所选战略的最优反应战略，则称战略组合是该博弈的一个纳什均衡即

u_i (s_1^*,...,s_{i-1}^*,s_i^*,s_{i+1}^*,...,s_n^*) \ge u_i (s_1^*,...,s_{i-1}^*,s_i,s_{i+1}^*,...,s_n^*)

对所有 $S_i$ 中的 $s_i$ 都成立,也就是说 $s_i^*$ 是以下最优化问题的解:

\max_{s_i \in S_i} u_i \left\{ s_1^*,...,s_{i-1}^*,s_i,s_{i+1}^*,...,s_n^* \right\}

设想有一标准式博弈 $G=\left\{S_i,...,S_n;u_i,...,u_n\right\}$ ,博弈论为它提供的解为战略组合 $\left\{s_1^{'},...,s_n^{'}\right\}$ ,如果这个战略组合不是G的纳什均衡,就意味着存在一些参与者i, $s_i^{'}$ 不是针对 $\left\{s_1^{'},...,s_{i-1}^{'},s_{i+1}^{'},...,s_n\right\}$ 的最优反应战略

即 $S_i$ 中存在 $S_i^"$ ,使得

u_i(s_i^{'},...,s_{i-1}^{'},s_i^{'},s_{i+1}^{'},...,s_n^{'}) \lt u_i(s_i^{'},...,S_{i-1}^{'},s_i^{"},S_{i+1}^{'},...,S_n^{'})

通俗地讲就是不是最优解,推翻了纳什平衡

古诺双头垄断模型

令 $q_1$ 、 $q_2$ 分别表述企业1、2生产的同质产品的产量，市场中该产品的总供给 $Q=q_1+q_2$ ，令 $P(Q)=a-Q$ 表示市场出清时的价格（更为精确一些的表述为： $Q \lt a时，P(Q)=a-Q;Q \gt a时,P(Q)=0）$ 。设企业i生产 $q_i$ 的总成本 $C_i(q_i)=cq_i$ ，即企业不存在固定成本，且生产每单位产品的边际成本为常数 $c$ ，这里我们假定 $c \lt a$ 。根据古诺的假定，两个企业同时进行产量决策

出清: 是一个经济学概念，指的是市场上的供求达到均衡状态，即需求等于供给。
边际成本: 边际成本指的是每新增一单位生产的产品（或者购买的产品）带来的总成本的增量。

根据博弈的标准式,有:

两个垄断企业是参与人
企业可以选择的战略是产品产量,即 $S_i=[0,\infty )$
企业的收益 $u_i(s_i,s_j)$ 可写为:

\pi_i(q_i,q_j)=q_i[p(q_i+q_j) - c]=q_i[a-(q_i+q_j)-c]

在古诺的双头垄断模型中,上述条件可具体表述为: 一堆产出组合 $(q_1^*,q_2^*)$ 若为纳什均衡,对每一个企业 $i$ , $q_i^*$ 应为下面最大化问题的最优解:

\max_{0 \le q_i \le \infty} \pi_i(q_i,q_j^*) = \max_{0 \le q_i \le \infty} q_i[a-(q_i+q_j^*)-c]

设 $q_j \lt a-c$ ,企业 $i$ 最优化问题的一阶条件既是必要条件,又是充分条件;其解为:

q_i = \frac{1}{2}(a-q_j^*-c)

如果产量组合 $(q_1^*,q_2^*)$ 要成为纳什均衡,则企业的产量必须满足:

q_1^* = \frac{1}{2}(a-q_2^*-c)

且

q_2^* = \frac{1}{2}(a-q_1^*-c)

解这一对方程组可得 $q_1^*=q_2^*=\frac{a-c}{3}$

也可以使用图形求解

R_2(q_1) = \frac{1}{2}(a-q_1-c)

类似地，如果 $q_2 \lt a-c$ ，则企业1的最优反应为

R_1(q_2) = \frac{1}{2}(a-q_2-c)

图形求解