4年前

相信很多人都看过《美丽心灵》这部经典影片。这部影片的主人公就是诺贝尔经济学奖获得者约翰·纳什。
当地时间5月23日,诺贝尔经济学奖和阿贝尔数学奖获得者、唯一被拍成电影的诺奖得主,普林斯顿大学数学教授约翰·纳什,与妻子在美国新泽西州遭遇车祸,不幸身亡,终年86岁。
在学术界看来,纳什可说是学术上的天才,但却有着悲剧的人生。无论是“纳什均衡”还是现代经济学中的博弈论,进入中国也就短短20年左右的时间。在学者们看来,“纳什均衡”为我们理解经济现象、社会现象等,创造了全新的研究方法;理解纳什均衡,学会运用博弈论分析社会问题,或许是我们纪念这位学术天才的最好方式。
在影片的一个经典场景中,纳什说到 “当团队中的每个人都为自己和团队做最好的事时,最好的结果就会到来。” 很多人把这个认为是对著名的纳什均衡的描述,其实这句话刻画的是帕累托最优。
博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
基本要素:
参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
参与博弈的每一个人都知道其他参与者都与他同样理智且掌握同样的知识、理解整个游戏,同时都追求利益最大化且了解他人也是如此。简单来说就是每个人都是利己的且追求利益最大化的。
Game(游戏): 在泛化的场景中,游戏包含了一些参与者、行为和策略以及最终收益。例如拍卖、棋类、政治等。
Players(参与者):是指参与到游戏中的具有理智的实体。例如拍卖会上的竞价者、玩剪刀-石头-布的玩家、参加竞选的政客。
Payoff(收益):收益也可以称为奖励,是玩家在参与游戏中会得到的一个结果,可以为正也可以为负。
对称博弈统治 AI 世界,其中大多数基于 20 世纪最著名的数学理论之一:纳什均衡。纳什均衡以美国数学家 John Forbes Nash 命名。本质上,纳什均衡描述了这样的场景:每个玩家选择一个策略,当一个玩家不改变策略时,没有玩家能从改变策略中获益。
数学定义: 在博弈G={S1,…,Sn:u1,…,un}中,如果由各个博弈方的各一个策略组成的某个策略组合(s1,…,sn)中,任一博弈方i的策略si,都是对其余博弈方策略的组合(s1,…si-1,si+1,…,sn)的最佳对策,也即ui(s1,…si-1,si,si+1,…,sn)≥ui s1,…si-1,sij,si+1,…,sn)对任意sij∈Si都成立,则称(s1,…,sn*)为G的一个纳什均衡。