博弈论(Game theory)又叫决策论或者对策论,是研究决策者在竞争情况下进行策略选择的数学理论,起源于对赌博、棋和扑克等一类游戏的数学研究。
随着增强学习对于个体针对陌生环境认知过程的模拟,博弈论占据了越发重要的地位。这么说吧,每一次一个个体(可能是你,正在阅读本文的你),和周围环境交互的时候,就是一次博弈。你对环境有个预期,然后向环境搜集结果,和预期对比,计算你的收益。然后,你的行为收敛到“更加正确的认知”。
来自
东南大学、西安交大、合肥工业大学 的教授学者分别作了主题报告。会议结束本站会全面介绍主办方。
01 应用探索
第一,智慧物流。
“智慧物流”最早是由IBM提出,2009年12月中国物流技术协会信息中心、华夏物联网、《物流技术与应用》编辑部联合提出相关概念。
目前,智慧物流还没有统一的定义,它通常被认为是一种利用智能技术对物流活动进行更为智能和高效的规划,管理和控制的新方式。
智慧物流可以理解为在物流系统中采用物联网、大数据、云计算和人工智能等先进技术,使得整个物流系统运作如同在人的大脑指挥下一般智能、实时收集并处理信息,做出最优决策、实现最优布局,物流系统中各组成单元能实现高质量、高效率、低成本地分工、协同、合作。
智慧物流具有以下三大特征:
(1)信息交互与共享;
(2)智能决策与执行;
(3)深度协同与一体化。
博弈论用来解决优化问题。
第二,网络设备关断。
解决网络连接问题的方法包括检查物理连接与设备状态、更新网络适配器驱动、调整电源管理设置、禁用节能模式、更改 DNS 服务器、检查路由器设置以及排查干扰源,涵盖多种常见情况。
决定网络中哪一台设备需要立刻关断,会用到博弈论。例如,用户和设备可以模拟成博弈论模型。
第三,智慧交通。
为了使得道路资源更加有效地被使用,车辆和信号灯可以看作一对博弈的双方。加上若干个关键指标,例如,红绿灯的等待时间,每分钟某路口汽车数量等等。
第四,群智博弈解决电网分配
这个模型在解决问题的时候,分阶段进行,每个阶段模拟博弈双方,最后计算收益,使得收益最大化的决策。
采用 Model-Free 是增强学习,设计 Q 函数,简言之,Q 函数是衡量个体对环境采取行动之后的效用,该函数是迭代的。
第五,货拉拉这类拉货平台。
用博弈模型描述发货货主、派单平台和货车司机之间的关系,属于非合作类型的,最后找到一个最优解,能使得三方(或者至少是平台)利益最大化。
02 大语言模型涉及的学科
例如,基于模型的系统工程、生物学(例如,基于对动物视觉皮层研究)、认知科学、注意力机制、行为科学、数理计算科学、优化理论、决策科学,都是我们现在要投资开发 LLMs 所涉及的领域。主讲人介绍,大语言模型的架构分成模型架构、功能架构、依赖关系架构,三个层次。例如,Transformer 就属于一种结构。注意,这些都是演讲者的观点。
参考文献
[1] 物流琅琊阁(2023),一文讲透智慧物流定义、内涵及技术实践,知乎,2023
[2] 是山河呀(2025),网络连接频繁断开,如何解决?,腾讯网,2025
[3] 生活小事天天见(2025),CSCO神经肿瘤专家委员会2025年换届工作会议顺利举行,秦智勇教授当选第三届主任委员,搜狐,2025
[4] 认知(2023),博弈论,知乎,2023