论文精选 | AI学习也要先定个小目标，让人工智能具有社会意识——《具有社会意识的多智能体学习：面向社会最优解》

应用场景导读：多智能体系统，例如移动传感器、无人运载器等，作为分布式人工智能研究的一个重要分支，由于其具有较强的容错性、鲁棒性和可扩展性等优点，被广泛地应用于军事、工农业生产、医学、交通、服务等各个领域。多智能体系统是由多个具有计算和移动能力的智能体所组成的集合，其中每个智能体是一个物理的或抽象的实体，能作用于自身和环境，并与其它智能体通讯。

标题：

具有社会意识的多智能体学习：面向社会最优解

摘要：

在多智能体系统中，学习能力对每个智能体来说至关重要，这关乎其在动态环境中面对未知对手时如何正常反应。从系统设计者的角度说，非常希望智能体能学会面向社会最优解的协作，同时避免被自私的对手利用。为此，我们提出一种新颖的梯度提升算法(SA-IGA)，通过将社会意识纳入策略更新过程来加强基本的梯度提升算法。我们从理论上分析了基于动态系统理论的SA-IGA的学习动态，并且SA-IGA在包括对称游戏的众多游戏中都有线性动态。对两个代表游戏(“囚徒困境”游戏和协调游戏)的学习动态进行了详细分析。在SA-IGA概念的基础上，我们进一步提出一个基于Q学习更新规则的多智能体学习算法，称为SA-PGA。仿真结果表明，SA-PGA智能体相比以前面向有条件联合行动学习者(CJAL)的社会最优准则，可以获得更高的社会福利，并通过纳什均衡解决方案对独立理性对手具有可抗性。

第一作者简介：

李晓红，女，1965年9月出生，工学博士学位，天津大学计算机及信息技术系、教授，博士生导师。计算机学会高级会员，ACM会员、软件工程专委会委员；全国高等学校计算机教育研究会常务理事；天津大学女工委员，学院工会副主席。近年来致力于安全软件工程、可信软件及信息安全领域的研究工作。

计算机学会高级会员，ACM会员、软件工程专委会委员；全国高等学校计算机教育研究会常务理事；国家科技奖励评审专家；教育部学位与研究生教育发展中心学位论文评审、学科建设和评估咨询专家；《计算机学报》、《计算机科学》等杂志审稿专家；软件工程、信息安全相关领域国际期刊、国际会议审稿专家；计算机学院学位委员会委员、学术委员会委员、学科建设委员会成员、教学指导委员会委员兼秘书；学院985专家组成员兼秘书；天津大学女工委员，学院工会副主席。

近年来主持或参与完成国家级、省部级以及横向科研课题近20项，近年来已发表学术论文50余篇，其中学位与研究生教育重要期刊20多篇，国际会议20多篇，被EI检索20多篇, SCI检索6篇。申报国家发明专利20余项，已授权6项。软件著作权4项。专著1部，获省部级科技奖1项。现作为项目负责人主持国家基金重点项目1项（子课题负责人）、国家基金面上项目1项，天津市基础重点项目1项、企业合作项目1项。

via PRICAI 2016

论文原文件下载

雷锋网按: 本文由雷锋网(公众号：雷锋网)独家编译，未经许可禁止转载！

本文作者：陈杨英杰

本文转自雷锋网禁止二次转载，原文链接

时间： 2024-10-31 17:22:36

论文精选 | AI学习也要先定个小目标，让人工智能具有社会意识——《具有社会意识的多智能体学习：面向社会最优解》

论文精选 | AI学习也要先定个小目标，让人工智能具有社会意识——《具有社会意识的多智能体学习：面向社会最优解》的相关文章

想成为数据中心专家得先定个小目标

环境也能强化学习，智能体要找不着北了，UCL汪军团队提出环境设计的新方法

深度强化学习、GAN与多巴胺对撞：阿里“AI 智能体”认知研讨会干货

对于AI+教育的重点问题，这3位人工智能专家有话说

《Lua游戏AI开发指南》一2.10　智能体的属性

寒武纪3款AI处理器齐发，陈天石3年小目标：占领10亿智能AI终端；占领中国AI云端高性能芯片1/3

深度增强学习实践：让Python小程序玩一款游戏，来训练神经网络

目标检测101：一文带你读懂深度学习框架下的目标检测

专访 Jordan 高徒 Percy Liang：如何开发连续学习的智能体