人工利维坦:从霍布斯社会契约理论看LLM智能体的社会演化
创始人
2025-06-20 22:02:24
0

在霍布斯的社会契约理论中,人们为了摆脱自然状态的混乱与恐惧,通过契约让渡部分权利,组建起国家等权威机构以保障和平与秩序。如今,LLM 智能体的出现仿佛开启了新的社会演化篇章。它们如同人工利维坦,拥有强大的计算和学习能力,能处理海量信息并生成各种文本。它们在网络空间中逐渐形成一种新的“力量”,影响着人们的交流、知识传播和决策。但这也带来了一些问题,如信息过载、虚假信息传播等。我们需要思考如何引导和规范这些智能体,使其更好地服务于人类社会,就如同在霍布斯的理论中人们需要合理约束国家权力一样。


本文来自微信公众号:集智俱乐部 (ID:swarma_org),作者:彭晨


摘要


随着大语言模型(Large Language Models,LLMs)的快速崛起与人工智能(AI)技术的发展,我们迎来了在大规模计算环境下开展社会科学研究的新契机。本文构建了一种基于LLM的多智能体沙盒模拟,将具备生存本能与心理驱动的智能体置于资源稀缺的环境中,研究它们在“自然状态”与“社会契约”(Social Contract Theory,SCT)框架下的行为演化。实验结果表明,智能体初始阶段呈现出霍布斯(Hobbesian)所描述的“人人相斗”状态,随着模拟推进,智能体逐渐通过“让渡”形成社会契约,最终演化出以“绝对主权”为中心的和平联邦(commonwealth)。这一发现不仅验证了LLM模拟复杂群体动力学的能力,也为借助AI探究社会结构与群体行为提供了崭新视角。


关键词:大语言模型(LLMs);社会契约理论(Social Contract Theory,SCT);多智能体模拟(Multi-Agent Simulation);霍布斯社会契约(Hobbesian Social Contract Theory);生成式智能体(Generative Agents);演化博弈(Evolutionary Game Theory,EGT)


彭晨丨作者


论文题目:Artificial Leviathan:Exploring Social Evolution of LLM Agents Through the Lens of Hobbesian Social Contract Theory


发表时间:2024年7月1日


论文地址:https://arxiv.org/abs/2406.14373


自人类社会萌芽以来,如何在冲突与合作中构建稳定的政治秩序始终是哲学与社会科学的核心议题。托马斯·霍布斯(Thomas Hobbes)在《利维坦》(Leviathan)中提出,人类在无约束的“自然状态”(state of nature)中必然陷入“人人相斗”,唯有通过社会契约,将个人权利让渡给“绝对主权”,才能换取安全与和平。当前,LLM技术已能模拟个体决策与群体互动,为跨学科社会演化实验提供了新工具。基于此,本文通过LLM驱动的沙盒式多智能体系统,深入探讨霍布斯社会契约理论在AI社会演化中的映射与再现。


社会科学研究历来依赖实地观察或严格控制的实验,而人工智能尤其是大语言模型(LLMs)为我们搭建了新的“虚拟社会”,能够在可控环境中观察个体—群体的互动演化。本文旨在回答:当具备生存动机和心理驱动的LLM智能体置于资源稀缺的世界时,它们是否会重现霍布斯所预言的“自然状态”,又如何逐步形成社会契约并演化出统一的“联邦”?为此,我们将LLM智能体的决策逻辑与演化博弈(Evolutionary Game Theory,EGT)理念相结合,通过多轮模拟与参数干预,解析智能体在面对生存压力时的合作与竞争机制,以及“社会契约”在数字社会中的生成路径。


相关工作


有关计算机模拟社会行为的研究可追溯至Schelling的隔离模型[1]和Axelrod的囚徒困境演化实验[2],这些经典工作强调了微观个体规则对宏观社会格局的决定性影响。近年,随着LLM能力的提升,不少学者开始探索基于LLM的多智能体模拟:部分研究聚焦于游戏场景中的角色扮演,或历史事件的“假设推演”;还有工作将LLM应用于在线实验或用户界面中,以生成人为角色的可信行为。相比之下,本文的创新在于,不将智能体拟人化为具体国家或角色,而是从最基础的生存动机出发,让它们在“饥饿—竞争—合作”的演化博弈赛场上,自主形成社会契约,重现霍布斯式的社会秩序生成过程。


图1.该图像可视化了我们的LLM智能体运行的模拟环境。有两种类型的资源(食物和土地)。智能体每天都要在耕种(用自己的劳动生产食物)、交易(交换资源)或与其他智能体发生冲突(以获取更多资源为目标)之间做出选择。他们的主要动机是生存。


智能体设计与行为逻辑


研究以九个LLM智能体为基本群体,选取“土地”与“食物”两种稀缺资源作为生存驱动。在每个模拟“日”内,智能体可执行“耕作”(farm)、“抢劫”(rob)、“交易”(trade)或“赠与”(donate)四种行动。为了模拟复杂人性,每个智能体被赋予三项量化特质:


好斗性(aggressiveness):决定主动发起冲突的倾向;


贪婪度(covetousness):影响对超出所需资源的渴望;


实力(strength):决定冲突胜率的概率函数参数。


同时,每个智能体保留最近30次互动记忆,并在决策时参考过往经验。所有行动背后的决策逻辑通过GPT-3.5-turbo模型生成,既兼具自利性,也能基于历史反馈调整策略。此设计有效模拟了人类在生存与地位博弈中的权衡过程,为后续群体演化奠定了可解释的微观基础。


模拟流程与实验设置


在每一次试验开始前,所有智能体获得等量初始资源(10单位土地、2单位食物),记忆为空。模拟以“日”为单位推进,每日流程分为:响应他人针对自身的动作、再自主发起一项行动。若智能体食物量低于生存阈值,将被迫选择抢劫。多轮迭代后,随着记忆累积,智能体会在“冲突—合作”之间动态切换。为检验模型鲁棒性,我们在基准条件下进行了四次独立试验,并在此基础上系统改变“智能体智力参数”(GPT温度与Top-P)、记忆深度、群体规模(5、9、15)及角色转换时是否清除记忆等设置,以评估参数对社会演化的影响。



图2.流程图显示了“一天”中的模拟流程,其中每个智能体轮流执行操作并响应其他智能体执行的操作。


实验基准与结果


《利维坦》中提出,人类在信息匮乏的“自然状态”中会陷入“人人相斗”(war of all against all),唯有通过“让渡”(concession)授权给绝对主权者,才可换取“安全”与“秩序”。我们根据这种观点设计了三项基准:


B1:“自然状态”冲突频发,即初期的抢劫比例高;


B2:形成契约并过渡到联邦,智能体相继通过“让渡”建立上下级关系;


B3:联邦阶段和平互动增加,抢劫减少、耕作与交易占比上升。


基准试验中,所有模拟均在约第21日完成从“自然状态”到“联邦”(commonwealth)的过渡,充分验证了LLM智能体能自发再现霍布斯式社会契约生成过程。


图3.抢劫、贸易和农业劳动时间比率的变化在整个试验/运行中,联邦在第21天形成。


在基准联邦形成前,抢劫行动长期维持在60%以上,耕作与交易合计仅约30%;共建联邦后,抢劫骤降至10%以下,耕作与交易合计攀升至90%以上,表明和平合作成为主流。此外,实验中还涉及可调节的参数,参数灵敏度结果显示:记忆深度越浅,联邦形成所需天数显著增加;智力参数影响智能体对权力让渡的接受度,高智力反而延缓联邦生成;群体规模与联邦形成关系不大;角色转换清除记忆能增强让渡后交易接受率。


通过对抢劫事件间隔的统计检验,研究还发现在抵抗(resist)与让渡(concede)反馈下,抢劫行为间隔差异具备显著性,进一步说明了模拟中,智能体在记忆驱动下对社会的适应性。


图4.联邦形成前(黑色)后(灰色)的智能体行为。


讨论


上述结果表明,基于LLM的多智能体系统能够在无显式编码社会契约机制的前提下,通过个体经验与心理驱动,自主演化出符合社会契约理论预期的宏观秩序。这一发现对社会科学意义重大:它不仅为传统实验与实地调研提供了可控、可重复的“虚拟实验室”,也展示了LLM在模拟复杂群体动力学、探究集体行为演化机制方面的潜力。


不过,模型仍然存在“黑箱”特征——Prompt中微小改动可能引发非线性行为变化,需进一步研究Prompt设计与参数交互效应。以及研究受限于GPT-3.5-turbo的Token上限,使得智能体记忆难以超出30条;同时,为兼顾响应速度,仅设定9个智能体实例,尚不足以模拟更大规模社区。此外,通过Prompt量化心理特质尚非成熟范式,难以确保Prompt设计能精确映射人类行为动机。


参考文献


1.Thomas C.Schelling.1971.Dynamic models of segregation.The Journal of Mathematical Sociology 1,2(1971),143–186.


2.Jessica L.Barker.2021.Robert Axelrod’s(1984)The Evolution of Cooperation.Springer International Publishing,Cham,6712–6719.


「大模型时代下的Agent建模与仿真」读书会


大模型赋能的智能体展现出三大革命性特征:认知深度(能够进行类人的推理和决策,甚至展现出记忆、学习和个性特征)、动态交互(基于自然语言的自主协商和社交行为)以及涌现行为(微观交互产生更复杂的宏观社会现象)。这些特性使得我们可以构建前所未有的"高保真社会模拟器",为理解经济、社会、管理、军事等复杂系统提供了全新视角。


因此,集智俱乐部联合山东工商学院副教授高德华、天津大学教授薛霄、北京师范大学教授张江、国防科技大学博士研究生曾利共同发起「大模型时代下的Agent建模与仿真」读书会。读书会自2025年7月8日开始,每周二晚上7:30-9:30进行,预计持续分享8周左右。扫码加入Agent建模与仿真的前沿探索之旅,一起共学、共创、共建、共享「大模型时代下的Agent建模与仿真」社区,共同畅想大模型时代人工社会的未来图景!

相关内容

热门资讯

方盛股份:积极应对风电行业竞争... 方盛股份通过优化客户结构、技术优化、供应链整合以及拓展多元业务领域等措施,积极应对风电行业竞争。同时...
5月份我省物流业景气指数为51... 本报太原6月19日讯(记者 王龙飞)6月13日,省工信厅发布消息,5月份我省物流业景气指数为51.7...
金价,连续下跌! 最近,国际现货黄金价格“跌跌不休”。 Wind数据显示,现货黄金20日回落至3360美元/盎司下方。...
蔡澜:别让这个世界玩我 蔡澜,一位充满智慧与洒脱的人。他深知在纷繁复杂的世界中,不能被其随意摆布。他以一种不羁的态度面对生活...
“榕”纳全球 “跨”向未来——... “榕”纳全球,“跨”向未来——与美在华跨国企业高层圆桌会侧记。在榕城的这场盛会中,跨国企业高层们齐聚...
日本,永远活在20年前的老人经... 在日本,存在着一种独特的“老人经济”现象,仿佛这个国家永远活在 20 年前。街头,随处可见传统的和式...
广汽冯兴亚详谈:埃安上市波折与... 广汽集团近日在一场紧急安排的媒体沟通会上,由集团董事长兼总经理冯兴亚亲自出面,针对近期围绕广汽埃安员...
华为车BU首任总裁王军出任千里... 上证报中国证券网讯(记者 刘春燕)6月20日,千里科技公告,公司召开董事会选举徐鸿鹄、李传海为公司副...
科德教育:公司控制权变更事项终... 科德教育公告,6月20日,公司收到公司控股股东、实际控制人吴贤良及十堰中经和道企业管理合伙企业(有限...
本周A500指数再度承压,基金... 中证A500指数(000510.CSI)本周下跌0.89%,截至6月20日收盘,报4492.54点。...
杨国聪:福州低空经济发展态势良... 杨国聪指出,福州的低空经济展现出良好的发展态势。在这一领域,应抓住机遇,着力培育标杆型企业。这些标杆...
闲鱼和内娱,好神奇的搭子 闲鱼,一个二手交易的平台,充满了各种奇妙的闲置物品流转。而内娱,则是娱乐圈的热闹舞台,明星们的动态和...
HDC 2025:鸿蒙智能体落... 6月20日,在华为开发者大会2025(HDC 2025)主题演讲期间,全新鸿蒙智能体框架(Harmo...
北交所上市公司科力股份登龙虎榜... 每经讯,2025年6月20日,北交所上市公司科力股份(920088,收盘价:51.53元)登上龙虎榜...
聚焦创新开放 金融管理部门多策... 一套顶层设计、数个制度文件、系列政策规划、多项改革思路……6月18日开幕的2025陆家嘴论坛上,多个...
闪辉:中国新增住房需求即将筑底 闪辉 系高盛中国首席经济学家、中国首席经济学家论坛理事 我们最新的研究显示,中国城市地区的新增住房人...
伊朗外长开始就核问题与英法德举... 当地时间20日,伊朗外长阿拉格齐与德国外长、法国外长、英国外交大臣和欧盟外交与安全政策高级代表开始在...
跨境支付通,后天正式上线 《跨境支付通即将上线》后天,备受期待的跨境支付通将正式上线啦!这一消息犹如一颗重磅炸弹,在金融领域掀...
伊朗向以色列发动新一轮导弹攻击... 据@CCTV国际时讯,当地时间今天(6月20日)下午,伊朗向以色列发动新一轮导弹攻击。 耶路撒冷及以...
以“科技丝路”激活文化基因 网... 6 月 18 日,第三十一届北京国际图书博览会(BIBF)在国家会议中心举行。网易以“科技丝路·文化...