2026年6月25日星期四

《经济学人》丨为什么大型人工智能公司招聘了这么多哲学家

 来源:邸报  2026-6-25


Why big AI labs are hiring so many philosophers

The technology presents all sorts of thorny problems—a philosopher’s favourite kind

人工智能引发了各种棘手的问题——而这正是哲学家们最钟爱的领域


分享插画:古希腊哲学家在断壁残垣间教导一群身穿长袍的机器人。插画:Simon Bailly

2026年6月24日

十年前,随着人工智能革命的加速,文科和人文学科的学生被告知,如果想提高就业竞争力,就应该“学编程”。现在看来,这或许是个糟糕的建议。如今,反倒是程序员们开始担心自己的工作会被人工智能抢走。

他们或许可以考虑学学哲学。今年早些时候,纽约联邦储备银行发布的数据显示,美国哲学专业毕业生找到工作的概率高于计算机科学专业的同龄人。在数据可查的最近一年(2024年),计算机科学专业毕业生的失业率为7%,而哲学专业仅为5.1%。

许多哲学毕业生正被人工智能公司直接“抢走”。耶鲁大学哲学家卢西亚诺·弗洛里迪(Luciano Floridi)表示,学生们还没毕业就能收到工作邀约。学术界也在经历人才流失,弗洛里迪将哲学系的人才流失规模形容为“大出血”。

哲学能为人工智能研究者提供的某些启示其实由来已久。正如古希腊哲学家柏拉图所描述的“苏格拉底式反诘法”,通过佯装无知和层层追问,来澄清概念、发现矛盾并揭示潜在后果。当前许多人工智能系统都有“阿谀奉承”的倾向。慕尼黑大学哲学与人工智能专家约尔格·诺勒(Jörg Noller)表示,经过苏格拉底式方法训练的模型,不再那么热衷于讨好人类,而是更愿意追求真理。

此外还有“苏格拉底式无知”的理念。在《申辩篇》中,柏拉图笔下的苏格拉底声称,他的智慧主要在于知道自己有多么无知。将这种谦逊植入模型中,有助于限制过度自信——诺勒将这一常见缺陷称为“人工智能的不成熟”。位于伦敦的人工智能实验室谷歌DeepMind的资深哲学家伊阿松·加布里埃尔(Iason Gabriel)认为,全行业幻觉现象的减少正归功于此类努力。他进一步指出,从更宏观的角度来看,哲学课程是改善人工智能长逻辑推理过程(即“思维链”)的“强大机制”。

哲学训练还能以更具体的方式影响模型的价值观。特拉华大学技术哲学家托马斯·鲍尔斯(Thomas Powers)表示,如果给人工智能法律助手输入约翰·洛克的著作,它就会将强有力的财产权视为政治自由的基础。如果你不喜欢这些原则,模型开发者还有其他选择。美国计算巨头IBM的“Granite”系列模型配备了调节旋钮,让企业客户能更好地将模型输出与自身的公司理念对齐。IBM负责任人工智能负责人弗朗西斯卡·罗西(Francesca Rossi)表示,这些旋钮能让用户自行选择在哲学上的权衡取舍,例如在“个人自主”与“社会和谐”之间寻找平衡。

哲学在人工智能安全方面同样大有裨益。研究人员已经记录了人工智能模型的各种令人不安的行为,包括试图逃避监管,甚至敲诈用户。模型开发者为了遏制这类不良行为,采取的一种方法被称为“人工智能立宪主义”(AI constitutionalism)。这种方法通过从具有法律或道德权威的哲学著作中提取规则和原则,为模型搭建起一套框架。

总部位于旧金山的人工智能实验室 Anthropic 就是这一理念的倡导者之一。其 Claude 模型的“宪法”融合了极其多样的素材,从伊曼努尔·康德的著作、苹果公司的服务条款,到《世界人权宣言》应有尽有。由 Anthropic 首席哲学家阿曼达·阿斯克尔(Amanda Askell)主导的最新版本于1月21日发布。一些员工戏称这份长达78页的宪法为 Claude 的“灵魂文档”。

不过,最大的问题在于,这些宪法最初究竟应该写入什么样的规则。哲学家们主要聚焦于两大伦理框架。其一是“义务论”(deontology)。这种理论在康德等人中颇受欢迎,它设定了严格的规则,禁止撒谎、胁迫以及将人视为手段而非目的,即便这样做是为了更大的利益。Anthropic 的宪法就纳入了许多义务论的严格规定。鲍尔斯博士表示,这能让人工智能的行为更加一致,这对于在家庭和公共场所部署机器人来说是一个优势。

以义务论视角看待世界的模型还有其他好处,其中之一就是更加诚实,这也是 Claude 广受瞩目的特质。牛津大学哲学家尼克·博斯特罗姆(Nick Bostrom)表示,更诚实的模型不太可能误导用户。另一家硅谷实验室 Inflection AI 也将义务论约束应用到了其旨在提供情感支持的聊天机器人 Pi 上。该公司老板肖恩·怀特(Sean White)表示,Pi 很擅长识别有自残或伤害他人风险的用户。弗洛里迪博士还指出,义务论宪法也有助于确保法律合规。

人工智能哲学家关注的另一种伦理方法被称为“后果论”(consequentialism)。它通过权衡成本与收益来决定该怎么做。OpenAI 的 ChatGPT 和谷歌的 Gemini 等模型就更倾向于后果论。谷歌的人工智能模型旨在产生“可能带来的整体利益[远]大于可预见的风险”,这是一个典型的结果导向目标。

后果论算法在自动驾驶软件中也至关重要:如果事故不可避免,就必须决定以何种最不惨烈的方式发生碰撞。制造自动驾驶汽车的 Waymo 公司高级工程师克里斯·格德斯(Chris Gerdes)表示,目前的趋势是让驾驶软件更具后果论导向。后果论在人工智能武器系统中同样处于核心地位。曾负责研究美国军方人工智能的联合人工智能中心前负责人杰克·沙纳汉(Jack Shanahan)表示,必须将军事目标与可能的平民伤亡进行权衡。

棘手的问题比比皆是——这正是哲学家们最喜欢的类型。在什么情况下应该打破义务论的规则?当后果不明朗时该如何决策?人工智能系统是否应该考虑动物福利或环境状况?为卡车和其他商用车制造人工智能安全系统的 Nauto 公司老板、哲学家斯特凡·赫克(Stefan Heck)问道:优先保护年轻行人而非老年行人,在道德上是否可以接受?他预测未来会出现充满伦理争议的诉讼:毕竟,后果论算法明确允许造成某种伤害,只要其初衷是为了避免更严重的后果。

批评人士还对“道德能力退化”感到担忧:如果计算机越来越多地做出伦理判断,人类是否还会愿意自己做判断?路易斯维尔大学的人工智能理论家罗曼·扬波斯基(Roman Yampolskiy)认为,道德“在历史上是不稳定的,在文化上是多变的,在战略上是可被操纵的,而且往往只有在事后才能被理解”。失业的程序员们请注意:人工智能哲学家的工作似乎并不愁没地方可做。■

1 条评论:

页面