为什么:关于因果关系的新科学|周末读书
内容简介 在本书中,人工智能领域的权威专家朱迪亚·珀尔及其同事领导的因果关系革命突破多年的迷雾,厘清了知识的本质,确立了因果关系研究在科学探索中的核心地位。 而因果关系科学真正重要的应用则体现在人工智能领域。作者在本书中回答的核心问题是:如何让智能机器像人一样思考?换言之,“强人工智能”可以实现吗?借助因果关系之梯的三个层级逐步深入地揭示因果推理的本质,并据此构建出相应的自动化处理工具和数学分析范式,作者给出了一个肯定的答案。 作者认为,今天为我们所熟知的大部分机器学习技术,都建基于相关关系,而非因果关系。要实现强人工智能,乃至将智能机器转变为具有道德意识的有机体,我们就必须让机器学会问“为什么”,也就是要让机器学会因果推理,理解因果关系。或许,这正是我们能对准备接管我们未来生活的智能机器所做的最有意义的工作。 作者简介 朱迪亚·珀尓(Judea Pearl),现加州大学洛杉矶分校计算机科学教授,“贝叶斯网络”之父,2011年因创立因果推理演算法获得图灵奖,同时也是美国国家科学院院士,IEEE智能系统名人堂第一批10位入选者之一。目前已出版3部关于因果关系科学的经典著作,分别为《启发法》(1984)、《智能系统中的概率推理》(1988)和《因果论:模型、论证、推理》(2009)。曾获得过多项科学荣誉,包括认知科学领域的鲁梅哈特奖、物理学及技术领域的富兰克林奖章以及科学哲学领域的拉卡托斯奖。 达纳·麦肯齐(Dana Mackenzie),普林斯顿大学数学博士,自由科学记者,知名科普作家,著有《无言的宇宙》等作品,其学术论文多次收录于《科学》《新科学家》《科学美国》《探索》等重量级期刊。 目录 导 言 思维胜于数据 第一章 因果关系之梯 第二章 从海盗到豚鼠:因果推断的起源 第三章 从证据到因:当贝叶斯牧师遇见福尔摩斯先生 第四章 混杂和去混杂:或者,消灭潜伏变量 第五章 烟雾缭绕的争论:消除迷雾,澄清事实 第六章 大量的悖论! 第七章 超越调整:征服干预之峰 第八章 反事实:挖掘关于假如的世界 第九章 中介:寻找隐藏的作用机制 第十章 大数据,人工智能和大问题 思维胜于数据 每一门蒸蒸日上的科学都是在其符号系统的基础上繁荣发展起来的。 —— 奥古斯都·德·摩根(1864) 本书将要讲述的故事会围绕一门科学展开,这门科学改变了我们区分事实与虚构的方式,但目前,它仍处于大众的视野之外。这门新科学非常重要,其已经影响到了人们日常生活种种重要的方面,并且还有可能进一步扩大影响范围,覆盖从新药开发到经济政策制定,从教育和机器技术人到全球变暖等重大问题的探索和解决。值得注意的是,尽管这些问题涉猎的领域广泛多元并且完全不具可比性,但这门新科学仍然成功将它们全部纳入一个统一的框架,这在20年前是根本不可能实现的。 这门新科学并没有一个时髦的名字,和我的许多同事一样,我简单地称之为“因果推断”。它本身也并不是什么高科技。因果推断力图模拟的理想技术就存在于我们人类自身的意识之中。数万年前,人类开始意识到某些事会导致其他事的发生,并且改变前者就会导致后者的改变。没有其他物种领悟到了这一点,更别说达到我们所理解的这种程度。由这一发现,人类这一物种创造出了有组织的社会,继而又建立了乡村和城镇,直至创建了我们今天所享有的科技文明。所有这一切都源于我们的祖先提出了这样一个简单的问题:为什么? 因果推断正是关于这个问题的严肃思考。它假设人类大脑是大自然有史以来为处理因果知识而设计出的最先进的工具。我们的大脑存储了海量的因果知识,而在数据的辅助下,我们可以利用这些知识解决当代社会所面临的最紧迫的问题。一个更宏伟的目标是,一旦我们真正理解了因果思维背后的逻辑,我们就可以在现代计算机上模拟它,进而创造出一个“人工科学家”。这个智能机器人将会为我们发现未知的现象,解开悬而未决的科学之谜,设计新的实验,并不断从环境中提取更多的因果知识。 但在冒险推测未来发展之前,了解迄今为止因果推断这门科学所取得的成就至关重要。我们将深入探讨它是如何改变了几乎所有依赖数据信息的学科中研究者的思维模式,以及它将如何改变我们的生活。 过去的25年,我有幸成为参与这一科学发展进程中的一员。在公众的视野之外,我曾目睹过它在学生宿舍和研究实验室中崭露头角,也曾听到过在严肃的科学会议中它的突破性进展所引发的共鸣。眼下,随着我们进入强人工智能(AI)时代,越来越多的人开始宣传大数据和深度学习的无尽可能性,这使我越发感觉到,向读者展示这门新科学正在进行的大胆探索,其对于数据科学以及人类在21世纪的生活所可能造成的诸多影响是恰逢其时且激动人心的。 随着人类求知欲的不断增强,以及社会现实开始要求人们讨论在复杂的法律、商业、医疗和决策情境中出现的因果问题,我们终于发现我们缺少一门成熟的科学所应提供的用于回答这些问题的工具和原理。 具有讽刺意味的是,对因果关系理论的需求是在统计学产生的那一刻浮出水面的。事实上,现代统计学的创立正源自因果问题——高尔顿和皮尔逊提出了一个关于遗传的因果问题,并独具匠心地尝试用跨代数据来解答它。遗憾的是,这一努力失败了,他们没有停下来去问为什么,反而声称这些问题是禁区,转而去发展另一项刚刚兴起、不涉及因果关系的事业——统计学。 因果革命不是在真空中产生的;它背后有数学工具上的发展作为支撑,这种数学工具最恰当的名称应该是“因果关系演算法”。借助这种工具,我们得以解答出一些有关因果关系最棘手的问题。能向公众展示这一演算法实在令我兴奋不已,这不仅是因为它拥有跌宕起伏的发展史,更是因为我真心期待未来某天它能在某些人那里发挥出超越我的想象的潜力……也许就出自本书读者之手。 因果关系演算法由两种语言组成:其一为因果图(causal diagrams),用以表达我们已知的事物,其二为类似代数的符号语言,用以表达我们想知道的事物。因果图是由简单的点和箭头组成的图,它们能被用于概括现有的某些科学知识。点代表了我们目标量,我们称之为“变量”,箭头代表这些变量之间已知或疑似存在的因果关系,即哪个变量“听从于”哪个变量。这些因果图非常容易绘制、理解和使用,读者将在书中看到许多此类因果图的示例。这么说吧,如果你会使用基于单向街道地图的导航系统,你就一定可以理解因果图,继而也就可以独自解决本书导言中提出的那些关于因果关系的问题。 虽然因果图是本书选择使用的主要工具,但它并不是唯一可用的因果模型。有些科学家(比如计量经济学家)喜欢使用数学方程;另一些研究者则更倾向于借助一组假设来描述问题,这些假设表象化地概括了因果图的关系结构。但不管使用哪种语言,因果模型都应该描述,哪怕是定性地描述数据的生成过程,换句话说就是那些在环境中控制并塑造数据生成的因果力量。 经典统计学只关注总结数据,因此它甚至无法提供一种语言用以提出上面那个问题。因果推断则不仅提供了一种表达符号,更重要的是,它还提供了一种解决方案。这使得我们在预测干预效果时,在多数情况下能够借助一种算法来模拟人类的回顾性思考,通过将我们对观测世界的了解输入算法系统,其将输出有关反事实世界的答案。可以说,这种“反事实的算法化”正是因果革命另一项宝贵的成果。 反事实推理涉及假设分析(what-ifs),这可能会使一些读者质疑其科学性。事实上,经验观察永远无法证实或反驳这些问题的答案。然而,人类的心智一直在对哪些事可能发生或哪些事可能已经发生做出极可靠的、可重复的判断。例如,我们都明白,即使某天早晨公鸡没有打鸣,太阳也会照常升起。这一共识源于这样一种事实:反事实并非异想天开之物,而是反映了现实世界运行模式的特有结构。共享同一因果模型的两个人也将共享所有的反事实判断。 反事实是道德行为和科学思想的基石。反事实的算法化使“思维机器”(thinking machine)有可能习得这种人类特有的能力,并掌握这种目前仍为人类所独有的思考世界的方式。 提到“思维机器”这个词是我有意而为的。我是以一名浸淫人工智能领域多年的计算机科学家的身份涉足这门新科学的,我的研究背景使我在进行因果推断方面的研究时能够使用一种该领域的大多数研究同仁所并不具备的视角。 首先,在人工智能的世界里,只有当你能够教会机器人理解某个课题时,你才算真正理解了它。这就是为何你会在本书中看到我反复强调符号、语言、词汇和语法。我痴迷于这样的思考:是否可以用一种业已存在的语言来表达某个论断,以及我们如何判断一个论断是否与其他一些论断是相一致的。我们可以看到,仅仅是遵循科学语言的语法进行话语实践就能让我们掌握大量的知识,这实在令人惊喜。我对语言的强调也源于一个坚定的信念,即语言会塑造我们的思想。你无法回答一个你提不出来的问题,你也不能提出一个你用语言无法描述的问题。作为一名哲学和计算机科学的学生,我之所以被因果推断吸引,最关键的因素就是渴望获得那种目睹一门被边缘化的科学语言促使一门科学从诞生走向成熟这一整个过程所带来的兴奋感。 我在机器学习方面的背景也给了我研究因果关系的另一个动力。20世纪80年代末,我意识到智能机器缺乏对因果关系的理解,这也许是妨碍它们发展出相当于人类水平的智能的最大障碍。我将回到我的老本行,带领大家一起探索因果革命对人工智能的影响。我坚信强人工智能是一个可实现的目标,也是一个完全无须恐惧的目标,因为我们在实现它的过程中纳入了因果关系。因果推理模块将使智能机器有能力反思它们的错误,找到其软件程序中的弱点,让它像一个道德实体那样思考和行动,并自然地与人类交流它们自己的选择和意图。
抱团交流
一个集大神卖家与逗趣同行于一体的交流群,扫码添加客服微信(备注“进群”哦)。

目前100000+人已关注加入我们












文章为作者独立观点,不代表AMZ520立场。如有侵权,请联系我们。