首页 >> 计算机科学 >> 文章

译者:DLM (Miller),Mr. YXD 也有贡献于此译文

翻译组合介绍:DLM, 80后业余科学小野人,流连 New Scientist, National GeographyEconomist,接收杂七杂八的信息。失业期间偶遇松鼠会小红猪,便想停下来学着剥一下“果壳”。Mr. YX D,来自火星的地球科学怪人。

校对:苏椰

小红花等级:3朵

原文地址:I, algorithm: A new dawn for artificial intelligence

--从核弹到早产婴儿,人工智能技术已经最终成为足够可靠的监视一切的手段。

在一个有血有肉的医生和一个人工智能系统之间,两者选择其一来作出疾病诊断,佩德罗·多明戈斯更乐意把自己的生命押注到人工智能系统上。佩德罗·多明戈斯是西雅图华盛顿大学的一名计算机科学家,“我宁愿相信机器也不要相信医生,”他说。考虑到人工智能(AI)通常获得的差劲口碑——过度炒作,乏善可陈——如此强烈的支持声音确实鲜见。

回到二十世纪六十年代,AI系统在复制人脑的某些关键方面似乎大有前途。通过使用数理逻辑,科学家开始重现和推理现实世界的知识,但是,很快这种方法沦为AI的枷锁。尽管数理逻辑在模拟人脑(解决问题)方面富有成效,但是它在本质上并不适合处理不确定性。

然而经过因自我枷锁造成的漫长封杀之后,AI这个广受诟病的领域却重新兴盛起来。多明戈斯并非唯一对其抱有全新信心的科学家。研究者希望通过成熟的电脑系统来检测婴儿疾病,把口头语言翻译成文本,甚至是找出恶意核爆。这些由成熟的电脑系统展现出来的早期能力就是最初在AI界引起人们广泛兴趣的东西:即使在纷繁复杂的世界,电脑仍具有像人类一样的推理能力。

处于AI复兴核心的是一种叫概率性程序的技术,它在旧有AI的逻辑基础上加入统计概率的应用。“它是两种最强大的理论的自然统一,这两种理论已经被发展来理解和推导这个世界。”史都华·罗素说,他是加州大学伯克利校区现代人工智能方面的先驱。这套强大的综合体终于开始驱散笼罩在AI漫长严冬上的迷雾。“这肯定会是一个(AI的)春天。”麻省理工学院的认知科学家约什·田纳邦说。

“人工智能(artificial intelligence)”一词于1956年由MIT的约翰·麦卡锡创造。那时,他提倡使用逻辑语言开发能进行推理的电脑系统。该方法随着所谓的一阶逻辑的应用趋于成熟。在一阶逻辑中,现实世界的知识通过使用正式的数学运算符号和标记进行模化。它为客观体世界和客观体间相互关系而设,能够用来解析他们之间的联系并得出有用的结论。例如,如果X(某人)患有高传染性的疾病Y,患者X与某人Z近距离接触,那么用这种逻辑便可推导Z患有Y疾病。

然而,一阶逻辑最大的功劳是它允许越来越复杂的模型由最小的结构模块构建起来。例如,上述情况可以轻易地延伸到建立流行病学的致死传染病模型,以及对其发展进行结论性推导。这种把微小概念不断扩展成概念集合的逻辑功能意味着人类大脑中也存在类似的思维模式。

这个好消息并没有存在得太久。“不幸的是,最终,逻辑没能实现我们的期待。”加州斯坦福大学的认知科学家诺阿·古德曼说。由于使用逻辑来表现知识并进行推理的过程要求我们对现实世界的实际知识有精确的掌握,容不得半点模糊。要么“真”要么“假”,不存在“也许”。而不幸的是,现实世界,几乎每一条规则都充满了不确定性、干扰和例外情况。简单地用一阶逻辑构建的AI系统不能处理这些问题。举例来说,你想分辨某人Z是否有疾病Y,这里的规则是清晰明白的:如果Z与X接触,那么Z患病。但是一阶逻辑不能处理Z在或者已经感染或者没有之下的情况。另一个严重的问题是,一阶逻辑不能逆向推导。例如,如果你知道Z患有疾病Y,你不可能完全确定Z的疾病是从X那里感染的。这是有医学诊断系统面临的典型问题。逻辑规则能够将疾病和症状联系起来,而一个医生面对症状却能逆推出其病因。 “这需要转变逻辑公式,而且演绎逻辑并不适合处理这种问题,”田纳邦说。

这些问题意味着到了二十世纪八十年代中叶,AI的冬天到来了。当时流行的看法是:AI毫无发展可言。然而,古德曼私下相信,人们不会放弃AI,“AI转入地下发展了,”他说。

1980年代末神经网络的到来让AI的解冻露出第一线曙光。神经网络的想法之简单让人惊叹。神经系统科学的发展带来了神经元的简单模型,加上算法的改进,研究者构建了人工神经网络(ANNs)。表面上,它能够像真正的大脑一样学习。受到鼓舞的计算机科学家开始梦想有上百万或者上万亿神经元的ANNs。可是很快地,事实证明我们的神经元模型显然过于简单,研究者都分不清神经元的哪些方面的性质是重要的,更不用说模仿它们了。

不过,神经网络为新的AI领域构筑了一部分基础。一些继续在ANNs上奋斗的研究者终于意识到这些网络可以被认为是在统计和概率方面对外部世界的重现。与“突触”和“动作电位”这些生理学上的称呼不同,他们称之为“参数化”和“随机变量”。田纳邦说,“现在,ANNs听起来更像一个庞大的概率模型而不是一颗大脑。”

然后在1988年,加州大学洛杉矶校区的朱迪亚·珀儿写了一本里程碑式的书《智能系统的或然性推理》,里面详细地描述了AI的全新方案。支持这本书的理论是汤玛斯·贝叶斯提出的一个原理。汤玛斯·贝叶斯 是18世纪的一名英国数学家和牧师,他把以事件Q发生为前提下事件P发生的条件概率和以事件P发生为前提下事件Q发生的条件概率联系起来。这个原理提供了一个在原因和结果间来回推导的方法。“如果你能对感兴趣的不同事物用那样的方式描述,那么贝叶斯推论的数学方法会教你如何通过观察结果,然后逆推各种不同起因的可能性,”田纳邦如是说。

新方案的关键就是贝叶斯网络,一个由各种随机变量组成的模型,在这个模型里每个变量的概率分布都取决于其他变量。给定一个或多个变量的值,通过贝叶斯网络则可推导出其他变量的概率分布,换言之,得出他们的可能值 。假定这些变量表示症状、疾病和检查结果,给出检查结果(一种滤过性病毒感染)和症状(发热和咳嗽),则可给可能潜在的病因赋予不同的几率(流感,很可能;肺炎,不太可能)。

二十世纪九十年代中期,包括罗素在内的研究员开始开发算法,使贝叶斯网络能利用和学习现有的数据。这很大程度上跟人类基于早期理解的学习方式相同,新的算法却能通过更少的数据来学习更复杂和更准确的模型。对ANNs来说,这是前进的一大步,因为无需考虑先验知识,可以从头学习解决新的问题。

搜猎核武器

人们开始逐渐理解各种努力和尝试,去创造为现实世界而设的人工智能。一个贝叶斯网络中,各种参数是概率的分布,如果我们对这个世界知道得越多,这些分布值越有用。与一阶逻辑下构建的网络不同,不完整的知识并不会导致贝叶斯网络迅速崩溃。

尽管这样,逻辑也并非无用武之地。事实证明贝叶斯网络本身并不充分,因为它不允许以简单片段任意构建复杂结构,取而代之的是一个由综合的逻辑程序和贝叶斯网络组成的,进入热门话题领域的概率性程序。

这种新AI的最前端是少数合并基础元素和所有静止研究工具的计算机语言,其中有Church语言,由古德曼、田纳邦和同事开发,以某计算机程序逻辑的开创者阿隆索·丘奇命名。多明戈斯的团队开发了马尔科夫逻辑网络,融合了逻辑型网络和与贝叶斯网络相似的马尔科夫网络。罗素则和他的同事使用了一个直接明了的名字,叫“贝叶斯逻辑”(BLOG).

最近在奥地利维也纳召开的联合国全面禁止核试条约组织(CTBTO)大会上,罗素展示了Church语言的表达能力。CTBTO邀请了罗素,因为他们预感到新的AI技术可能有助于监测核爆炸。听过一上午的关于监测地震背景下远距离核爆引发的地震特征、穿过地球的信号传播异常和世界地震站的噪音探测器的演示报告后,罗素开始着手用概率程序的设计(神经信息处理系统前沿,卷23,麻省理工学院出版Advances in Neural Information Processing Systems, vol 23, MIT Press)。他说,“在午饭时间,我已能为整个问题编写一个完整的模型。”,这个模型足足有半页之长。

这类模型能整合先验知识,例如,对印度尼西亚苏门塔腊和英国伯明翰地区发生地震的几率做比较。CTBTO同时要求任何一个系统首先假定发生在地球上任何地方的核爆几率均等,然后才使用来自CTBTO监测站接收的真实信号数据。AI系统要做的就是获取所有数据,对每组数据最可能的解释作出推断。

挑战就在其中。像BLOG这样的语言是由所谓的通用推理机组成的。已知某个现实问题的模型和众多变量及概率分布,推理机只能计算某种情况的可能性,例如,在已知期望事件的事前几率和新地震数据下,推断一次在中东发生的核爆。但是如果变量改成代表症状和疾病,那么它就必定能做出医学诊断。换言之,其中的算法必须是非常普遍的,这也意味着这些算法极其低效。

结果是,这些算法不得不根据每个新问题逐一定制。但正如罗素所说,你不能每遇到一个新问题就请一个博士学生来改进算法,“那并不是你大脑的工作方式,你的大脑会赶紧适应(新问题)。”

这一点让罗素、田纳邦和其他人缓下来仔细考虑AI的前途。“我希望人们会感到兴奋,但不是那种我们向他们推销蛇油(万灵药)的感觉,”罗素说。田纳邦也有同感,尽管已是一个年过40的科学家,他觉得只有一半的机会在他有生之年见证有效推理这一难题的解决。尽管计算机将运行得更快,算法会改进得更精妙,他觉得“这些是比登月或者登火星更艰深的问题”。

无论如何,AI团体的意志并没有因此消沉。例如,斯坦福大学的达菲·柯勒正在用概率编程解决非常特殊的问题并且颇见成效。他与同在斯坦福的新生儿学专家安娜·潘和其他同事一起开发了名为PhysiScore的系统,可以预测一个早产儿是否有任何健康问题。这是个众所周知的难题,医生不能作出任何确定程度的预测,“这种预测却是对那个家庭唯一要紧事,”潘回应。

PhysiScore系统把多方面的因素考虑进去,诸如孕龄、出生体重,以及出生后数小时内的实时数据,包括心率、呼吸率和氧饱和度(Science Translation Medicine, DOI: 10.1126/scitranslmed.3001304)。“我们能够在头3个小时内得出哪些婴儿将来会健康,哪些可能患上严重的并发症,甚至是两周后会出现的并发症,”柯勒解释道。

“新生儿专家对PhysiScore这个系统感到兴奋,”潘说。作为一名医生,对于AI系统具有处理上百个变量并作出决定的能力,潘尤其满意。这种能力甚至让该系统超越了他们的人类同行。潘说:“这些工具能理解和运用一些我们医生和护士看不到的信号。”

这正是多明戈斯一直对自动化医学诊断抱有信心的原因。其中一个著名例子是“快速医学参考,决策理论(QMR-DT)”,它是一个拥有600种重要疾病和4000种相关症状模型的贝叶斯网络,其目标是根据一些症状推断可能疾病的几率。研究者已经针对特殊疾病的推理算法对QMR-DT进行微调,并且教会该系统使用病人的档案。“人们对这些系统和真人医生做过比较,这些系统似乎更胜一筹,”多明戈斯说,“人类对自己的判断,包括诊断,不能保持一致的观点(态度),而医生们不愿意放弃他们工作中这一有意思的部分是唯一让这些系统不能广泛应用的原因。”

AI领域里的这些技术还有其他成就,其中一个瞩目的例子是语音识别,它已经由过去因经常出错备受嘲笑提升到今天令人惊讶的准确度(New Scientist, 27 April 2006, p26)。现在,医生可以口述病人档案,语音系统软件会把口述档案转换成电子文档,由此可以减少手写处方。另外,语言翻译也开始仿效语音识别系统的成功之处。

会学习的机器

但是仍然有重大的挑战显现在各个领域中。其中之一就是弄明白机器人的照相机看到什么,解决这个问题将为设计出自我导航的机器人缩短一大段距离。

开发灵活和快速的推理算法的同时,研究者必须提高AI系统的学习能力,无论是根据现存数据还是现实世界检测到的新数据。今天,大部分的机器学习是由定制算法和小心地构建的数据组完成的,为教会一个系统处理特定的任务而专门设计。“我们希望那些系统更加通用,这样你可以把它们投入到现实世界,同时它们也能从各种输入信息中学习。”柯勒说。

一如既往,AI的终极目标是建造出能用我们完全理解的方式复制人类智慧的机器。“那可能是和寻找外星生命一样遥远甚至同样危险的事,”田纳邦说。“‘拟人AI’是一个更广义的词,有谦虚的余地。如果我们能构造一个视觉系统,像人类能做到的一样,看一眼就可告诉我们那里有什么,我们将无比高兴。”

安尼尔·安娜索斯娃米是一位《新科学家》的顾问

文字编辑:霍森布鲁斯

0
为您推荐

37 Responses to “[小红猪]算法:人工智能的新曙光”

  1. mpc说道:

    AI 再折腾也解决不了停机问题~不看好基于图灵机的AI

  2. troytt说道:

    果然神经网络出来了=。=

    其实如果把AI作为人脑的补充挺好,又容易实现又实用

  3. Knight说道:

    “和寻找外星生命一样遥远甚至同样危险的事”,一点没错……

  4. Gucci Koo说道:

    AI的终极目标是建造出能用我们完全理解的方式复制人类智慧的机器。
    -----------------------------
    如果能夠人工智慧,那麼上帝造人又有什麼意義呢?

    • hunke说道:

      上帝造人的目的就是“建造出能用我们完全理解的方式复制人类智慧的机器。”

      • 123123说道:

        对啊,看看我们每晚的造人运动浪费太多的资源了

    • 裘德说道:

      我觉得AI的未来倒未必是能通过图灵测试的机器人,反而是通过机器学习和统计知识进行某些智能化识别和控制功能的辅助性智能工具。这些才是最实用的东西。

  5. 细草微风岸说道:

    啥时候出智能npc啊,网游小说yy了这么久了…

  6. viggin说道:

    文章是想介绍从基于符号推理的AI到基于统计的AI的演化么?最近听说米国有人写了一本书《概率图模型》试图结合两种方法的优点

  7. cy说道:

    与wiki上ai的历史大相径庭啊。。
    还有那个voice recognition真的是用贝叶斯这种ai而不是逻辑做出来的么。。?

  8. 科學信仰说道:

    要讓機器人明白照相機里是什麽,個人感覺應該是海量數據庫加一些模式匹配,例如人類看到某個從未見過的不明飛行物也只能認為它是個不明飛行物而已。

  9. SillyDaddy说道:

    不错啊,感觉真正的智能里面或然性是不可或缺的,个人观点。

  10. SillyDaddy说道:

    但总觉得或然性的实质还不清楚,类似量子理论的深层原因?还是复杂性导致的混沌?

  11. 龙在天涯说道:

    是吗?科学永无止境!

  12. jamesr说道:

    自动化医学诊断我三年前就曾经设想过,准确度在保证原始信息的准确的前提下,肯定比医生要高的。但目前的问题是,如何采集到原始信息,这是只有医生才能做的事;如何训练这个AI系统,需要的大量数据也得医生提供,里面有没有重要的偏倚呢?
    更重要的是,系统一旦成形,大量医生将失去头顶的光环,甚至会造成大量失业。

  13. 晴天说道:

    牛人啊,我也觉得AI很有前途

  14. ZKL47说道:

    最神的是IBM预测无大牌球星的法国队是冠军,不知用什么软件。
    贝叶斯统计在近几十年又重新重视,被湮没的原因之一是对概率的基本定义和传统的统计学相悖。比如传统的统计学认为样本是随机变量,总体期望是常量,而贝叶斯统计正相反。摩托罗拉的六西格玛质量管理实践证明,在可控生产状态,总体均值可能飘移1.5个标准差,而传统的统计学假设总体均值是常量。

  15. 小英雄说道:

    当初日本人就是拼命的弄人工智能,成果很小,钱花了不少,这玩意只能玩玩。

  16. 老妖说道:

    我觉得ai作为人类智能的辅助在将来必然发挥极其重要的作用

  17. 泥泥草草说道:

    总觉得人工智能终究只能是做辅助的工具存在,不会代替人。人和人的交流才能提供更多、更可靠的信息。特别是在医学上。人工智能如果要适应人的生存环境以及思维方式,需要随时更新数据库。其工作量太繁琐了。根据X的描述,判断x在得病n天前接触病人y的概率,计算机往往会把情况复杂化。而且不止病人y,还有其他接触过的人有可能携带病毒。等等情况。试想一下你与别人交流时候的情况再模拟成计算机,就知道有多复杂了。我们不可能为每一个人的生存情况和思想状况都做一个数据库。

  18. albertlee说道:

    读完之后下载了文中提到得 Church语言, 发现是用 scheme开发得,而church程序本身也很像scheme的语法,看编译器得源代码很简洁。

  19. AL说道:

    AI随着计算机和传感器的快速发展,必将有一个广阔的发展空间

  20. 山外青山说道:

    我赞同贝也斯网络这个方向。事实上,我认为思考的过程,基本上就是这个网络不断扩展(新知识,新信息加入)震荡(思考,推理),趋于临时稳定(归纳,得出结论)的过程。我本身是做NLP方向的,我个人认为,人类离实现强人工智能已经不远了。我们有生之年就很可能看到。

    冯诺依曼体系的计算机可以模拟并行的网络运算,顶多因为总线结构问题,速度慢点,但是并不会阻碍人工智能算法的进步。

  21. 洛基浊音说道:

    其实人工智能和造人运动有一个共同点:造出来的东西会慢慢不受你控制。可谁说这不是一件令人兴奋的事呢?未来本来是未知的。

  22. lj说道:

    你以为真的是上帝造人啊?

  23. 王磊说道:

    人工智能不必刻意的追求,现在计算机的发展还应该是注重应用,随着应用越来越复杂,计算机需要处理的数据越来越多,计算机的计算速度越来越好,将来会出现一个点,这个点上,计算机的硬件和软件都达到了一定的高度,这时候你会看不出,意见复杂的工作,一个技术上或者艺术上的创意,计算机来做和人类来做,有什么差别,那么人工智能就彻底成为一个有灵魂,彻底拥有自我意识的生命体了。

  24. 呵呵说道:

    。。。强人工智能不远了?
    擦。。。

  25. physicsex说道:

    ai发展还在基础阶段,我感觉需要一个新的思维~

  26. 上帝之手说道:

    罗素方向是错,表达力太弱了, 还是要回到70年代,符号主义道路才行.

  27. versugw www.kuaipu.com.cn说道:

    人工智能的新曙光

  28. 快普 versugw www.kuaipu.com.cn说道:

    企业管理软件

  29. 破晓的余晖说道:

    根据研究表明,人脑在猜测概率的时候,是按着叶贝斯方程来的,叶贝斯方程是人脑的自然思维模式,要想实现人工智能,也要照着这个公式搞。

  30. 那里有人说道:

    图灵机器人已经延伸到智能家居智能穿戴 电信客服 海尔 三星 LG都有合作啊
    http://www.tuling123.com/openapi/cloud/home.jsp

  31. 那里有人说道:

    图灵机器人已经延伸到智能家居智能穿戴 电信客服 海尔 三星 LG都有合作啊

桌面版 | 切换到移动版