译者:maltose(很二的糖)(最喜欢的女性地球人是Angelina Jolie,最喜欢的机器人是阿拉蕾,最喜欢的机器宠物是哆啦A梦,最喜欢的外星种族是那美克星人,最喜欢的超级英雄是钢铁侠,Sheldon Cooper是我对现实世界的男生所有美好幻想的集合体,如果你想和我交朋友,可以fellow我的twitter。原文链接:https://songshuhui.net/archives/4405.html)

容易让人上瘾的在线游戏在不知不觉中叩击着你的大脑潜能,与此同时,它还可以解决那些让最强大的计算机也甘拜下风的难题。路易斯•特尼尔报告。

阿瑞思泰德斯是个普通的13岁男孩。放学后打篮球,学习单簧管,到了晚上就坐到电脑前玩游戏。有个游戏让他特别着迷,也让他在同龄人中显得与众不同。每天,他都会用“奶酪”这个昵称登录www.fold.it, 他玩的这个游戏需要弯曲、拉伸和扭动一个有些像大树根系那样的3维结构。通过调节这些扭动的绿色小管儿的长度,他要设法将它们的体积最小化。这看上去不过就是个有点奇怪的游戏——顶多就有些类似3维俄罗斯方块——但实际上,脱去游戏这层鲜艳的外衣,它蕴含着当今生物学家们面临的最大难题之一:蛋白质是如何折叠的?

而阿瑞思泰德斯摆弄的那个3维结构就是通过电脑所呈现的真实蛋白, 比如胶原蛋白分子。不需要知道分子生物学最基本的知识,他一样能够帮助解决现代科学里最棘手的难题之一。这个游戏的发明者,西雅图华盛顿大学的戴维•贝克(David Baker)说道:“在无数多种可能的情况下,要用计算机准确预知一个长蛋白质链是如何用最简洁紧凑的方式折叠,是一个相当困难的问题。

随着蛋白质肽链长度的增加,它可能的折叠方式也指数式地增加。即便是最简单的链条,也需要让一台标准台式计算机花上几个世纪的时间去预测最佳折叠方式。而有了60 000名像阿瑞思泰德斯一样的业余玩家,仅仅运作了六个月的Foldit游戏,就得到几十种蛋白的折叠方式了。

Foldit的成功在于它给一个老观点赋予了聪明的新创意。在过去的十年里,“分布式计算”工程风起云涌,许多大的计算问题被分成小块,通过互联网分发给全球数以百万计的台式电脑,并行地进行数字运算。这些略带冒险性质的尝试中最有历史也最流行的一项就是“地外文明搜索”计划的一部分。SETI@home利用空闲的计算机对来自位于波多黎各的阿雷西博射电天文望远镜收集到的数据进行分析,以寻求外星生命存在的线索。分布式计算如今已运用于多个领域,包括蛋白质折叠,密码暴力破解和气候预测。

大脑召集令

但即使一百万台计算机也不是万能的。在英国伯明翰大学研究人工智能的亚伦•斯洛曼(Aaron Sloman)认为,“尽管在某些问题上,计算机速度迅速准确,在很多任务上,比如视觉处理、空间推理或者问题求解上,他们远远无法超越人脑。”现在看来,分布式计算的观念正在改变。研究者们不再只是利用那些闲置的机器,他们正在设法利用这些“闲置”计算机的主人们大脑的处理能力。

这些源源不断的智力资源看上去不会枯竭。纽约大学的克雷•舍基(Clay Shirky)计算过,仅仅在美国,每个周末,人们把1亿个小时都花在观看电视广告上——而这等同于创造编写250万个维基百科词条的时间。如果将这些闲置的智力中的一小部分用于简单的在线任务,为科研提供帮助,那贡献将是巨大的。

NASA的Clickworkers网站则是最早向在线人群求助的尝试之一。这个在2000年启动的项目,需要志愿者们标记由19世纪70年代 Viking探测器拍摄到的照片上,火星表面的环形山的位置和大小。最近,志愿者们已经在火星侦查卫星传回的超高分辨率图片上,将不同的地形分门别类。将来,等到Dawn太空船探索位于火星与木星之间的小行星带上的两颗最大的天体——灶神星和谷神星的时候,NASA还打算将这些人力资源运用到其传回的照片上。

Clickworkers方法有个大问题,说到底,它是一个没什么乐趣可言的孤立操作。除了那种为一项重要事业而做出贡献的荣誉感,看不出来有什么因素可以吸引赋闲在家的志愿者们。这也是所有涉及到人类协作的关键问题:怎么才能让那些志愿者乐此不疲?

宾州匹兹堡卡内基大学的计算机科学家路易斯•佛南(Luis von Ahn)给出了答案。从2002年起,他就开始推进对那些志愿者资源,也叫“人体计算机”的利用, 其形式远远超越了Clickworkers所进行的早期尝试。

他的秘诀就在于将复杂的问题转化成简单又吸引人的游戏。

他的第一个游戏叫做ESP,他设计的这个游戏列出了一系列单词,游戏者需要将它们同数据库中一系列图片对应起来,游戏目的是帮助训练人工智能系统。为了做到这一点,游戏将匿名玩家配对,并给他们同样的图片。玩家必需试着在最快的时间里猜出他们的搭档会用什么词语来形容图片中的物体,并通过这种方式得分。

现在这个游戏在“有目的的游戏( Game with a Purpose)”网站开放(www.gwap.com),目前该网站已经有120 000名用户,也取得了一些重要的成绩。例如,ESP就给5千万张图片标记了单词,去年得到Google认可,用来帮助改进它的图片搜索引擎。“人们喜欢这个游戏,和自己素未谋面的人合作让他们感觉到了前所未有的默契”,佛南说道。

他最近在做的项目是ReCAPTCHA。ReCAPTCHA利用人脑识别被扭曲图像的能力。在将手抄本数字化时,ReCAPTCHA技术可以被用于识别那些无法被光学文字识别技术识别的文字。呈现给参与者的除了未被识别的文字,还有一个已知单词,这样就可以区分参与者究竟是计算机还是人类。如果正确识别了两个单词,那参与者就证明了自己是真人,从而可以进一步在线注册,协助完成古籍的数字化和保护工作。现在被用于像Facebook和Twitter这样的网站来确认新用户为人类,以防止黑客运用程序自动获得数以百计的帐号,从而非法地散播垃圾邮件。

这个系统已经成功转录了超过10亿个单词,现在正被用于将《纽约时报》130年的存档数字化。在未来,佛南希望用同样的方法来建立历史音频记录的副本。


【图:利用人脑识别被扭曲图像】

然而,利用人来处理图像并不是一个十全十美的方法。运行“星系动物园”的科学家们发现,这其中也会出现一些意料不到的结果。这个项目在2007年启动,集结了160 000名志愿者的力量,以帮助鉴别斯隆数位巡天计划收集到的图片上的一百万个星系。志愿者们被要求将星系按漩涡星系或椭圆星系进行分类,并记录漩涡星系的旋转方向。不需要专家指导,新手们很快就可以投身到这个项目中。

“星系动物园”的研究员想知道,在螺旋形星系的旋转方向上是否存在任何倾向。早先的研究发现星系顺时针或逆时针旋转的差别取决于你所看的天空的位置,这体现了在较大尺度上,宇宙的组织具有不可知性。然而,“星系动物园”的志愿者给出的海量数据显示在可观测的宇宙空间里没有这种趋向。

但是“星系动物园”这个项目还真的发现了当人们在给相同星系进行分类时的一个有趣的倾向。不知为何,人们在给漩涡星系归类的时候,更喜欢将其旋转方向归为逆时针而非顺时针,虽然研究者认为从大体上看这不会对结果造成不良影响;这个倾向实在是太微妙了,只是因为“星系动物园”的志愿者数量太庞大了才显现出来。

不过,这也突显了人类处理的一个顾虑——研究者如何才能保证人类心理上的无意识的嗜好或怪癖不会影响到自己的研究结果?而“星系动物园”中,人们出现倾向的原因尚不得知。“我个人认为,这可能仅仅因为‘逆时针’这个选项的按钮处于中间,” 负责管理“星系动物园”研究结果的凯特•兰德(Kate Land)说道。

“星系动物园”还诞生了另一个出人意料的结果。去年,荷兰学派教师汉尼·范阿克尔(Hanny van Arkel)在一张图片中发现了一个奇怪的天体。这个物体看起来像一小束明亮的绿光,其中没有恒星,也不像任意一个已知的天文现象。如果不是范阿克尔眼尖,这样一种新物体很有可能不会被发现。“人脑非常擅长辨别与众不同的东西,而这种本领很难被作为搜索参数而编程到自动化的视觉归类系统中去。”

“星系动物园”很大程度上依靠的是天文爱好者,而佛南的reCAPTCHAs计划则让网络用户们除了解决谜题之外别无选择,这种新一代的项目想要使普通民众将他们的纯粹用于娱乐的闲暇时光贡献给出来。Foldit就是这类项目中的佼佼者。

Foldit衍生于一项名为Rosetta@home分布式计算项目,该项目也是由贝克运作的。与SETI@home项目的运作方式相同,Rosetta@home利用世界各地空闲的计算机来查找蛋白质的所有可能的折叠结构以找出其中最紧凑的一种。利用该项目的结论,在过去的一年里,贝克的研究小组在《自然》和《科学》杂志上发表了一系列有关蛋白质结构的预测和构思的论文。但是,贝克和他的小组发现Rosetta@home所得到的结果必须经过人工处理,才能作科研之用。如今,贝克想看看Foldit的用户是如何参与游戏以改进Rosetta@home电脑程序的。

维杰辛•潘德(Vijay Pande)是斯坦福大学另一个致力于模拟蛋白折叠的分布式计算的研究者,他的程序名为Folding@home,他担心志愿者给出结果的质量远远达不到计算机所能给出的结果。“折叠蛋白质就像要学好下棋,不过有更多的棋子和更为复杂的规则,因此需要谨慎对待更加大量的可能性组合,”,他认为人们不可能利用好所有的自由度。潘德相信Foldit是一个让那些不是科学家的人了解蛋白质复杂程度的好方法,他说如果人们的最终结果要是和计算机给出的一样好,他会大吃一惊。

贝克当然不会同意。蛋白质的无数种折叠的方式正好是计算机所无法理解的,他说道。像阿瑞思泰德斯这样的玩家证明了有技术的人类是如何准确地将蛋白质进行准确折叠。游戏进行几个月之后,阿瑞思泰德斯从全球60000名玩家中脱颖而出,名列前十,并被邀请加入Foldit的高级组。他展示出了对微妙的力学问题的如此直观的理解,一位Foldit研究员将他称作“Foldit学者”,最近他飞往西雅图,告诉他们自己是如何解决蛋白质难题的。

针对不同人和不同的计算方法的准确度在年末将被展示出来,被称为“蛋白质结构预测技巧的关键性评估”的比赛结果届时将宣布。比赛将通过实验确定的蛋白结构与不同小组使用计算机或人工预测的蛋白质结构进行对比。对Foldit的初步分析显示,其结果的前景很好。“我们已经从这些能与大型计算机相媲美的志愿者中找到了解决方法,有时这些志愿者甚至超过大型计算机,” Foldit的主要研究员,来自华盛顿大学的佐兰•波波维克(Zoran Popovi´c)说道,“我预期,一旦我们将工具精炼,使它更像游戏和人类解谜的过程,人们将能做得更好。”

本月开始,Foldit将衍生出一个新游戏,这个游戏本质上是对玩家的挑战,需要他们从零做起,去设计新的蛋白质。玩家可以改变支链,这样能有效地创造人工蛋白质,而其中最好的一些会被合成并测试,波波维克说道。在12月,一种新的游戏将被推出,目的是生长和构建可以结合病毒的合成蛋白。这最终将有助于生产新药物和疫苗。“我想这就是人类要比计算机有优势的地方,” 贝克说道。

正如SETI@home的备受欢迎带动了分布式计算的应用,其他领域的科学也很有可能会模仿Foldit。舍基甚至看得更远:“在未来,将会发起很多人类处理项目,我们会看到自身的大脑闲置周期有着无与伦比的竞争力,”他说。谁说科技会让我们变得越来越闲,真是大错特错。

当个自由自在的“科学家”

忘了俄罗斯方块和纸牌游戏吧,将你的闲暇时光投入到科研项目中来

有目的的游戏

帮助完善计算机的图像识别和人工智能系统。www.gwap.com

谷歌图片标签

“有目的的游戏”的衍生项目,通过与陌生的搭档在最快时间内标记物体来帮助改进图片搜索引擎。www.images.google.com/imagelabeler

FOLDIT

尝试各种方法折叠或设计蛋白质结构,帮助生物学家设计新一代药物。www.foldit.com

星系动物园

将数百万张不同星系的图片进行分类,以帮助解决一些宇宙学中的重大问题。www.galaxyzoo.org/

0
为您推荐

23 Responses to “[小红猪]你的电脑需要你”

  1. fwjmath说道:

    “蛋白质结构预测技巧的关键性评估”这个还是附上原名缩写CASP比较好……要不是以前知道这东西的话差点就认不出它来了……
    其实再修正得更通顺就好了……
    想到我正在写的东西……我啥时候才能写完……

  2. 田不野说道:

    蛋白质这个,貌似很好玩。

  3. maokk说道:

    大家一起来玩呀。

  4. fwjmath说道:

    另外,FoldIt的网址应该是http://fold.it

  5. 6149说道:

    我也想试试,可惜英语不太好。嘿,在摸爬滚打中学习吧!

  6. allarem说道:

    这不是抢ROSETTA项目的饭碗?

    • fwjmath说道:

      这就是Rosetta@home的那帮人搞的啊~~~大家都是Baker Lab的~~~
      foldit总结的人类玩家的算法据说还可以帮助改进Rosetta和miniRosetta的程序~~~

      • allarem说道:

        这样的啊,下载了一个,很不错
        这个创意很好,但是我没生物学背景,newb中……

        ps:我也发现那个Foldit网站的配色方案和我的博客惊人的相似……哈哈……

  7. Tarazed说道:

    关于ReCAPTCHA的一段似乎是把原文的两段掺起来了,原文中facebook用来防黑客的是CAPTCHAs,而ReCAPTCHA项目是在此基础上识别手写文字,此处的译文好像易使人混淆。

    • Tarazed说道:

      "呈现给参与者的除了未被识别的文字,还有一个已知单词,这样就可以区分参与者究竟是计算机还是人类",原文的意思应该是“这个已知单词才是对参与者是否人类的真正测试”,据我之前的了解,只要用户拼对了那个“已知单词”,就可以顺利注册网站,而用户对那个未知单词的输入会被储存起来作为识别结果,事实上如果用户不填也没事。

  8. ca1123说道:

    需要志愿者们标记由19世纪70年代 Viking探测器拍摄到的照片上

    19世纪70年代 Viking探测器--->时间没问题?
    1975年的海盗号探测器吧

  9. Alex说道:

    我怎么觉得,这是踏向Matrix的第一步…………

  10. Abyssx说道:

    嗯……这是一个广告……又会有不少免费劳动力投入……

  11. 梅心晴说道:

    哇。。。当年做蛋白预测的时候有这么有趣的话。。。估计我也不放弃了。。。

  12. 朝雲说道:

    我註冊外國論壇帳號,看過差不多驗證碼系統,原來可以間接幫助電腦識字,協助科研?現在才知道...

  13. 热天气说道:

    这个让我想起了 以前有个寻找大质数的云计算 用悬赏吸引人
    这个用游戏性来吸引人

  14. 瓶子说道:

    利用分布式计算机的主人的脑子解决一些“有趣”的问题,这个点子,简直是太神奇了

  15. cooler说道:

    非常有趣 游戏进行中

    享受思考中。

  16. [...] [小红猪]你的电脑需要你 [...]

  17. liming说道:

    中国这方面也是领先世界的。
    判断论坛验证码是一个很有难度的工作,各种验证码都有自己的特色,没有办法用一套统一的算法去判断所有现存的验证码。但有些人就在网络上卖验证码识别服务,你把需要识别的验证码发送到他们的服务器,他们就能在一个可接受的时间里返回识别的结果,很神奇吧。
    其实背后的实现就是,他们雇员了一些民工,每天盯着电脑看,来一个验证码就看一下,输入结果。人工识别技术成本低,效率高,而且扩展性好。

  18. 验证码这个技术问题确实是不错,还是盲人验证码,语音验证码等等。拓步ERP软件www.toberp.com

Leave a Reply