首页 >> 媒体导读 >> 文章

2001 Space Odyssey

2001 Space Odyssey

《你好,哈儿》

Hello, HAL, by John Seabrook, from The New Yorker

八年前,在远离地球的空间站上发生了一起未遂谋杀案。男主角HAL是个智力超常的冷血杀手,冷的不止是血,他还会冷幽默,看着对手急赤白脸的样子,他说:看你小样儿,先吃片镇静剂去。

HAL is looking at you

HAL is looking at you

八年前的这件事其实没有发生,这是《太空漫游2001》(2001:Space Odyssey)的结尾,HAL是个机器。

虽然我还没读过小说,但我去过HAL的老家——小说中的HAL的出生地Urbana,Illinois,咱在那儿插过几年队,没种过玉米,只收过论文。

没有发生是件好事。不关心科幻的不会被噩梦唤醒,而科幻迷可以继续科幻。不过,在制造HAL的长征中,我们到哪了?

其实这篇文章很有标题党的嫌疑,因为这里集中讲的只是HAL同志的嘴和耳,也就是语音识别和综合技术的现状。所谓综合,就是计算机模拟人声,按理说进展很不小了,最近的热点是要让HAL同志更加声情并茂一些,朗诵起来要有激情,要有关爱,等等。不过,如果你弹过或者听过电钢(不是键盘),就知道再怎么烧钱,感觉和声音都离真正的钢琴十分遥远——语音综合的情况差不多。

语音识别其实做的也不错。在微软研究院里我就见到过可以把语音对话基本实时地翻译成文本。从这文本可以进行机器翻译,翻译完了再做语音综合,土土的机器翻译有时候还会派上用处,比如在伊拉克的美军哨所。

至于识别用的什么方法,本质上和我现在打字的中文输入法没有区别,就一个字:猜。看得多了或者有海量训练文本,就能猜个八九不离十,虽然用个很洋气的名字,叫“基于统计的语音识别”。其实,之所以走到这条路上,也是不得已而为之,因为要更加本质地理解语言,实在是太难了。

The challenge is to marry your greatest technologies: language and toolmaking.

The challenge is to marry your greatest technologies: language and toolmaking.

但如果你仔细读那些语音识别产生的结果,一定会觉得有点怪。除了姬十四这样的主持人可以有说话不打一个崩儿话音落地就是文章的本事,“嗯”、“啊”、“这个这个”之类的夹在文字中间会让人不忍卒读。而且,人的本事是即便有好多人在一起聊天,想听谁就能听谁,其他的屏蔽,这个机器也做不到。所以要让语音识别准确,一定要戴上耳麦。

还有,别给我倒冷咖啡,我听得出来!邪吧,人的听觉真有这么厉害。不信你自己试试。

A:我说什么你听见了吗?(声学层的识别问题)
B:听见了!
A:听见啥了都??(语言层的识别问题)
B:*&-!#$%^^^..
A:明白什么意思么???(理解问题)
B:不明白……

这样的对话满大街都是,我们人类尚且搞不定,机器又何以企及。语音智能不是我的领域,李开复和洪小文等等(微软亚洲研究院现任院长)才是大拿,这个问题要谈深入得找他们。但我想这个比方差得不多。所以让机器来“理解”而不只是“识别”,还是非常遥远的事。

HAL要到3001年才会诞生,到时候再Hello吧。

Hello, HAL9000

Hello, HAL9000

—————————————————————————————————

《回到未来》

Back to the Future, by J. Madeleine Nash, from High Country News

有棵大树,长着一双长长腿,跑啊跑,一直跑到高坡上……

很科幻是吗?

大约五千六百万年,地球上的二氧化碳突然激增了十倍,引发了此后一万年的植被大迁移,原来长在寒冷地带的植物不停地往高处转移,由此,也带动整个食物链的大搬家。毛主席说过“一万年太久,只争朝夕”,可是,在大自然的时间表里,一万年只是一眨眼的功夫。

奔跑过来的大树们和同时迁移的动物们沉淀为化石,在美国怀俄明州渺无人烟的高地上被古生物和古植物学家发现。

Scott Wing digs for PETM plant fossils in Wyoming's Big Horn Basin. Previous page, the Big Red, a visual marker of 55.5 million-year-old fossils.

Scott Wing digs for PETM plant fossils in Wyoming's Big Horn Basin. Previous page, the Big Red, a visual marker of 55.5 million-year-old fossils.

如果全球温度持续升高,那么到时候我们将一起被桑拿,直到被煮干为止。而既然地球已经被煮了一次,那么应该会留下一些痕迹。

“回到未来”是个很炫的标题,其实说的只是向历史要答案。

可是,就为了找到那棵煮干了的树,这几个科学家苦苦找了十多年。

那么,到底是谁打了那么大一个饱嗝,喷出那么多的二氧化碳?有消息说,很可能是海底甲烷的释放引起的,但这不是全部。所以,到现在这还是个无头谜案。

Scott Wing and his crew trek up a ridge of vivid red paleosols in the Big Horn Basin.

Scott Wing and his crew trek up a ridge of vivid red paleosols in the Big Horn Basin.

作为一个时间不短的马友,有一个细节让我觉得很有意思:剧变之前的马大概和今天的猫一样大。

嗯,诸位开始祈祷吧,如果你能熬过全球变暖,那你将一定成为巨人。

Cataloging the day's finds in the vertebrate paleontologists' tent are, clockwise from bottom: Katie Slivensky, Sara Parent, Stephen Chester, Doug Boyer, Paul Morse.

Cataloging the day's finds in the vertebrate paleontologists' tent are, clockwise from bottom: Katie Slivensky, Sara Parent, Stephen Chester, Doug Boyer, Paul Morse.

——————————————————————————————

《来一大杯冰镇……污水?》

A Tall, Cool Drink of … Sewage?, by Elezabeth Royte, from The New York Times Magazine

A Tall, Cool Drink of … Sewage?

A Tall, Cool Drink of … Sewage?

我们面临两大危机:能源和水。

据说,如果中国人平均能耗都和美国人一样,那么再过三十年,我们将耗尽地球上的全部石油储备。在能源洗劫一空的当口,不可能不爆发世界大战来重新分配资源。到那时候,全世界的军火商都要感谢两个人:作为老师的美国人,和作为学生的中国人。

地球不可能不转,阳光不会消失。换言之,如果我们能在能量的存贮上有所突破,风能和太阳能就足够解决问题。

但是太阳公公不是洒水车——水的缺席却是很可怕的。要切实地认识到这一点,你必须站在戈壁沙漠之中,意识到仅仅在两千年前,脚下还是富饶迷人的绿洲,那种紧迫感是逼人的(见敦煌PP行(四))。

敦煌 photo by 竹人

敦煌 photo by 竹人

Sewage==污水,这篇文章报道的是加州奥兰治县(Orange County)的污水处理工程。这个加州第二大县相当出名——迪斯尼世界的大本营就在那。随着人口的增加,整个县越来越“渴”,更糟糕的是,海水已经渗入地下水。人口的增加也意味着污水处理成本的提高,光铺设第二条排污管道就需要两亿美元。

这就意味着,除了循环利用污水之外没有其他更好的办法。这将一揽子解决全部问题——虽然耗资不菲——整个工程需要四亿八千万美元,每年的运作还要花上两千九百万美元。

饮用处理过的污水,在技术上没问题,在健康上也有保证,问题在于心理障碍。这项工程的最后一道工序是把处理过的水在水库里存上两年。这在技术上却是完全没有必要的。

Sewage

Sewage

下次你到迪斯尼去玩,请你到厕所里好好转转。你现在喝的,很可能就是两年前这马桶里的一汪H2O……

类似的工程在中国的推广会怎样呢?我觉得应该比较好说服大家吧。上甘岭里的英雄们喝尿解渴的事迹不是路人皆知吗?最主要的是,我们的排污和取水都在几条大河里同时运作,端的是你来我往。所以,我们早就在饮用处理过的污水了。

想归这么想,但真要推广,相信遇到的阻力会远远超过我的想象。

——————————————————————————————

Best American Science Writing 2009

Best American Science Writing 2009

这本书是《美国科学写作精选2009(Best American Science Writing 2009)》

本书一共24篇文章,都来自纽约客、纽约时报、华尔街日报、科学、Wired等优质报刊,出自活跃在一线的科学家和身经百战的记者之手,横跨天文、医学、心理等 等科学领域,写得生动活泼,深入浅出。

以后会定期在每周四放出一篇导读,里面介绍两到三篇原文,目的是希望大家保持一定的阅读节奏,努力点击竹人辛苦找到的原文链接。

【美国科学写作精选导读一】我们为什么阅读科学?

【美国科学写作精选导读二】脑中的旅程

【美国科学写作精选导读三】用科学阅读现实的黑暗

【美国科学写作精选导读四】以科学之名,解构战争

这些导读已陆续发表在微软亚洲研究院博客、《南方人物周刊》和《中国经营报》上。

(编辑 小姬)

0
为您推荐

20 Responses to “[美国科学写作精选导读五]你好,未来”

  1. akiya说道:

    不是吧~我从来不是沙发命的啊~~

  2. akiya说道:

    话说最后一个喝污水的问题。。嗯,这对住在中国这个存在着严重食品卫生的国家来说,实在不算个问题,想想今早一手给你递煎饼一手收钱的小贩的那双油光泛泛的手的指甲缝的黑泥。。。
    有些事如果不视而不见装阿Q的话是很难活下去的,所以越是这样,国人就越怕捅破那层窗户纸~

  3. starfocus说道:

    “地球不可能不转,阳光不会消失。换言之,如果我们能在能量的存贮上有所突破,风能和太阳能就足够解决问题。”
    他似乎是说:地球的转动带来风能,太阳带来太阳能。可风不是靠地球转动产生的吧?
    想起冬夜里骑自行车会很大风很冷。

    • Metaverse说道:

      风产生的根本原因是太阳辐射在不同纬度使大气产生气压差以及海陆热力性质差异,地球自转只是造成科氏加速度使风产生偏转。。。这个在高中地理课有讲过。。。

  4. starfocus说道:

    啊,好热啊。
    蜈蚣都受不了。
    无数绿色的蜈蚣拔起它们褐色的脚往高处爬去

  5. 小莉说道:

    “作为一个时间不短的马友,有一个细节让我觉得很有意思:剧变之前的马大概和今天的猫一样大。”

    ——很抱歉地提醒你,那不是马。这就好比南方古猿不是人一样。

  6. 竹人说道:

    嗯嗯,虫子捉得好!

    小莉同学,古时候的马要是不叫马,那我们叫它……驴?:)

    风能和地球自转的关系,汗,我想当然了。但可不可以诡辩一下,如果地球不转,大气层各点的温度应该是恒定的了,那么,该是一点风都没有,还是天天超级大风呢?有谁愿意计算一下?

    • HelloBeauty说道:

      关于自转和风,前不久发过的“斯皮策空间望远镜5年之科学成就”里面有这么一段话:
      “ 这一研究发现,尽管HD189733b的自转被“锁定”了,但是朝向恒星的一侧和背向恒星一侧的温度差距其实并不大——从927℃到649℃。同时,朝向恒星一侧温度最高的也不是恒星正好位于头顶方向的地方,而是在这个基础上还要向东偏30°。

        向东30°的偏差以及白天和夜晚间不大的温差说明了风把热量从白天一侧带到了夜晚的一侧。但是为了要解释观测到的温度分布,风的速度就要达到每小时1,610千米以上。”

      要是地球不转情况可能跟这个差不多吧,不过风可能没“每小时1,610千米”这么大。。。。。。

      • 竹人说道:

        有意思,“每小时1,610千米”可是超音速了。

    • suizui说道:

      地球如果不转,还是保持公转,一天就是一年,按照现在的“天”来算,太阳在天空中每天只移动一度,很慢,作近似静止建立模型。

      下一步研究大气,假设没有云和尘埃。算很干净的,但是大气总会吸收太阳辐射,变热,不同的化学物质吸收特性不同,重力影响的物质分布应该不均匀,大气会分层,各层的日照加热效果不同,引起对流,引起混合。比较复杂,为了简单计算,假设大气化学物质成分单一,日照的影响完全从吸热放热的热力学途径表现。

      这个虚拟的纯洁大气和地球相比,厚度很小,比喻为苹果的皮,远远地看过去,热对流几乎都是水平方向的运动。

      太阳在天上慢慢移动,却照射着很大的范围,半个世界骄阳似火,分隔白昼和黑夜的昏晨线每天移动一个经度,等于赤道地面东西方向一百公里,而白昼范围跨度2万公里,比例1/200,小小的,烤肉时这样转会让一面长久见火,烤焦的机会很大。

      日照范围靠近中心的地方一定非常热,如果没有大气的传导对流帮助散热,白昼范围地面的温度变化就和月球一样。
      地面如果是固体,假设是泥土和岩石,热传导率不高,外皮就会晒到几百摄氏度,温度越高辐射越强,当吸收热量的速率和辐射散热一样时,就达到平衡点,温度保持下来了,然后太阳慢慢移动,照射角度变化,单位截面积上输入的热量跟着变化,外皮温度也慢慢变化,太阳移动太慢了,外皮很多天近似一样热。

      把大气盖上去,碰到地面,吸收地面的热能,地面同时在热辐射,大气正好在一些频率处吸收率很高,拦截这部分热辐射,被加热;其他频率的热辐射难截留,就打瓶酱油穿过大气,飞向太空,宇宙无垠!(注:此话版权属于巴斯光年,特此向它掏枪鸣谢!巴斯光年立刻卧倒躲避!),介个不好拦路打劫的频率,就是“大气窗口”是也!
      ..............................
      【按:显然,地面温度的变化会引起辐射频率的变化,辐射峰在频谱中的位置一定跟着变化。而各种大气成分的吸收特性不能死克烂打地跟着变化,所谓的大气窗口频率就一定不同,不要死背10微米波长是地球的大气窗口——那是有条件的,针对现在的地面辐射状态。如果地面平均温度变为1000000摄氏度,分子全部崩溃成原子了,而且是等离子态,你说大气窗口是多少频率的,恩恩!?】
      ..............................
      收心回来,大气一盖上去,地面变冷了,空气变热了,想算算日照静球的风速,怎么下手呢?

      先玩最简陋的模型,假设大气对什么频率的辐射都不感冒,只爱传导和对流,而且绝对透明,没有反射折射,能对付它的就只有地面了。

      阳光打酱油透过大气,照射地面,地面有反射、热辐射,有热传导能力。
      日光的辐射有一部分被地面反射回太空,另一部分被地面吸收,变成热能,只要设定地面反射率,吸热的速率就可以根据太阳常数算出来,再从热平衡角度把辐射散热速率与之媲美,裸露地面的平衡点温度就可以算出来;

      后面出现一个麻烦事,地面接触大气会传导散热,热能的散失通道有额外的途径,不需要都走辐射的路,而且大气是流体,热了变轻飘走,有大气的地球表面温度就难简单计算了,这个东西需要搞点实验的数据,待定量。

      地面吸收的热能减掉热辐射部分后,假设都传导给大气,白昼范围大气的热能积累就可以算出总量。

      再测量大气的平均温度,算出一定温度下半个大气含有多少热能。(又要实验,啊~~,抱头!原来玩科学找真正规律,就要有点动手动脚!)

      再算出如果没有热能传递,白昼范围的半个大气从太阳那里搞到多少热能。

      后面更加麻烦了,大气是流体,怎么近似理解都有个硬邦邦的特性必须保留——各处的空气可以对流混合,不能分割成绝对独立的板块,发生热交换时,也会发生物质交换,不然就玩不出气体流动的风了,认真计算一定让人头痛。
      计算模型中的风速,偏偏是要达到量化的认识,厄。。。。只有呼叫玩热力学和流体力学的大鸟了,不然没个好头绪,因为流体一旦和热运动勾结,规律就很不简单了,太难简单估算,混沌在所难免。

      先玩个最简单的定性模拟。

      白昼范围的大气多收到很多热能,它就灿烂起来了,膨胀,密度小了。
      黑夜范围的大气相对冷,密度高,在重力影响下,底层的压强更高,打败热气,冲过去抢太阳椅。
      热气被推上高处。。。。
      厄,如果大气没有热辐射,它就冷不下来,不像真实情况,必须设定它就是会热辐射。
      热气在辐射散热,变冷,密度变高,掉将下来,原来的冷气晒了一阵变热了,打不过,又被推上高处。
      流体的性质就让大气中形成循环运动,从地面吸热,到高处散热。

      流体会混合,但是这种运动只是把部分热能短时保留,谁收到总是会变得更热更轻,会发生更强的热辐射,也会参与对流运动,热能还是要变成电磁波形式,离开地球散入太空。

      总的情况就是白昼范围越近中心越热,空气变轻上升越猛烈,靠近地面的位置总有向心流动的更冷空气,对流运动形成两个极,一个是太阳垂直照射加热最猛的热极,空气猛烈升上,在大气层顶部转为水平方向流动散开;一个是冷极,空气猛烈下沉,在地面转为水平方向流动散开。

      这样啊?会不会变成一个有趣的样子呢——空气从热极的地面上升,到顶平飘,飘到冷极上空,在垂直下降,到底平飘,飘到热极?

      地球这么大坨,能这样简单吗?

      很可能不会的,这里有个互相比较的热和冷。

      热极附近的空气几乎一样地被加热,它们之间的密度没有太大的区别,互相对流难发生。
      但是距离热极比较远的地面被太阳斜着照射,吸热的截面更小,温度会更低(偷偷说一句动态的话:还有更加冷的空气在吹它!从更靠近冷极的地方过来的!),接触它的空气将更加的不热,密度更加显得高。

      这种没有远到冷极附近就足够高密度的空气,完全可以产生足够的影响,和热极附近的空气进行地方性的对流,靠足够强的压力之差,抢先玩一次上下换位。

      所以,热极顶部的空气一边飘一边辐射散热,还没飘出白昼范围就可能相对足够冷了,热极附近的太低气压一影响,它就掉下来,望冷极而不顾,半路杀起回马枪,拐弯回热极去也!

      【注:这没有什么特殊的,真实的地球大气就在这样玩,赤道附近的热气并不坚持飘到南北极才落地,反而只飘一段就下来,转回热的世界,就是足够的密度区别起作用,地球太大,有足够的空间表现,家里的小锅儿和生猛的炉火有时也不能阻止这种回事,可恶,简单大循环的游戏被搞砸了,流体流体,真是流氓一般的物体啊!】

      黑夜范围会是咩样呢?

      没有太阳照射,而且不停辐射降温,可能比较简单吧,但是简单定性地想象不一定够用,不好猜,因为主要决定权在太阳,输入的热能如果够大,会把对流加强,一定有一些关键的流动模式转变点,混沌系统的妖怪规律,可以想见热极只高出1摄氏度和高出1万摄氏度,将产生不同的空气密度差,就引起不同强度的对流,空气的密度、粘度、热辐射散热速度、和地面的摩擦等等,一定能让大气对流从平流转变成湍流,什么时候转变?变成什么样?模拟计算出定量的结果很麻烦,天气预报为什么难,就是如此这般来的。

      真实的地球还有更多引起复杂变化的东西,陆地和海洋的分布很复杂,地球有不算慢的自转,水会蒸发会冷却会变成反射日光的云,气流和地质运动生物活动会产生尘埃,地面不平会干扰空气的流动,等等。

      • 竹人说道:

        强烈建议把这个整理成一篇单独的文章:当地球停转的时候……

        地球不会停转的原因我来告诉你,咱们人类是很能折腾的,虽然现在的口号是No-Z-Turn。我们的Leader一定会号召大家全部、集体、整齐地往东正步走,就这样子,地球不转的灾难就克服了。

        :)

        • suizui说道:

          问题是量化的计算太烧数据处理能力了,凭空想象不出气流运动状态的规律,说不出模拟结果具体是什么样。
          搞事会为此蹬三轮回收废旧深蓝电脑,回家发现机壳的油漆都是刚涂的,修好运行全球天气预报程序,后台马上声光电齐发,外带两朵黑烟,失败。
          正在考虑号召全球无聊PC执行云计算,计划把工程叫做“煮馄饨”。

    • 小莉说道:

      首先,你说的那个5000多万年前的“始祖马”(Hyracotherium=Eohippus)很可能其实并不是马科Equidae成员,而是常常被列为Palaeotheriidae科。

      另外,古生物学的“马”与生活中的马不是同一个概念。古生物学上的“真马”指的是马科马属成员,包括家马、野马、驴、斑马。

      总之,按照古生物学的观点,驴当然是马。“始祖马”当然不是马。

      • 竹人说道:

        小莉同学太厉害了。原文里是这样说的:
        “Oddly enough, many fossil mammals commonly found above this line, including those first horses, were abnormally small. Typically, Gingerich says, Eocene horses grew to the size of modern-day cocker spaniels, but these horses were "about the size of Siamese cats."

        First Horse:始祖马?

        • 小莉说道:

          啊?原文是这样?那么我重新考虑一下:
          “始祖马”是dawn horse ,还真不是别的英文。至于“First Horse”呢,我想还是指的始新世的一些马科成员,比如Orohippus 、Epihippus 之类的吧,反正这些看英文介绍确实都还不是真正的马。
          应该还是可以称作“马的先祖”吧。

          • 小莉说道:

            哦哦,不对,可能这里的“First Horse”还真有可能是指的始祖马?

  7. 说道:

    小样儿的,哈哈哈哈哈。

  8. 拼音佳佳说道:

    虽然并未真正了解语音识别,但我认为可以分两两部分,一是将语音识别为音节,二是将音节转换成汉字.第二部分的准确率可以达到98%以上,应该是很实用了.第一部分就不清楚了这个准确率是黑马神拼在10年前所能达到的程度.

  9. [...] 【美国科学写作精选导读五】你好,未来 [...]