友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
微软的梦工场-第23部分
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!
声学所博士时,我依然申请了语音合成方向。就这样,我的硕士、博士论文工作奠定了我之后长达十多年的研究兴趣。
大家都说爱一行,干一行。从硕士阶段开始算起,到后来留在声学所工作、直到在微软亚洲研究院工作到2007年,我已经在这个领域奋战了近18个年头了。我一直觉得自己是个很专注的人,但是仍不敢想象这种执着竟坚持了这么久。
语音合成是一个交叉学科,既要懂得语音信号处理,还要掌握语言内部的音韵、语法等系统的知识,并且需要能将这些知识很好的融合到语音合成系统之中。此外,还需要了解心理学实验方法,通过各种实验来帮助我们更好地理解人的听觉特点,从而更好的满足用户的需求。正是因为它所要求的相关学科的知识面比较广,才吸引我投入了这么多时间在上面。
而研究院,也是从事这样专注研究的一个好地方,它为每个研究员提供了很好的平台与环境,还有做事情的自由,每个人有很大的自由决定想做什么,不做什么。而且,只要要求合理,研究院总是会保障你有足够的资源做自己的研究。我曾经很奢侈地拥有过一个专门的录音室,在那里,我们进行了各式各样的录音实验,这也是木兰会有很好的音质的一个重要保障。
期盼再做一次“妈妈”
到2007年的时候,我已在TTS领域耕耘了十多年了。虽然,颇有收获,但内心深处逐渐萌生去打探一下TTS之外的领域的念头。这时,我对大规模数据加工处理产生了兴趣,这其中麻省理工学院的Victor Zue教授给了我很大的启示。
有一次,他来研究院访问时时,对我们提过这样一个问题:如果将你在做研究中所使用的数据量,乘上一百或者一千倍,同样的问题还能用同样的方法来解决吗?
是呀,随着互联网技术的发展,我们可以接触、收集的数据量迅速增长,面对这样大规模增长的数据,我们能做什么呢?应该怎么做呢?如何对大规模数据进行挖掘、分析和再利用成为了一个极富挑战的研究难题,对我也产生了强烈的吸引力。于是,就在2007年,我做了一个重要决定,扩展一下自己的研究领域,从语音组转到了以数据为中心的计算组,开始了一段新的研究历程。
将来会怎样,我无法预期,但我充满信心的期待着下一个硕果累累的十年,希望自己能孕育出另一个木兰,再做一次妈妈。
作者介绍:
初敏,2000年3月加入微软亚洲研究院,从事语音分析与合成、韵律模型和文语转换等方面的研究,她主持研究的木兰中英文双语文语转换技术成功的应用于微软的新一代操作系统Vista之中。2007年开始,初敏致力于将各种机器学习和数据挖掘技术用于大规模数据的分布式计算。工作之余,她最大兴趣是游山玩水,希望有生之年能走遍祖国的山山水水和世界的角角落落。
第71节:TechFest:我们的技术节(1)
TechFest:我们的技术节
作者:谢幸
最近流行一个词叫做创意市集,其组织形式和普通市集基本相同,最大不同之处就在于“创意”。在这里,每个摊主都是设计者,摊位上的每件物品都是他们亲手设计制作的,独一无二,具有独特的创意与强烈的个人风格。他们来创意市集的目的不只是为推销个人的作品,更重要的是,这里是一个设计者之间、设计者与爱好者之间沟通的平台。一群志同道合者们在这里聚集,聊得兴高采烈,海阔天空。
其实,在Microsoft,也有这样一个“创意市集”,那就是一年一度的技术节!
你一定不会相信。
技术节,粗看上去,不过就是各自说说自己的工作成果,不过就是很多人聚集在一起,各自show自己的demo而已,有什么特别的呢?
我以前也是这么想的。这要从2002年2月说起。
半夜的电话
2002年2月的一天,北京,凌晨两三点。电话铃声突然响起,我从床上一跃而起,直觉告诉我,一定是演示出麻烦了。
其实,严格说起来,我并没有真正“参加”这次的技术节,我的任务是留守北京负责后方监控。这时的我来微软工作还不满一年,技术节,对我来说,不过是个模糊的概念。这次我们组的demo之一是把网络视频转换成适合手机屏幕显示的格式,虽然之前我们对其进行了严格调试,力求不出任何问题,可意外还是发生了。这也许就是所谓的墨菲定律 (Murphy’s Law),担心什么就有可能发生什么,不论平时准备的多好,你的技术总是会在给最多人演示的时候出问题。
整个演示需要多台服务器之间进行配合,用手机来播放最终的结果,代理服务器接收视频,对其进行分析、处理和转换,还有一台服务器专门负责发送视频流。由于用到的机器数量比较多,其中一部分还位于中国。在现场安装设置过程中,任何一个微小的错误都可能会导致整个demo不能工作。通过电话,我和远在美国的同事们一点点排查,一遍遍调试,最终保证了演示的顺利进行。
背下来的讲稿
2003年,西雅图。我终于有了与技术节亲密接触的机会。
由于这也是我第一次去美国,语言交流成了我们这些年轻员工最担心的问题。为了防止可能出现的尴尬场面,我用了一个笨方法,把演示的内容背下来。于是,我事先准备好一份详细的讲稿,并找来英文水平好的同事修改润色,每句话都经过仔细推敲。定稿后反复朗读,牢记于心。此外,我还花费很多时间精心设计了海报,虽然现在看来,它显得那么稚嫩朴素。直到现在,这张海报还悬挂在我的办公室墙上,记录着当年的历史。
准备好这些,我终于有足够的信心站在演示台前。虽然我来之前对技术节有过很多设想,可现场看到如此热闹的场景依然让我兴奋不已。来观看的都是公司各部门的同事,大家在会场中往来穿梭,自由选择感兴趣的展示,而每一个展示者也都乐于与大家分享自己的技术。
展示者在台前兴奋的说,观看者在周围投入的听,并不时提出疑问或新的想法。产品组的项目经理们也会到现场观看,并借机寻找是否有相关技术可供合作。两天的技术节里,我一直积极认真地做着每一次演示,虽然辛苦,却很兴奋。有很多观众被我们的展示所吸引,这也让初次参加的我很有成就感。
这次美国之行,我还见到了在微软总部工作的几个本科同学。因为大部分时间观众都很多,为了不打扰我,他们特意等在一旁,直到我做完演示才过来打招呼。他们夸赞我说,没想到你第一次来美国英文就这么好。我听了暗自得意,他们哪里知道我全部是背下来的呢。这次技术节之后,我已经不再需要提前背诵讲稿了,可是这段经历却让我一直记忆犹新。
在做完演示的空暇我会在会场四处走走,参观其他研究员的展台。我发现有很多研究员非常认真,甚至是一些资深研究员们也都一直坚守在展台前演示自己的项目,不管我何时经过,都看到他们有着饱满的热情,我可以感受到他们对研究的热爱,而这份热爱和年龄与职位都没有关系。他们身上所展现出的激情与创造力让我深受感染。
我心目中对技术节的看法也因此一点点地改变了。
我见到了鲍尔默
鲍尔默,那个听说会在公司年会上骑马冲上台的CEO,我曾在公司的内部视频上看过他充满激情的演讲片段,但我从未想到有一天我能站在他的面前演示我的demo。
可技术节就是这样一个让人梦想成真的地方!
2006年3月2日,我激动而忐忑的等待在展台前。
第72节:TechFest:我们的技术节(2)
鲍尔默在两三个人的陪同下来了。没有前呼后拥,和普通的观众并没有太大不同,他很随和的拉过一把椅子,坐在了我面前。
我要给鲍尔默做的演示是photo2search,其内容是用户用手机拍下照片,把照片上传到服务器并匹配与之最相似的图片,从而得到和照片拍摄内容相关的信息。举个实际中的例子来说吧,你用手机拍下路边某餐馆,系统将该照片和其他图片进行分析匹配后,便能够知道该餐馆的名字,还可以将餐馆的优惠活动,甚至当天特价菜品等信息发送到你的手机上。你只需摁了几下手指,便很方便的得到了想要的信息。
演示中,我输入预先准备的查询图片——这是一张天安门的照片,系统立即返回了数据库中所有和天安门相关的图片。鲍尔默很快便理解了这项技术的主要功能,非常兴奋的谈起了他的看法,包括潜在的商业用途,微软哪些产品中可以运用该技术等等。他敏锐的眼光和独到的观点让我非常佩服,也让我看到了这项技术的美好前景,增强了把研究转变为现实的信心。
这次技术节上,我还注意到一些有趣的细节。为了了解什么样的演示最受欢迎,组织者在每个展台前放上了一台刷卡机,你如果对某项技术感兴趣,就在该刷卡机上刷下自己的门卡,以此作为最后的人数统计,并且会在技术节结束后把你看过的所有演示信息通过email给你。另外,会场内还装备了一台大屏幕,实时显示着每个演示的刷卡数。
于是,一个有意思的场景出现了,研究员们休息时便三三两两的端着咖啡,到这里来看自己的排名情况。也因此出现了排名之争,继而衍生出各种各样提高排名的方法。比如,有人会费尽心思将自己的展区布置成小型电影院的模样,还有人准备了小礼品以“贿赂”参观者。我们一边学习别人布置展台的经验一边也想了很多方法,租了大屏幕显示器,并请专业设计师设计了精美的海报,这一切都是为了吸引更多的眼球。努力终归没有白费,第二年,也就是2007年,在所有来自中国的演示项目中,我们拿到了刷卡量第一!
上CNN了
技术节的第一天叫做Public Day,即“公开日”。这是面对媒体的宣传活动,并会邀请一些学校的教授和其他公司的高层前来参加。公司会从参加技术节的所有Demo中挑选出一些参加Public Day上的公开演示。
2007年,我的项目被选中参加Public Day。这对我来说是更大的考验,意味着不能出任何的差错,意味着将要面对记者的采访,当然也意味着会有更多的人关注我们的项目。
今年的演示延续了上一年的工作,即用手机拍摄照片来进行搜索,但这次不仅可以支持更大规模的数据库,返回的结果也有了很大改进。在这次演示里,我们使用了百万量级的图片数据,基本上可以覆盖一个城市的大部分区域。虽然数据规模更大了,但是系统的查询时间并没有增加,基本上在几秒内就可以得到结果,在手机使用中这已经是可以接受的性能。性能提高的主要原因是我们使用了分布式的系统来处理查询,极大地提高了系统的可扩展性。
(谢幸在2007年微软技术节上向观众做Photo2Search演示)
Public Day那天,CNN、BBC、Seattle Times (《西雅图时报》)、路透社等各大媒体都派出了记者参加,也能看到来自中国的记者,如《计算机世界》、《互联网周刊》等等。通常记者的采访是这样的:一人负责拍摄,另一个人手持话筒,边看演示边提问题。整个采访过程时间并不长,这就需要我必须在很短的时间内,既让他们看懂演示的技术,又要把其中的关键点讲述得简洁清楚。就这样,记者走了一拨又来一拨,一天下来,我已经记不清楚我接待了多少位记者、做了多少遍演示。
第二天,我刚打开邮箱就发现同学给我发的Email,“你上CNN了!”我很惊讶,连忙打开CNN的网页,赫然发现我做演示的照片出现在当日科技版的头条新闻里,标题是“TechFest Explores Future Technologies”。新闻里这样写到:“Lost in Seattle with nothing but a camera phone? Just snap a picture of a nearby building; send off the photo to a database and soon you〃ll get back a map and information about where you are。 (在西雅图走失了?什么都没有,随身只剩下一个可拍照的手机?没关系,只要拍下一张周围建筑物的照片,把它传到数据库,一回你就能得到你所在地的地图和信息了)” 我的经理马维英看后开玩笑的对我说,很多人千方百计想上CNN还上不了呢。随后,沈向洋院长也写信来打趣我说“你看起来很帅!”技术节一结束,我立即将这些报道转发给为了这个演示一起努力工作的同事和学生,让他们和我一起分享这份喜悦。
2008年3月,西雅图春寒料峭,我和我的同事们又一次来到了技术节,又一次拿到了中国参演项目中的点击量冠军。
我们是一群科学顽童
现在再回头说说,为什么说技术节就好像是一个全公司的创意市集呢?
细细比较起来,两者还是有诸多相似之处的。每个参加技术节的研究员们就好像市集上的摊主,每个展位就是他们的“摊位”;市集上的摊主们出售的是自己的看家宝贝,研究员们展出的是自己引以为豪的技术;正如摊主们的主要目的不是为卖出商品一样,研究员们参加技术节也不只是为了做秀或扩大知名度,促使他们来到这里的动力主要是源于对技术本身的热爱与激情。正是由于这种热爱与激情,使得这里没有年龄的差异,没有级别的高低,这里只有一群热衷于科学的顽童,每一次的脑力激荡中总会闪现灵感的火花。
费曼说,科学是很好玩的游戏。这句话改变了很多人对科学的刻板态度。同样的,技术节也改变了我做研究的态度,研究也应该是很好玩的游戏,只有对事物保持好奇、怀疑、钻研、动手实验的态度,只有保持一颗具有创造力与激情的心灵,只有把自己的技术看作犹如自己孩子般的热爱,才能在做研究中享受创造的乐趣,才有可能体会到成功的兴奋与喜悦。
每一次的技术节,我都被这种气氛感染着,也在这个
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!