2006年4月17日

机器翻译咸鱼翻身

你曾经使用翻译软件,结果让你啼笑皆非?有人说,过去50多年机器翻译进展缓慢,但这种结论可能已经过时:IBM、微软、Google等巨头在这一领域的争斗日趋白热化。科学家们更乐观地断言:机器翻译前途不可限量,最终将赶上人类的翻译水平。

以上这段文字是最新一期《科学美国人》中文版《环球科学》上的文章《机器翻译咸鱼翻身》的介绍。读完这篇文章,让人激动不已。因为我已经很久没有在《科学美国人》上看到NLP相关的资讯了。机器翻译曾经是无数人的梦想,早先的机器翻译都是基于规则的。而今基于统计的机器翻译让大规模的数据集上的学习成为可能。这篇文章中提到了现在Google的在线翻译功能,看看下面这个网页翻译的结果你可能会大吃一惊。



BEIJING, China (AP) -- Google Inc. CEO Eric Schmidt on Wednesday defended the search engine's cooperation with Chinese censorship as he announced the creation of a Beijing research center and unveiled a Chinese-language brand name.

中国北京(AP)--Google公司总裁EricSchmidt周三捍卫搜索引擎的检查与中国合作,因为他宣布成立一个研究中心和北京推出中文品牌.

Google is trying to raise its profile in China after waiting until January to launch its Chinese-language site Google.cn. Activists have criticized the company for blocking searches for material about Taiwan, Tibet, democracy and other sensitive issues on the site.

Google着力提高中国的形象,等到一月后推出中文网站Google.cn. 分子阻挠批评寻找材料公司对台湾、西藏、民主等敏感问题的网站.

"We believe that the decision that we made to follow the law in China was absolutely the right one," Schmidt said at a news conference.

"我们相信,决定我们对中国采取的法律是绝对正确的,"施密特说,在记者招待会上.

He said Google had to accept restrictions in order to serve China, which has the world's second-largest population of Internet users after the United States, with more than 111 million people online.

他说,Google已经接受服务的限制,以便与中国的传统友谊,是世界上人口第二大互联网用户,仅次于美国,超过111万人上网.

Schmidt also announced the creation of a research center in Beijing that he said should have 150 employees by mid-2006 and "eventually thousands of people." He said the center is meant to create products for markets worldwide, though he said planning was still in such an early stage that he didn't know what they might be.

施密特还宣布在北京成立一个研究中心,他说,有150名职工要年年和2006年"万人最终" 他说,这个中心的目的是创造产品的世界市场,但他说,这项计划仍处于初期阶段,他不知道他们是谁.



为什么Google把这个传统的难题完成得这么好!在报摊读完这篇文章以及结合我自己的了解,我发现Google达到这种水平在于三个关键因素。
1。Google已经在全球范围内网罗了大量的NLP顶级研究人员,现在我就知道至少三个研究人员。
2。统计机器翻译的世界级的牛人奥克现在在Google工作。
3。奥克使用了大量的双语资源,例如完成英汉的双语翻译,他们使用了超过100万本的电子书籍的资料。

仔细想想,Google的全球资料爬行能力,以及在美国很多大学的图书馆里扫描得到的电子版的图书,以及世界级的NLP牛人门的加盟,使得很多以前很难大规模进行的实验和激动人心的想法都可以得到很好的实现。这种能力有时候让人激动不不已,有时候又可能出现一种顶端优势,即Google引领世界NLP研究的潮流。

哈哈,一个伟大的公司对世界造成的影响就应该是伟大的,比如Google~!

2 条评论:

Bill Lang 说...

Comment's author: qll-popcorn
04/20/2006 10:15:20 PM
整个国家,都在疯狂英语。谷歌的进展是不是意味着,这个风潮有望退去?需要有人学外语,但不必所有的人吧。今天停电,去英语角消磨时间,看到有的人浪费了很多时间,用不好的方法学者英语,挺难受的。

Bill Lang 说...

Comment's author: hfjiang
04/25/2006 01:27:07 PM
在哪里可以看到这篇文章呢?
呵呵,机器翻译这条咸鱼要翻身那企不是
是一件很。。。的事。
哈哈,梦想着一天能在有生之日到来。