2009年8月3日

高企之旅第一日

今天的行程是上午参观微软亚洲研究院下午参观百度。 上午的详细行程安排如下:
--------------------------------------------------------------------------------------------------
上午 MSRA 地址:希格玛大厦3层大会议室
9:15-10:45 Technical session
9:15-9:30 MSRA Introduction
9:30-10:45 Technical report and discussion 杨宇航、纪荣嵘、郎君、徐培刚、马二磊(10分钟/人)
10:45-11:30 Roundtable
10:45-11:00 Internship Program introduction
11:00-11:30 Roundtable with alumni
11:30-12:00 Demo tour

--------------------------------------------------------------------------------------------------IMG_0292

       早上一切顺利的达到希格玛大厦。去年本来有机会来这里参加微软学者的面试,但是由于路途太远未能到达现场。所以说这是我在05年实习后首次再来到希格玛大 厦。走进大楼的那一刻,看着熟悉的大厅,我还真的莫名激动了一把,因为这个大厅也是我和我女友(应该叫爱人了)正式第一次见面的地方。达到三楼的研发集团 门口后,由于我们提前二十分钟达到这里,大家伙儿又开始忙着合影留念了。

IMG_0310

       9点左右,MSRA UR(高校关系)部门的管刚来到三楼前台接待我们。管刚还是那么的帅气和精干。回想2005年,我们曾同在NLC组实习,后来由于个人爱好,他选择了到 MSRA的UR部门实习并最终成为那里的正式员工。现在他负责我们哈工大方面的UR事宜了。寒暄几句后,他带领我们进入了刚才这张合影背后的学术活动厅。 这个活动厅曾经也有我的身影,当年按星座划分的各个俱乐部的Poster比赛场景还历历在目。记得当时我们天枰座的采用真的乒乓球制作的立体PPC Poster由于创意新颖、效果美观而获得了第一名,当时就是在这个活动厅进行的最终制作和评选。当时的实习生活真是让人回味啊。

DSC02204        正式的交流活动从9点15开始,首先是文继荣老师先介绍微软的基本情况,MSRA是微软再海外最大的研究机构,成立于1998年11月,包括五个研究领域 (Data Intensive Computing,Natural User Interface, Search and Online Ads, Computer Science Foundations, Next Generation Multimedia),共有18个研究组,1个研究中心。文继荣老师是哈工大教育部语言语音重点实验室微软方面的主任。原先的主任是我们的校友周明老 师,后来由于主任轮换,周老师负责清华那边的联合实验室去了。在文老师介绍的过程中,NLC组当年一起实习的蒋龙来到了会场。看到蒋龙格外亲切,当年我们 时常一起打乒乓球,他在微软对联上可谓功不可没啊。

       随后是工大5位同学的研究工作简介。这些相关报告都是微软方面筛选出来感兴趣的部分。介绍的顺序和内容及反馈如下:
1。 杨宇航:基于最小资源的术语抽取。是Coling2008的工作介绍。随后谢欣研究员提问哪个部分贡献最大。
2。 郎君:共指消解。是ACL2008的工作,随后蒋龙提问是否采用了开发集,文继荣提问能否将ILP应用到人立方上。
DSC02215 IMG_0498
3。 纪荣嵘:图像检索。主要介绍博士生阶段的工作以及ACM MM2009论文的思想。
4。 徐培刚:本体对齐。介绍了相关概念和主要方法以及存在的主要挑战。文继荣提问主要会在哪些点开展研究。
5。 马二磊:人物信息抽取。介绍了相关概念了基本技术。文继荣提问怎么识别人名等问题。
IMG_0501 IMG_0512 IMG_0516

       随后陈雯介绍微软明日之星的实习生项目,介绍了一些基本情况,并发给了一个小的Flyer,从整体来看,能到MSRA实习一下还是会收获颇丰的,特别是对 于那些准备出国的朋友。 校友见面部分见到了03年毕业的博士王晓艳,她是高文老师的博士生,00年开始来MSRA实习,现在已经在MSRA呆了9年。和王师姐的交流还是非常愉快 的,感受到了一种轻松和谦虚,给大家也留下了非常好的印象。
IMG_0529 IMG_0533 IMG_0538

       Demo Tour时李倍带领我们到6楼的一个新的专门Demo房间参看了相关技术演示。这个房间非常不错,应该有80平这么大,装修、配色、演示系统的布局都非常 的让人愉悦。相关的演示包括Bing Map(类似于Google Earth,但是真实三维重建和地图的融合似乎比Google Earth更好)、EngKoo(几乎和比邻阁一模一样,也中英文两种词语同时输入的方式,只是界面更酷一些)、人立方、Surface(触摸屏上手工操 作一切,内容,图片可以随着手势伸缩变换旋转等等)、Xbox、折酷(提供各种打折信息搜索,并且打印出来后带到具体商场可以享受打折优惠)。 Photosynth(提供一个场景下360度照片后,在线生成场景下的移动视角)、Live Search Maps。
IMG_0317  IMG_0320 IMG_0324 IMG_0327 IMG_0334 IMG_0556 IMG_0561 IMG_0347 IMG_0563

       离开微软之前,我们还到6楼和周明老师一起合影留念。总之,微软之行得到了一些新鲜的感觉。

 

 

 

IMG_0349        从希格玛打车早早来到百度所在的普天大厦下汇合,中午就在旁边的一个韩餐馆随便吃了顿午餐。在普天楼下等待打车迷路的同学时碰到了本科同学唐振江,他现在 在电子商务部。还碰到百度IRer之一的赵琳,寒暄一阵后我简要向他介绍了我们这次高企之旅的活动,他说早就在百度内部新闻网上知道我们要来了。呵呵,没 想到百度内部的消息这么灵通。

下午的详细行程如下:

--------------------------------------------------------------------------------------------------
下午 百度 地址:北京市海淀北二街6号普天大厦
14:00-14:20 百度概况及企业文化演讲 刘湘雯
14:20-14:40 百度技术人才招聘介绍 赵长海
14:40-15:00 哈工大计算机学院介绍,请感兴趣同事参加
15:00-16:00 杨宇航、郎君、马二磊介绍专业兴趣(15分钟/人),请各组面试交流同事参加
16:00-16:30 分组交流
PS: 杨宇航、郎君、马二磊、徐培刚
Ecom(袁杰):纪荣嵘
Ecom(王闯):钟必能
校友交流:郝亮、李淼、李文凯、石峰
16:30-17:00 分组交流
Ecom(首科):杨宇航、马二磊、徐培刚
Ecom(袁杰):郎君
校友交流:郝亮、李淼、李文凯、石峰、钟必能、纪荣嵘
17:00-17:30 分组交流/参观
NS: 杨宇航、郎君、马二磊、纪荣嵘
公司参观:郝亮、李淼、李文凯、石峰、钟必能、徐培刚
百度安排晚餐
--------------------------------------------------------------------------------------------------

        如果说上午是对曾经呆过6个半月的微软的重温,那么下午在百度的参观绝对是一种全新的体验,在百度我们感受到的是一种创新的力量。

DSC02252IMG_0567 DSC02260

       首先,感觉百度对我们的来访非常的重视。我们主要的交流场所是一个较为开阔的空地,这里周围全是百度内部员工休息和讨论问题的桌椅。首先是刘湘雯(刚从微 软研究院UR跳槽过来)带领我们参观了一圈百度的工作环境。由于不能拍照这里无法提供照片了。一句话,各大公司的工组环境都差不多,隔断+桌椅抽屉等等。 不一样的是百度内部现在都是笔记本办公。而且休闲区有很多饮料机和自动售卖机,下午还有免费发放的冰激淋。随后刘湘雯介绍百度的总体情况,印象较为深刻的 有如下几点:1. 百度的实施能力很强;2. 百度的PPT颜色的背景是白色,基本色调是蓝色和红色。3.最近在开拓日本市场,会日语的可能比较好找工作;4. 百度的销售队伍很强,执行力很强。5. 产品主要包括三个部分:搜索,社区交流、其他。社区交流部分确实比较有创意,实现的是基于社区的搜索。
IMG_0577 IMG_0368 IMG_0579

       IMG_0377 随后是PS组的总监(02年加入)来介绍《百度人才之道--与哈工大计算机学院“高企之旅”代表团分享》。百度的福利待遇挺好的,例如每层楼都有医务室和 专门的医生。百度实习生会做核心项目,要求每周在公司至少做三天。一般包括一轮笔试、三轮面试。百度学院是去年新起的项目,1。BIT:一年级培训体 制,6个教研室,九大门类、超过124节课程,教导如何胜任岗位。2。导师制:1+1制。3。高年级生。这个虚拟学院的教师都是高级员工。感觉这种文化和 机制非常好,可以传承文化,形成氛围。值得高校的实验室效仿。这个介绍中有一点让我感觉比较特别,就是特别强调员工在百度能够创造历史,能够通过自己的工 作来实际改变人类的生活。这种主人翁精神似乎对员工的主观能动性的发挥会起到很好的作用。

       稍后是我们来访的同学做交流报告。基本的流程是杨宇航介绍咱们计算机学院的基本情况和这次活动的初衷,随后是他介绍属于抽取的工作。轮到我报告时,我考虑 到听众可能对我共指消解的报告不会太感兴趣,临时改变为介绍我们实验室的语言技术平台了。随后是马二磊介绍人物信息抽取方面的工作。或许由于之后有专门的 交流时间,我们的报告都没有人提问。
DSC02275 IMG_0628 DSC02279

IMG_0389        下一个环节是相关的面试性质(后来才发觉)的那种交流。我们几个人的第一个交流对象是NLP组的吴雪军主任工程师,NLP组技术负责人,这个组隶属于 PS(网页搜索组),但是需要位整个公司提供技术支持。从相关情况来看,现在Baidu对NLP的重视程度越来越大。这个NLP小组感觉有三项基本事务, 一是提供基本的NLP模块,例如分词;二是构建本体,服务于相关的产品和技术;三是对一些基本机器学习技术实现并行化加速,例如pLSA模型等。他们也需 要时常阅读最新的论文,例如下个月初他们会去新加坡参加ACL会议。从最新的科研成果中挖掘有用的东西来服务和支撑公司的产品,我觉得这种工作思路对于重 视产品的企业是非常正确的。

IMG_0393       然后我被Ecom(电子商务)组的Manager袁杰叫去单独聊了一会儿,主要是简单了解了我做过的东西,以及询问了我一个问题,就是如何改进基于 Query的广告投放系统的效果。我的答案是建立本体、分析用户意图、分析广告客户的数据等等。越问越深,到后来我感觉这有点像是面试性质的交流。 IMG_0399

      随后和袁杰下面的何仁清聊了一会儿。后来又和机器翻译实验室去年毕业的喻宏勇聊了一会儿分词、相关性排序等等技术。这个时间段其他同学和百度的各个相关组的交流也非常热闹。也包括新产品组的王强师兄来和我们聊了一阵儿。

 

IMG_0421_1       总体感觉,百度的技术做的很好,也很灵活,没有纯学术,只有实用的技术。这一点很不错。在交流的过程中,我了解到百度的绩效考核都是拿数据说话,每个产品 每个细节几乎都可以有实际的曲线来说明问题。实时更新的曲线下,百度的员工会是兴奋和压力并存的,我猜想是这样的。

       在大家合影留念后,百度的刘湘雯和一个HR的实习生带领我们一起吃了一顿大餐。随后就结束了今天的行程。

       说句实话,今天有点累,因为起得早,还没有午睡。但是收获颇丰。

没有评论: