2005年11月19日

天大之行

半年前刚到MSRA的时候,当天就和天大的小崔认识如故,彷佛是多你的老友相会在一起。我们之前只是在网上讨论过一些问题以及相互发送过一些相关的资料。当时我们聊了很多很多,我也在小崔那里学习到了很多很多的,比如rank方面的东西。我们聊的话题中还有一部分是关于在天大举办学生之间的Seminar的相关事宜。随后的日子里我们经常探讨这个话题,讨论了很多关于如何将Seminar办好的方法。

以前就答应过小崔在我回到哈尔滨前会到天大玩一圈,如果有机会的话到他们实验室参观一下,或者作个机器学习相关的报告作为seminar的部分。这个月底我就会回到哈尔滨了,所以在两周前我们就在讨论去天津的行程安排了。一来是实现我当初的承诺,而来也祝贺小崔拿到了MSRA TTG的Offer。原本想在天大介绍一下关于决策树方面的综述,但是我来MSRA后一直在完成项目,没有继续深入的学习和理解机器学习方面的前沿动向,而且现在机器学习中决策树已经出现了有些过时的迹象,现在的主流取向于CRF和SVM。还有一个考虑是我不能清楚的知道参加我们报告会的听众是什么知识背景,没有很好的听众模型就不能很好的做好报告。因此我想做一个非常宽泛的报告,在报告中引出一些相关的话题进行讨论。出于这种打算,我准备在报告会上做一个“信息检索实验室简介”的报告。征得我们老师得许可后,这周我在准备这个报告的相关内容。

今天一早,张扬,际洲,陈议和我,我们四人一起八点多出发踏上了去往天津大学的行程。恰好来自天津大学的张扬也好久没有回去了。

约莫上午11点半,我们到达了天津火车站,打车二十分钟后到达天津大学的北门。走了一会儿那种熟悉的校园绿荫道,我们来到了小崔的寝室。看到自己的老友我们大家都分外激动。张罗一下后我们去吃午饭了。

下午在小崔的带领下我们参观了天大的校园。来到这里我感觉自己彷佛回到了我们的哈工大校园,真是格外的想念和回味我在哈尔滨的生活以及实验室的精彩时光,还好我月底就要回到我们的IR大家庭了。天大的一个最大的特色就是湖多,五个大湖在校园里格外的漂亮。天津大学建立于1895年,原名叫北洋大学堂。校园里绿树成荫,映衬着美丽的湖畔,让人感到格外的舒畅。

四点半左右我们一起来到小崔的所在的人工智能实验室。他们实验室主要在做一些非线性维数约简,流型学习,人工智能,远程教育系统,以及IR的研究。和我们聊天的主要是一位姓孙的博士,他现在带领的小组正在完成一个名为Sogood的股票搜索引擎。其中已经实现了很好的用户需求,可以输入股票代号返回股价和相关文档,目前正在完成K线图之类的分析图表。有一位博一的同学对形式语言、递归函数、程序语义等问题非常有研究兴趣,从他那里我也学习到了很多的关于程序设计需求的逻辑表示的问题。

晚上的报告如期而至。七点在23号大楼4楼的一个教室里面,我们开始了行程中最重要的一个环节——我们的三个报告。教室和我们哈工大A楼大教室差不多,听众大概有60人左右。人工智能实验室的博导何教授也专程赶来。我第一个做报告。报告题目就是《哈工大信息检索实验室简介》。这个slides是我的老师制作的,这是我第一次给别人宣讲我们实验室,自然也感到有些紧张。登上讲台向大家问好后,我开始进入了状态,开始将我们实验室的相关工作进行了介绍。其中涉及到的很多的自然语言处理和信息检索的概念我都一一进行了解释。报告过程中我加入了很多自己对于我们实验室的理解。报告时间大概是55分钟,之后何老师向我询问了文本水印、复述等相关技术的问题。在座也有四位同学向我询问了关于信息抽取、IR for NLP & NLP for IR等问题。

之后的两个报告是我们一起来的际洲的Learning Effective Ranking Funtions for Newsgroup Search。和陈议的A Very Simple Survey of Question Answering System。际洲和陈议的报告中我也学习到了很多的新鲜的东西。比如陈议提到LCC的QA系统能够通过逻辑推理判断两个句子讲述的内容究竟是不是一致。

最后小崔邀请他们实验室的一位姓朱的同学做了《基于网页相关性的SE优化系统》,其中提到了一个非常有趣的工作——非线性维数约简NDR。这个东西能够实现非线性高维空间的维数约简,实现的功能和传统的PCA非常类似,只是完成的工作是基于非线性空间的,而PCA是线性空间的。感觉非常的有用,或许能够推动机器学习的应用!

几个报告都非常的经常,也引来了阵阵掌声。会后我和何老师请教了几个问题。何老师对于我们的来访非常的高兴,说我们的报告给他们带来了很多新鲜的理念和当前的前沿研究内容。对于我们实验室的工作,何老师非常的佩服。我也向何老师说明了以后也非常欢迎他能到我们实验室参观访问,或者进一步的在人工智能、信息检索等领域开展合作。何老师欣然接受了,说有机会一定会去的。

总结一下:报告过程中我看到了很多期待交流的眼神,我也向他们讲述了我对交流的理解,以及我们实验室对于交流的重视。看得出我们的报告还是起到了一些效果的。短短的几个小时,我也学习到了很多的东西,比如LCC和NDR。等我回哈后一定要好好学习这两个东西。

2 条评论:

Bill Lang 说...

Comment's author: Johnny Cui
11/22/2005 06:23:45 PM
感谢郎君,在MSRA的半年时间,你的热情感染了我。从你那里我学到了很多。

Bill Lang 说...

Comment's author: Bill_Lang
11/22/2005 08:59:03 PM
哈哈,小崔客气了哦!其实就像两块发热的炭凑到一块儿了 ^_^ 人生难得一知己,小崔足以! 祝愿以后的Seminar发展壮大! 也衷心祝愿你和嫂子像现在这样永远幸福!