2004年8月28日

会议第三天

上午的特邀报告是北京语言大学的荀恩东博士介绍他们在中文信息处理中的一些研究成果。接下来的两个分会场都是在介绍算法、少数民族语言处理和知识库、概念体系相关技术。由于是最后一天很多论文都没有报告人。车万翔师兄主持了第二个会场。其中比较有意思的是一个《基于hownet概念获取的中文自动文摘系统》。作者采用的方法和常规的机械文摘思路差不多,创新的地方在于采用Hownet来计算词语的重要性并由此来计算句子的权值。采用的评价方法是将50篇人工标注的文摘与机械文摘进行对比句子的精确率和召回率。经过详细询问得知人工文摘不加任何限制,文摘的获取没有任何限制,标注人员愿意怎么标就怎么标。最后获得的结论也是一般性的随着文摘长度百分比的增加精确率逐渐下降、召回率逐渐增加。

廖先桃的报告《HMM与自动规则提取相结合的中文命名实体识别》使整个会议的倒数第二个报告,她在演讲时各个方面都准备得很好。有不少与会人员提出问题和她交流。

会议的最后一项是上午11:00左右在教二楼301举行的闭幕式。闭幕式由北京语言大学的杨尔弘老师主持。会上教育部语言信息管理司司长李宇明教授给大家描述了中文信息处理的远景,其中提到的一件事情很让我们震惊。那就是今年在上海召开的全球华人物理学家大会上规定不准用中文而只能用英文,诺贝尔奖得主丁肇中博士坚持用中文作了报告。现今国际社会中文还不是我们想象中的那么热。中文的前途需要我们大家一起努力。李明宇教授在《光明日报》上发表的一篇文章《强国的语言与语言强国》中表达了他的一些看法。闭幕式上中国中文信息学会秘书长曹右琦老师给我们总结了一些会议的特点。学生会议的一个最大的特点就是与会者的新面孔很多,老面孔很少。曹老师提到了老面孔中比如有车万翔。(当时师兄好像也有点受宠若惊)最后曹老师还给大家发放了中文信息学会的入会申请书,鼓励大家加盟。

随着闭幕式的结束,我们为期三天的第二届全国学生计算语言学研讨会就落下帷幕。明天开始就是为期两天的“首期全国计算语言学讲习班”。

没有评论: