2006年5月29日

问渠哪得清如许

记得初中毕业的时候,我最尊敬的数学老师送给我一句话,“问渠哪得清如许,唯有源头活水来”。今天是执行俺的最新的个人事务管理计划的第一天。今天下来最大的感受是,阅读论文太重要了。现在得到的结论是,当你对研究没有激情的时候需要认真的阅读几篇相关的论文,那样你的那一坛水就能重新变得清澈起来。

今天,我主要阅读了三篇论文,两篇是NLPXML系列的,一篇是关于共指消解的。NLPXML的文章都是2001年首届会议的。其中提到的一些想法和做法都和我们现在实现的工作类似。这个问题也说明,我们现在的工做比国外落后了五年左右。还好,现在借助于这次阅读论文的机会可以很好的弥补这种差距。指代消解的论文是ICML2005的一篇指代消解的论文。其中提到的一个非常好的观点是,对于特定的机器学习任务,需要优化的有Sample selection, feature selection, feature representation, parameters choosing,和data validation。这整个的优化空间非常巨大,不能仅仅根据一些特定的设置来完成一些相关的机器学习任务。事实上,作者在UCI数据和共指消解的数据集上完成的工作都体现了这个结果。这个结论非常的有意义。以往我们关注于机器学习方法的选择的研究手段是不合理的,应该更多的关注到对问题的理解和建模。

这些新鲜的想法就像一记清水,注入我当前的研究和开发之中。现在对于研究,我的感觉又恢复到Exciting状态了。哈哈,实现逆转了。加油吧,我会更加努力的。Keep reading everyday. It will refresh you everyday!

3 条评论:

  1. Comment's author: hfjiang
    05/31/2006 09:32:46 AM
    Bill,在我看来xml不就是一种标记性语言吗?
    可能最大的用处就是用xml对nlp中需要的语料进行标注非常方便?可从你的贴子看来,nlpxml是更多的东西。
    bill,你写些文章介绍一下吧,也给向我这样的人扫扫盲!

    回复删除
  2. Comment's author: Bill_Lang
    05/31/2006 10:55:34 AM
    呵呵,谢谢老蒋的关注,我已经写了一篇关于这个的文章,过两个月如果录用的话,我给你发一份。

    回复删除
  3. Comment's author: hfjiang
    06/01/2006 03:50:45 PM
    期待ing!

    回复删除