2008年5月31日

近期短述

掐指一算,来新实习已经6个多月了,还有剩下的70天了,别人80天可以环游地球,我这剩下的70天也早已安排的满满当当的了。

过去的6个多月,我的工作主要集中在三点,通过这些也发现了自己存在的一些问题。

1. 持续完成指导老师交给的项目相关的各种子任务,每天的工作主要就是编写程序,并不断在网上搜索、思考和实现各种可能的解决方案。需要完成的项目开始接近尾声,刚结束的这一周一直在完成stanford parser的UIMA封装,写出的Wrapper和OpenNLP的UIMA Wrapper类似,只是相关的底层定义以及模块依赖顺序不一样。现在想来,当初花费接近一年时间完成的LTP和现在刚有些熟悉的UIMA比起来相差甚远,为什么当初自己没能更多调研或者查到UIMA呢?不过由于基本思想类似,现在学习UIMA相对容易了些。看来平时自觉完成项目的能力不是很差的我,还需要仔细调研和学习许多的著名项目才能更多的领会到NLP相关项目的精髓。

2. 刚到新时花费了半个月时间完成老师要求项目的Baseline,随后花费了一个月时间来冲击ACL2008,但是遗憾的是最终的实验结果不好,未能如愿的投出论文。仔细回味那个月的所谓研究,其中真是漏洞百出。这给我自己再次提了个醒,真正的创新不是说使用了一个什么新的工具或者采用了一个什么新的算法,而是从问题本质剖析为起点的工作。

3. 学习如何做研究。发觉自己从本科大三以来,一直的工作都分为两条主线:完成项目+做点研究。自己的两次实习都是主要完成项目,业余时间弄点研究。其实对于读博士,这样很危险,因为博士毕业的标准不是你完成了多少项目,你完成的东西大家怎么怎么说好。相反,即使没有任何项目,而有达标的论文发表才能毕业。这一年来每每被人问到发表了几篇论文,都感觉非常惭愧。今天开始可以投入稍多些的精力来完成自己的博士相关的研究工作了。还剩下70天,扣除一周开会,剩下9周,每周按6天算,还剩50天。时间很紧张,自己落下的研究工作还有很多,需要马不停蹄的赶啊。

 

今天看到如下几篇blog很不错,细细学习,体会颇深,分享如下:

回望第一学年 research偶像在MIT读博第一学年的概述,感觉自己相差实在太多太多,需要不断学习。

如何制定学习计划 知道很多,但是执行很差

如何写好学术论文 不断体会ing...

2008年5月7日

zz 如何写作你的博士论文

link: http://feed.yeeyan.com/articles/view/27709/7427

如果有一天,你忽然发现自己已经成为了一家有博士学位授予权的研究所的研究生,大概你将必须写一篇博士论文了。

那么:你在未知的年限中必须为此辛勤努力。想要踏入丰富多彩的社会中春风得意地被尊称为博士,想要戴上傻乎乎的博士帽披上博士袍,就必须炮制出一篇博士论文。

牛津词典中把博士论文定义为:难以阅读并且毫无价值的文章,但是对某些人很重要,因为它要求完成一项几乎不可能实现的任务。这个定义很精确。除了你的课题组成员,没人会读你堆砌出来的这篇玩意儿。但是很多事情将会发生在它身上。所以你需要:

首先:痛苦。构思、构架和完成这篇毫无价值的文档需要时间。比你想象中少,但是比你拥有的时间要多。不幸的是,这意味这你必须放弃生活中一些美好的乐趣。美食、睡眠、沐浴、上网和礼仪对于正常人是很美好的,但是完全不在一个论文撰写者的生活范围内,你必须舍弃它们。这很痛苦,但是必须抛弃。爱人会原谅你的, 被迷惑的他(她)们相信当你写完论文以后,将会获得巨大的成就感并可能得到更多的收入。他(她)们错了,但是他(她)们由于仍然爱你而做出的错误的判断会 持续到足够你完成论文。

第一步:材料整理。十有八九,你已经当了很久的学生了。有的时候,在极少数的情况下,你已经在实际的进行科研了。多年来,舒适地在办公室威吓着同事、喝喝咖 啡、上上网、玩玩游戏的时候,你做的某些事,其实已经是科研工作的一部分了。查阅一下那些材料,最好是你作为第一作者所撰写的所有论文。把有价值的东西搬 过来,在这些文章上,即使做了很小的改动,也用符号标记一下,比如逗号和分号。先别搞那些讨厌的版式,也不用试图写一篇新的文章,你已经没有时间弄那些 了。

第二步:材料扩充。现在你已经习惯于“剪切-粘 贴”了,并且你必须使它们连贯通顺,别害怕,这很简单。每章都这样做。记得插入这样的词句:作者某某某等已经在某某文章中论及到此种算法。把你现有的表格 分割成更多的表格,看到了吧?现在你的页数已经比以前大大增加了。确保你有足够的参考数目页数,这样显得你阅读了很多文献,即使实际上你并没读。如果需要 绘制曲线图形,就把同样的数值通过不同的方法绘制至少5遍,每个图形占一页。当你做到以上的步骤时,你的论文至少有100页了,

第三步:专业化。内容目录、图形目录、表格目录之类,谈不上质量,但是它们能让论文变得饱满,而饱满的就是好的。加上签名页,版权页,个人简介和致谢,现在 你又向前跨了一大步。致谢页很重要,这是最后一次不得不拍导师马屁的时候了,当然,除非你打算写完论文还继续跟着导师干活。

第四步:冷静严肃。文章中,可以引用别人的话,通常每一章都可以引用,这给你一个显得诙谐的机会。如果没有,嘿,给人一种显得很严肃的错觉是很好的。请相信,没人会觉得引用爱因斯坦的话能好到哪里去,也没人觉得把Homer Simpson的话放在文章里就多有才情。记住,引用在房地产所有权书面上总是显得很恰当。此外,可以用斜体和缩排这样一些让人觉得很重点的东西来显得更加专业。

第五步:充实文章。现在一切都各归其所了,先别忙着检查拼写错误,现在还没人阅读它。把每一页都打印出来,大不多一共有一英寸厚了。如果确实如此,那么你已 经达到了这个要求。如果没有,再把表格分割一下,加几张图。看一下那些毫无价值的表格的附录,它也能增加长度。再把它打印一次把,没什么理由,只是使你的 感觉更好。

第六步:送出论文。找一下你的论文审阅委员会的成员,带着初稿复印件拜访他们的办公室。记得装订一下,这会让它看起来更好,委员们也会相信它一定会非常出 色,甚至无需浏览(要求修改)。大多数情况下,委员们都不在办公室,因为从你的寝室一直散发到门厅的臭味已经让他们知道你在赶博士论文,而且马上就要去找 他们了,记住,他们也写过博士论文,这样只是让他们旧伤加新痕。象个忍者一样。你下一步就需要耗费精力了。

第七步:完成不可能。一旦你逮到了委员们,就通知他们你预计的答辩日期。注意:无论你选哪一天,都是过早的,因为他们会假惺惺的抱怨说要通读你的论文。强硬 起来,就说你毕业典礼上还有事情要做,说父母要来参加你的答辩,大胆的撒谎吧,对每个委员都重复如上步骤。众所周知,天体力学的三体问题是无解的。对你来 说,更加糟糕:你面临的是同时同地面临5个教授对你尽可能穷凶极恶的质询。默默地想,答辩完了就能有顿大餐了。

第八步:评审的恐惧。毫无疑问,研究所或者学校会给每一个坐下来听你答辩的评审委员一笔不错的酬劳,同时保证用那些严格并且极端愚蠢的条条框框来审查你的文 章。这些人存在的理由就是学校将把你的论文拷贝存在图书馆,逐渐腐烂,无人阅读,直到学校热寂。不过,这些条款还是必须要遵循的。你将使自己相信这种傻 话:这一切都完成以后就会有收益的。但是你错了,当那个时刻来临,你的时间却已经所剩无几。之前你为了使文章变得饱满而插入的表格和图形会把论文都破坏 掉,那些貌似诙谐的引用也只会让一些论点跑题。专家们会逐页察觉到这一切。你会在4天或者更多的时间里,边诅咒边修改你的论文,而你修改的东西多半会在图书馆被人匆匆浏览而无人注意。要知道,数百年来,所有的祈祷者都是这样毫无意义的面对着龟毛的官僚机构。

第九步:等待。可以证明,这是最艰难的环节。如果你全部完成了这些并且成功欺骗了所有相关人员,那么你就可以等着你的答辩通过并且不会有任何变故吧。你错了,但是这是个很好的想法。别问为什么,做一些改动,这会让评审委员们觉得很重要,。谄媚一点吧,马上就结束了。

第十步:还有什么?你也许会觉得多年的努力和数月以来撰写论文的辛劳会产生巨大的成就感和满足感,你彻底错了。你忽略了书面工作。学校是用堆积如山的报告来 彰显你的存在的,而用更多的报告使你离开。找来那些版式,按照格式填写吧。错的话,再找点没有明文通知的版式继续填写。当你发现你还有更多的格式需要遵 循,你会冒出杀掉学校长官的念头,可别把这种想法付诸实施,继续写吧。交了学校的博士学费和图书馆管理费,拿到你的钱的人会很开心的说:“虽然有点多,不 过你已经有博士学位了,很快就能挣回来!”可别用电话线勒死他们,这只是他们的一个玩笑。

如果你遵循了以上步骤,那么你必定会成功。不论你是否能真正完成这篇博士论文,但是你必定在某个方面有所收获。

顺便说一下,别忘记写你的答辩PPT……