2009年12月27日

推荐:疯狂的设计

前天一不小心,看到了这个博客:疯狂的设计--每天一个惊奇, 设计改变世界

一下子被里面的内容深深的吸引了,这两天抽出时间,刚才才算彻底的将全部的905篇帖子全部看完。回想起来,我已经很久没有这样通读别人的博客了。

这个博客主要是在收集那些新奇的设计,很多帖子中描述的东西都有让人眼前一亮的感觉,真是让人大开眼界啊。例如电子笔.记时间轴自由钟定时灯吸盘三脚架激光投影机大眼针便签桌瞬间的记忆时分秒生态桌自然醒枕头虚拟导航线卷帘式太阳能充电器飘浮能开车的高跟鞋运动马甲,USB钢琴,高科技玻璃,等等。

创意,疯狂的设计。推荐!

2009年12月8日

FreeMind2MindManager

近日主要使用MindManager,感觉很不错,特别是配合上任务管理模式更是舒服。今天忽然需要将以前做的一个很复杂的FreeMind图转换为MindManager图。折腾了半天,都是在打开转换结果时出现错误。这里先简述一下我找到的三种转换方法,然后说说我遇到的问题以及解决方案。

三种FreeMind2MindManager的方法:

1.  利用Word中转(来源:我用FreeMind

# 选择File->Export to HTML,将mm导出为html;
# 用MS Word打开该html文件,并另存为Word的doc格式;
# 打开MindManager,采用File->Open->Microsoft word document(*.doc,*.dot),选定刚才保存的文件后打开。

 

2. 利用XSLT转换

主要使用一个网站提供的XML的XSLT插件:http://freemind2mindmanager.fdns.net/ 
再次佩服一下XML数据为基础的格式转换的强大

 

3. MindJet官网提供的转换插件(来源:http://blog.kenbeyond.com/2007/04/mind-mapping/free-mind-to-mind-manager.html

Mindjet有一个Free Mind到Mind Manager的格式转换插件 下载地址

由于暂时无法下载,不知道这个插件和上面的XSLT是否相同

 

总结一下,分别验证了前两种方法,结果是第二种转换的效果最好,能保留非常多的FreeMind里面设计好的效果。

 

我采用两种方法转换得到的结果都是不能在MindManager中打开文件,后来不经意之间分析MindManager报错的信息,看到原来是FreeMind里面设计的大量链接信息出现了问题。将FreeMind里面的各种节点之间的联系全部删除后,再用第2中方法就得到了一幅美妙的MindManager图画。原来如此啊!

近日不断使用MindManager来管理我的各种事务,效果很不错。应用思维导图可以改善生活。

2009年12月4日

Think Week: 思维导图的在科研中的应用

我是在2004年开始接触思维导图的。我编程方面永远的偶像和师兄cr推荐我使用FreeMind。后来又接触了MindManager。这两款软件一直使用到现在。昨天在网上下载并学习了eyong的“思维导图的三招十八式”(原始PPT完整版打包Pdf下载版逐一详细文字介绍版)。看完这些资料后我对思维导图的认识和应用更加清楚。看来自己对思维导图的应用还没有发挥到极致。

结合eyong的材料以及我自己的理解,对于搞科研的朋友们来说,思维导图的应用可以归纳如下:

1. 水静潜龙般全网式的领域调研。网上诸多“如何做调研”的文章里都会提到找经典论文从下往上再从上往下顺藤摸瓜的策略。这里面会涉及大量的文章,如果单纯在记事本上做笔记或者利用电子文档记录的话,时间长了就容易失去线索,没有全局。同样,在看每篇文章的时候也需要批判式的学习,掌握文章精髓的同时还得有自己的见地。如此浩大的工程,如果结合思维导图一定能够让调研实施人员随时都能方便的回顾全局和局部细节。“水静潜龙”是思维导图三招十八式的第七式,意指可以随时大小兼顾。况且思维导图强大的自动文件关联能力,也会便于整理涉及到的相关文档。随着思维导图的不断绘制和不断分离出小的思维导图,将相关领域的论文整理到100篇或者几百篇时,想必对这个领域也就了如指掌了。

2. 如影随形般创作科研论文的全程跟踪:科研领域里最大的成果就是顶级的科研论文,不管是会议的还是期刊的都是如此,当然,如果发表论文的同时还能有一流的系统和数据共享出来那就更是完美了。创作科研论文必须在上述全网式领域调研的基础上提出自己的New Idea,并且实验实现后证明这个Idea是Better的才能开始动手撰写科研论文。在不断打磨的基础上,最终才能得到论文的精品。这里面涉及到三个细小的环节:提出Idea、实验、论文撰写。事实上,三个步骤是环环相扣的,而且随时都可以进行迭代。提出Idea可以在深入调研的基础上采用思维导图中的头脑风暴模式来进行漫无天际式的思索和高效的整理。实验过程可以在Idea的基础上结合领域中的Baseline来制定详细的实验计划,并且结合思维导图的任务管理功能随时的跟踪和监督实验的进展,直到获得详细的实验结果。科研论文的撰写和调研时科研论文的阅读类似,先得利用思维导图整理出论文的框架,把握住全局后再将各个细节逐一击破。个人感觉甚至可以将思维导图作为论文投稿前的最终形式。因为强大的思维导图可以展示各种各样的内容形式。科研论文从阅读论文后的海量思维导图中来,然后到创造自己论文的完整思维导图。这个过程也很难,如果全程都有思维导图如影随形般的跟随的话,那将是一件幸福快乐的事情。因为实施人员不容易迷失在局部,始终能全局控制。

3. 事无巨细般科研任务的管理跟踪。这方面类似于时间管理需要处理的内容。在科研领域,一旦开始进入某个领域就需要抓紧时间认认真真的进行。每年该做什么,每半年该做什么,每月、每周、每天该做什么,都需要认真的管理和跟踪。思维导图水静潜龙般的分支扩展以及分离功能,还有完备的任务管理和跟踪功能,都让我毫不犹豫的任务思维导图是科研任务管理和跟踪的绝好方法。思维导图里面的模板和向导的制作功能能够方便的个性化你的管理和跟踪模式。这个过程需要不断的总结。

 

事实上,思维导图的应用范围非常广,有兴趣的朋友可以看看这个豆列(http://www.douban.com/doulist/126094/)中的书籍。相信你能有自己的体会。

 

上面介绍的内容都可以采用MindManager来进行,如果考虑到版权的问题可以采用FreeMind来代替。两款软件各有利弊。再加上Eyong推荐的MindMapper应该就更加强大了。

 

让交流成为习惯!大家一起来学习如何使用思维导图吧。

2009年12月3日

Think Week: 英语学习和提高记忆

对于搞科研的人来说,英语的学习是永无止境的。几乎每个人都知道提高英语水平的重要性和紧迫性。结合自己无数次失败的英语学习经历,我一直没能找到最适合自己的学习方法。另外一个问题似乎可以和英语学习挂上钩,那就是提高记忆能力。大家都知道提高记忆的秘诀在于重复,结合艾宾浩斯记忆曲线的重复记忆是最有效的。前一阵子一直在寻找能够满足自己需求的记忆软件,但是一直未果。其实每天需要记忆的东西有很多,只需要稍微花一点点时间就能够完成那些重复。但是什么时候重复什么内容,是一个需要好好调度的事情。

经过Think Week,我想我已经找到了适合自己的英语学习方法以及提高记忆的软件。

英语学习方面,我需要被监管。或者按照昨天日志里的SMART原则来说,我需要每天的学习目标明确、可度量、可达到。仔细搜索网上的经验,发现Tell Me More和Rosetta Stone两款英语学习软件能够满足我的需求。后者适合从零学习,前者适合校对发音和提高听力写作。记得在2005年的时候就和实验室的维刚师兄一起琢磨过Tell Me More,当时用了一阵就放弃了。现在想来真是后悔啊,如果当时的学习目标按照SMART的话应该就能坚持下来了。上网查了一下,现在Tell Me Mode的最新版到V9 Performance版(http://blog.sina.com.cn/s/blog_5f2d67f90100dbqm.html~type=v5_one&label=rela_prevarticle)了,据说比当年的V8丰富了许多许多。Rosetta Stone也是无比强大的英语学习软件,非常适合初学者(http://blog.sina.com.cn/s/blog_5f2d67f90100dbqm.html~type=v5_one&label=rela_prevarticle)。

在提高记忆方面,发现SuperMemo完全能够满足我记忆任何东西的需求,而且这个软件有各种各样的版本,据介绍使用它来记忆的效果非常好。可以参见这个链接的介绍:http://blog.sina.com.cn/s/blog_5f2d67f90100cw0w.html 可喜的是,SuperMemo现在在Android平台上也有了对应的版本―MemoDroid

磨刀不误砍柴工,好的方法需要坚持啊。看到两份训练日记(meiming的训练日记lixiang_sh的训练贴),我的手也痒痒了,但是务必需要采用SMART,否则肯定会只是三分钟热度的。自勉与此!

Think Week: 目标与SMART原则

经历了一周的Think Week,总结了一些基本的注意事项。第一项就是目标管理原则。

所谓人无远虑必有近忧,目标是人前进的动力。但是回顾我这几年来无数次制定目标后的执行情况,绝大多数都是三分钟热度。回想前一阵子听的《杜拉拉升职记》,我想我是没有很好的依据SMART原则来制定我的目标。

网上SMART的资料很多很多,例如:SMART原则。简单列表如下:

字母 英文单词 中文解释
S Specific 明确性
M Measurable 衡量性
A Attainable 可实现性
R Relevant 实际性/相关性
T Time-based 时限性

 

自己以往做计划执行力最好的时候是本科大一大二大三时的学习阶段。那时为了迎接各种考试或者各种竞赛,一般之前一个多月左右都会进行周密的计划,根据任务和时间,能够精确到每天每个时刻看哪本书。回想起来,那时的目标都是遵守SMART原则的。

等到大四开始至今,我面对的所有任务很少能够像参加考试那样明确的了。都说人们现在做事时多数都是首先做重要而紧急的事情,对于那些重要而不紧急的事情却重视欠佳。时间长了,重要而不紧急的事情就会变成重要而紧急的事情,但是疲于忙碌的人们面对这种情况往往都会感觉书到用时方恨少。不知朋友们是否经常也会有这种感觉。举个例子,某个会议截稿前5个月,估计你肯定还不会开始进行任何的准备,但是谁都知道一篇顶级会议的论文从最早的构思到论文最终版的成稿至少需要4、5个月才行的。这就是论文投稿这件事情的目标不明确。现在想来,如果把投稿这件事划分为若干阶段,然后逐一制定可衡量可实现的子目标并确定Deadline的话,应该不会总是出现那种战而求胜的心态,反之应该都会是胜而后战的情况了。

除了论文的投稿,学习数学知识、提高英语水平、学习Linux编程、提高写作水平、好好锻炼身体等等目标都存在类似的问题。

在此规定,自己以后每次制定目标前都回顾一下SMART原则,并且制定好目标后需要迭代式的逐一验证这些原则。在保证执行力的前提下,如果采用SMART原则,相信对于任何希望提高个人效率的朋友都会有所帮助的。

SMART原则已经是一个老生常谈的事情,2005年我在MSRA参加MS^2培训的时候就学习过,但是一直未能引起足够重视。有点后悔啊。还是那句老话,“只要开始,就不算晚”。

2009年11月22日

Think Week

刚刚结束的一周分外忙碌,一是11月18日上午顺利完成了博士答辩,二是周六一天爱人顺利完成了心理咨询师的考试。两件事情把我们俩都累坏了。今天算是好好的修整了一下。

下一步需要做的事情还得好好思索一下。我也来个Think Week吧,先好好梳理一下。

这里也感谢各位多年来的支持和帮助。谢谢!

2009年11月15日

最佳学习网站

课堂之外,仍有许多网站有益学习和提高。 图片提供:PA

 

1. 视频和播客杂志(blog.makezine.com/podcast ):有很多适合周末自己动手的项目,有的很生猛,有的很诙谐。

 

2. 奥威尔日记(orwelldiaries.wordpress.com)  :以博客形式连载乔治·奥威尔(译注:英国左翼作家,新闻记者和社会评论家。主要作品有《动物农场》、《一九八四》)日记,涉及其个人生活和政治观点。日记 距今约有70年了。

 

3. iTunes (apple.com/itunes):网站上所有的东西都是免费的,最令人惊喜的是它居然提供世界上最享有盛誉的学术机构的讲座录音(耶鲁大学, 纽约现代艺术博物馆, 牛津大学, 泰特美术馆)。

 

4. 诡秘地图(atlasobscura.com) :恐怖的非寻常之地,它也无意成为传统的旅游指南书。

 

5.科学知识问答 (howstuffworks.com): 网站创始人马歇尔‧布雷恩(Marshall Brain),旨在用通俗易懂的文章和视频解释每一个科学知识,从基因编码到汽车变速器问题。

 

6. 不管是想了解阿尔巴尼亚语,还是踏踏实实地地想学一门语言,你都不能错过BBC语言课堂(bbc.co.uk/languages)

 

7. 国家地理(nationalgeographic.com) :大量神奇的摄影图片,以及很多关于宇宙,环境,动物甚至音乐的哲理文章。

 

8. 史密森尼百科全书 (si.edu/Encyclopedia_SI):不是一本大型综合类百科全书。它主要是为艺术和动物两大门类提供详细资料。



9. 名校视频课程(academicearth.org) :来自常青藤大学联盟和西海岸名校的免费视频课程,无需支付 $75,000 (£45,000) 的学费。

 

10. 生活百科全书 (eol.org) :正在进行中的伟大工程。他们希望为每个已知物种建立一份科学档案。目前他们已经为16万多个物种成功创建了网上档案。

 

11. 论坛视频讲座 (fora.tv) :收集了大量公共活动和学术研讨会的视频讲座,从艾丽西娅·西尔维斯通(译注:好莱坞女明星)在书店讨论素食主义到诺姆·乔姆斯基(译注:麻省理工学院语言学的荣誉退休教授。其《生成语法》被认为是20世纪理论语言学研究上最伟大的贡献。)在加州联邦俱乐部发表关于语言的演讲。

 

12. 明天我看什么书呢? (whatshouldireadnext.com) :分析你最近读过的一本书,推荐你感兴趣的书,值得一试呀,权当娱乐。

 

13. 现在就兴奋吧 (gethighnow.com) :这可不是什么贩卖不良药品的网上商店。它可是一家出色的科学网站,负责解答视觉和听觉幻觉方面的问题。

 

14. 心理牙线 (mentalfloss.com):网站上充满了各种清单和琐事,深受一般知识爱好者和高新技术迷的热捧。

 

15. 奇怪的地图(strangemaps.wordpress.com) :收集各种稀奇古怪的地图,比如美国距离麦当劳餐厅最远的地方。

 

16. Issuu (issuu.com) :网上杂志出版社。你可以很方便地创建一本诸如Urb的非主流音乐杂志,Teen Piano那样的小众出版物(封面主题:老师居然也这样认为。)

2009年11月13日

折腾:批处理文件不能运行了,修改代码页编码是最终解决方案

晚上想再改改博士论文,修改几处后想看看Latex的生成效果。由于WinEdt默认的编译对于我目前的模板存在问题,只能运行批处理文件中预订好的处理流程。

一下子,问题出现了,我的BAT文件不能运行!

起初以为是个小问题,想吃完饭回来就会轻松搞定。最后采用了各种方法折腾,例如,杀毒、升级Windows、修正BAT的关联等等。但是还是一点改观都没有。这种情况的结果是任何BAT都不能运行,运行效果就是没有任何反应。但是如果将BAT中的命令在dos中单独运行却能够正确处理。

真是百思不得其解。网上看来是不能找到这个问题的解决方案了。

后来,忽然想起自己前一段时间尝试解决在Dos下显示utf-8编码的文字。好像修改过一些地方。回想当初的处理如下:

----------------------------------------------------

DOS设置UTF8

1、打开CMD.exe命令行窗口

2、通过 chcp命令改变代码页,UTF-8的代码页为65001

chcp 65001

执行该操作后,代码页就被变成UTF-8了。但是,在窗口中仍旧不能正确显示UTF-8字符。

3、修改窗口属性,改变字体

在命令行标题栏上点击右键,选择"属性"->"字体",将字体修改为True Type字体"Lucida Console",然后点击确定将属性应用到当前窗口。
----------------------------------------------------

当时配置完后我的Dos仍然不能显示UTF8编码。后来也就没有再处理这个问题。

刚才受到这个帖子(http://zhidao.baidu.com/question/29176612.html?fr=qrl&cid=89&index=3)的启发,想起来应该是我的Dos命令行窗口的编码问题。运行chcp后发现,果然我的代码页编码还是65001。运行chcp 936还原后就能在当前的命令行窗口中正确运行BAT文件了。但是关闭窗口,再打开一个命令行窗口,这个问题仍然存在,似乎Dos窗口中敲入chcp 936只对当前窗口有效。再一想,只能试试修改注册表了。结果参考下面这段文字就可以彻底解决这个问题了。

----------------------------------------------------

[HKEY_CURRENT_USER\Console\%SystemRoot%_system32_cmd.exe]
"CodePage"=dword:000003a8

小说明一下:
十六进制"000003a8"或十进制"936",表示“936 (ANSI/OEM - 简体中文 GBK)”。
十六进制"000001b5"或十进制"437",表示“437 (OEM - 美国)”。

----------------------------------------------------

 

自此,我今晚折腾了三个小时终于算是彻底解决了问题。明日再继续修改我的博士论文。

从今天的问题解决过程中,得到两条启示,如果将来再遇到类似问题,解决策略如下:

1. 出现问题一定要想想可能的原因,然后逐一排查,还是不行的话就要个性化的思考一下是不是近期过什么特殊处理;

2. 如果进行某些特殊处理后未能得到理想结果,应该尽快恢复到原来的情景。

2009年11月7日

钱老和Moses

    看到这两个词语连在一起能想到一点点联系的朋友,肯定是NLP或者更具体说是MT界的朋友。是啊,我也很惊讶于自己能将伟大的钱老和Moses联系起来。只是近来钱老的话和Moses都是我思考很多的对象。

    那天看到实验室老师转发给大家"钱学森的最后一次系统谈话"的邮件后,我感触很深。对于钱老,我一直是由衷钦佩的。在这个系统谈话中,我对于以下两段的印象极其深刻:

  • 钱老还讲了一个故事,"我记得在一次学术讨论会上,我的老师冯・卡门讲了一个非常好的学术思想,美国人叫good idea,这在科学工作中是很重要的。有没有创新,首先就取决于你有没有一个good idea。所以马上就有人说:'卡门教授,你把这么好的思想都讲出来了,就不怕别人超过你?'卡门说:'我不怕,等他赶上我这个想法,我又跑到前面老远去了。'所以我到加州理工学院,一下子脑子就开了窍,以前从来没想到的事,这里全讲到了,讲的内容都是科学发展最前沿的东西,让我大开眼界。"
  • 钱老说,"你是不是真正的创新,就看是不是敢于研究别人没有研究过的科学前沿问题,而不是别人已经说过的东西我们知道,没有说过的东西,我们就不知道。所谓优秀学生就是要有创新。没有创新,死记硬背,考试成绩再好也不是优秀学生。"

    是什么在不断推动人类科学的进步?一味的重复?不是,那就应该是创新。我感觉,钱老说的这两段话道出了创新的基本机制。那就是需要快速有效的站在巨人的肩膀上继续深入探索别人没有做过的事情。

    在我读博期间,有一次听到一位国外的华人教授介绍如何做科研或者如何才能发出高质量论文。答案是,new and better。似乎和上面的创新机制雷同。但是我们忽视了两点。第一,new之前需要快速有效的达到国际最高水平。因为科研中只有世界杯,没有区域赛。只有站得更高才能看得更远,才能知道哪些是New的。特别强调这里的快速和有效。至于方式可以多种多样,例如钱老在加州理工学院的求学,或者是参加国际顶级会议以及国际合作,或者剖析最先进的成果。第二,深入探索new的事情并达到better。这种探索应该是艰苦的。如果一件事情被人很容易的做出来了,然后宣称是new and better,那一定是不可信的。只有不断的勤奋踏实的工作才可能达到真正的new and better。当然,勤奋应该分两种,一种是每天都起早贪黑,认认真真没日没夜的不动脑子忙碌;一种是在勤快做事的同时不断动脑经分析和总结并改进。我想,后者的体勤加脑勤应该是成功的必备因素。

    创新真的很难,但也绝非遥不可及。不断的体勤加脑勤的采用正确的方式就一定能成功。

    说了这么多,您一定会认为我很罗嗦。怎么说了半天,还没有提到和Moses有什么关系啊。

    事情是这样的。近段时间,我开始学习Moses--著名的基于统计的机器翻译开源系统。一直知道这个大名鼎鼎的系统很牛,而且已经成为事实上的机器翻译领域的基准系统。还听说,上个月在南京大学举行的国内机器翻译研讨会上有位老专家说,他看这届机器翻译评测里面最成功的系统应该就是Moses,因为很多家的系统都是基于Moses改进的。这些背景信息致使我认为Moses已经是一个非常稳定的系统了,至少应该算是基本停止不前了吧。不然也没法作为大家的基准啊。

    前几天了解到Moses目前实现了两种解码算法(Stack Beam Decoding,Cube Pruning),准备实现三种解码算法(Chart Parse Decoding,Depth First Decoding,Forced Decoding)。Moses在翻译模型上目前实现了两种(In Memory,On Disk),准备实现两种(Suffix-array over corpus,MaxEnt)。这些内容都是写在Moses的Roadmap里面的。原本以为也就是写在那里,应该不会让人发现在经常更新吧。前天,我加入了Moses的两个相关邮件列表:支持列表和SVN提交列表。这两天发现两个列表的邮件频率比较高,而且更然人惊讶的是Moses的代码还在不断的更新和改进。今天早上发现最新的更新居然是在实现Chart Parse Decoding解码算法。这种算法可是机器翻译领域当前最新的发展动向啊。

    另外一个让我惊讶的事情,是Moses的网站及相关文档的更新机制。经过一段时间的观察,我发现Moses的网站上下载的Manual是在更新的,而且Manual是采用Tex撰写的。我猜想网站的内容和文档都是Latex同步生成的。这样能保证内容一致,而且采用一些工具也不难实现。在前天下载的最新版Manual中,我发现了一处文字错误。而且这个文字错误同样出现在Moses的官方网站上。一时激动,我昨天给掌管Moses的老大Philipp Koehn教授发信说明了这个问题。没想到今天早上打开邮箱,居然看到了他的回信。内容是说,他很感谢我,同时他已经修改了网站上的错误,Manual的内容是每天晚上自动根据网站内容生成的。我再下载最新的Manual,发现果然更新日期已经变为Nov 6了,但是我指出的错误还在那里,我想应该是那个自动程序还没有作用到最新的修订上吧。再一看网站内容,错误果然已经修订过来了。我想既然Manual会自动每晚生成,那么明天的Manual肯定就不会有这个问题了,也就不想再发信指出了。我惊讶于Philipp Koehn的执行力,以及Moses文档的这种更新机制。而且他还在Moses的支持邮件列表里不停的回复着大家提出的各种问题。

    通过这些,我知道了Moses是在每天进步的,而且相关的维护人员也是热情高涨的在从事着相关的工作。仔细观察这两个邮件列表,我发现全世界很多国家的人在一起参与Moses的日常更新,不管是Bug的提交和发现,还是代码的SVN Checkin。

    Moses的这种共享,使得我这个从来没有碰过机器翻译的外行居然在短短的时间里实现了Moses的训练、测试、单步跟踪等工程实践上的事情,同时Moses开发时的良好架构和丰富标准注释使得我能采用Doxygen来获得完美的代码文档。我很钦佩Moses的创建者和维护者们。

    一时又想到了上面提到的钱老当年的老师卡门的那个对话:卡门教授,你把这么好的思想都讲出来了,就不怕别人超过你?'卡门说:'我不怕,等他赶上我这个想法,我又跑到前面老远去了。'

    我想创新就是Moses这样吧。特别推荐搞NLP但是不做MT的朋友都看看Mose的方方面面。肯定会有巨大收获的。

2009年11月5日

和Moses官网的Doxygen使用巧合

近段时间,开始学习Moses。首先按部就班的实现了Linux下的训练以及Windows下VS2008中的调试跟踪。感觉VS2008下看代码还是不够清晰,或者直接看代码就是不能清楚的理解大型系统。为此,在以往经验的基础上,我采用Doxygen来对Moses的源码生成代码文档。等我全部弄完后,一不小心居然在Moses官网上看到了几乎一模一样的文档,顿时晕倒。这也能巧合!!!仔细对比,发现官网的文档中的类图以及函数调用图都比我生成略微丰富一些。思考后明白官网上的文档是对所有Moses条目进行处理的,我的选项是只对有文档的条目进行处理。看来分析源码,还得对全部条目处理才行。将我的生成配置略微修改,得到了一模一样的文档,只是我的文档还能链接到源代码上看起来会更方便。感觉我的选项更加合理些 :)

这里推荐给需要学习大型系统源码的朋友使用Doxygen,尤其是对每个类自动生成类图以及对每个函数的调用图和被调用图的生成更是不错。当然,实现这些功能需要两个工具的配合:graphviz和mscgen。需要注意的是,Doxygen的默认配置不能生成调用图和被调用图,需要配置相关程序路径。

感兴趣的朋友可以访问我生成的Moses(2009-10-31版本)的程序文档。http://ir.hit.edu.cn/~bill_lang/mt/moses_analysis/index.html

另外还想对Moses系统的强大以及未来的发展目标还有这种开源精神表示一下敬意!

2009年10月28日

彻底修复IE颜色的显示问题

曾经有一次为了保护视力,我按照网上的一个教程设置了电脑的各种颜色设置。但是后来发现我的IE或者以IE为内核的浏览器在进行相关颜色显示时都只能显示为白色。

一直以来,我都以为是某个软件安装或者某个特殊的处理使得这个问题长期存在。今晚折腾了半天,终于解决了这个问题。

分析:

        IE显示网页时有些部分有颜色,有些部分没有颜色。是否有颜色,我是通过FIrefox对比发现的。但是其他任何软件都没有这种问题。先后修改过Windows的系统颜色配置,以及IE的颜色设置,甚至修复IE都未能解决。

终极方案:

        一不小心,在安装360安全浏览器后调整IE选项卡时发现“辅助功能”里面有个选项“不使用网页中指定的颜色”。将这个勾号去掉后忽然发香360浏览器的显示正常了。这一刻我居然也激动了一小阵儿。

 

终于解决这个问题了。今天下午和晚上还解决了电脑杀毒软件和防火墙的问题。尝试了很多款软件(包括一些开源的)后,最终我选择了360新出的杀毒软件和安全卫士及其浏览器。这套组合感觉很不错,而且都是终身免费的,不存在破解或者License的问题。现在我的计算机的CPU占用率终于降下来了。随后可以如意的操作了。

2009年10月19日

如何战胜怠惰,保持活力

Original Link: http://www.yeeyan.com/articles/view/19724/64016

 

简介

我们经常会遇到这样的情况——突然间觉得很疲累,什么都不想干,什么都提不起兴趣。
本文提供了如何应对这样的情况的建议。

 

“干你所爱的事。”
我们都曾听过这个建议。这是一个很伟大的建议,虽然不是很多人真正的将它放在心里。
不过,有时候即使是干你所爱的事情也不能足以让你一直保持热情。灵感、热情和理想是那种难以坚持的东西。它们似乎经常在你最需要它们的时候溜之大吉。
你很清楚那种感觉。在差不多搞定一个项目,或接近一个目标、或将你一项任务从你的待办清单拿下等等的那些时刻,但你就是不能提起劲来。你变得毫无兴趣,筋疲力竭。而你不知道这是为什么。
这就是怠惰。一个大多数人都非常非常熟悉的现象。我很乐于向你分享一些我战胜怠惰的方法——或者说,防止它从一开始就发作的方法。
1.完成微小的叠加。当你只将注意力放在一个大目标的时候,很容易你就被日常单调的事情磨得筋疲力竭。这就像开着车朝着远方的山前进一样。你可能开几个小时了,但那座山看起来一点都没有靠近。你的轮子一直不停的转啊转,当然很快你就累了
解决方法是,用一种方式来测量和记录在前进道路上的每个小小的一步。这里是建议:
   *拿起一本日记、笔记本或日历。在上面写下重要的事情。
   *找出朝着你目标前进的道路上的里程碑。如果你在写一本书,你可以将每个章节视为一个里程碑。或者,可能会更好,将500个字或1000个字视为一个里程碑。
   *如果里程碑不是很明显,创建它们。举例来说,如果你进行马拉松训练,希望保持里程数上的前进。如果你一开始就跑出你最大的里程数,那么你将进步得非常快。相反,如果一开始只从一个很小的里程开始——即使这对你来说很容易——那只能让你进步得缓慢。
   *以一种简单的、可视的方式来跟踪你的里程碑。想象一下,你下载东西的时候,出现的进度条。只要你瞥一眼就能知道你现在的进度是多少。你所选择的方式,不必拘泥于细节或在内容上有多么广泛。它所要做的,只是告诉你每天你进步了多少。
学会去欣赏你每一小小的成就。享受那种完成某件事的感觉。
2.训练你的灵感。灵感是不可捉摸的,这是一个最大谎言。在前一天你还充满灵感和活力,第二天你就开始筋疲力竭——别无他法。这就是他们所说的。
实际上,灵感和其他的技能一样。在一开始,它可能不那么能靠得住,但是它可训练的,具备成为你信任的能力的发展性。
如何训练你的灵感?我所找到的最好的方法就是,沉浸到你的目标中去。仅仅围绕着你自己的东西,全部都是能激励你和反映出你的目标的。伟大的作曲家努力地听音乐。伟大的作家贪婪的阅读。伟大的经营者努力的参与各式各样的讨论会。伟大的高效者,订阅Zenhabits,如此等等。沉浸到你目标中去,能训练你的头脑,让它以你期待的方式,变得高效。
当你的灵感越来越融入你的生活,它就越来越不会在你需要它的时候溜掉。要变得有创意,记住这一点。究竟什么方式能让你每天都与灵感接通?
3.少工作。砍掉那些你花在工作上的时间与精力。如果你病了,或你有工假,利用它们。或者,如果你是个自由职业者,每天强迫自己少几个小时去工作——即使这意味着你拒绝了新计划。
工作得少,并不表示的变得懒惰或完成得少。它的意思是让你:
    *去掉不必要的任务。
    *获得关键性的进展。
    *停止同时多任务的方式。
    *从别人那里获得帮助。
4.给成功下明确的定义。拥有一个大大的梦想,或抱负是没有任何错的。不过如果你经常为缺少进展而感到沮丧,那么可能是时候回过头去检查一下你的目标了。它们都达到了么?你是否一直坚持一个合理的时间表?
这里有一个好方法。拿起一张纸,在上面写下你大大的梦想、抱负。然后写下至少十个特定的、具体的能让你达到目标步骤,越详细越好。如果你不能务实的暗处一系列能让你从这里到达你目标的步骤,这就表明你需要去重新调整你的目标或重新考虑你去实现这些目标的方式。
5.睡多一点。我知道你听说过这个。我也是。不过这没能阻止我违背我正确的判断,我还是每晚熬夜,令自己疲累。充足的睡眠,能让人做出清晰的决定——但睡眠也和其他好习惯一样,需要时间去培养。
我在这里遇到最大的阻碍,就是拖延症。我喜欢将事情一整天拖着,结果我要熬夜到很晚。那么,是什么阻止你去休息?
6.慢慢来。全世界都告诉我们要匆匆忙忙做事情:“更快。赚更多钱。更早去退休。”虽然这些东西并不一定是坏事,但是它们让我们更容易冲昏头脑。如果你开始感到怠惰,不知所措,那么就到了放慢脚步的时候了。
这里是把你从一个星期二十四小时高负荷工作里面弄出来的方法
    *每天都在一个安静的地方花上十分钟,远离那些烦人的事。深呼吸。
    *将那些缓慢、放松的音乐放进同一个播放列表里。当你感到劳累的时候,就开始听它们。
    *干净利落地砍掉你的待办清单。在你每天必须要做的事情上设定一个限度,然后坚持下去。
    *放宽你的期限。你是不是绝对要在这个时候把它完成?不过要记住,这不是拖延的借口。
7.倾听不同的声音。要认识到自己陷入了怠惰状态,这很难。你的好朋友、家人会比你更早的发觉怠惰的迹象。所以,要听听他们的意见。下一次你的爱人、父母、或你最好的朋友跟你说你工作得太忙,要认真对待。
8.设定明晰的分界线。当我们让工作超出了其必要的限度,并让它渗透到我们生活中的每一个方面的时候,怠惰就会发生。因此要设立一个强力的分界线,越清晰越好。尽量把它写下来。
举例来说,与其这样说:“我每晚将与家人共处三个小时。”,倒不如让这句话更明了:“晚上八点之后,我将不再工作。之后的时间100%是家庭时光。”划清界限让你更容易坚持,而且更合理。
一旦你设立了你的分界线,公诸于众。让你的家人知道,你专门为他们抽出了时间。他们将为你的承诺负责。让你的顾客知道,你在一定的时间段是不在工作的。这将减少你在捏造分界线的机会。
9.当你工作时,专注。我发现,专注于工作确实是比让自己在工作的时候摇摆不定,更不容易疲劳。当你决定了工作的时候,全力以赴,排除那些让你分心的事物,全心全意的去做它。你就会发现单纯、犀利的注意力,拥有着神奇的恢复力。
10.创造出口。如果你是一个兴趣爱好广泛的人(当然,谁不是呢?),那么很可能在每个规定的时候,你都有几个非常不同的目标和想法,在你的脑袋里面,不停的跳来跳去。这些想法需要一个出口。如果你一直保留着它们,它们最终会干扰你的注意力,造成不必要的困扰,是你变得怠惰
从另一个角度来看,我认为启动一些小计划作为创新能量的出口,是很好的,甚至符合健康。只是要确保你一直在做重要的事,以及保证那些小计划都有趣。如果这些小计划,开始变得有压力,立即把它们砍掉。
11.知道什么时候撑下去。这个建议与我上面所说的相违背,但这个方法很强大——如果能够正确的运用。有时候,要解决怠惰的问题,就是要依靠撑下去的力量。有时候,怠惰可能是一个幻觉。在这样的例子里,最好的方式就是不要将怠惰作为一个接口,不要理会你感到怠惰的事实,就是不断的工作下去。这个过程,就像一个跑步的人,在他经历最初的疲劳之后,恢复了精力,反而使他的力量得到了增强。
不管怎样,正如一个经验丰富的运动员所知道的那样,当在经历了痛苦之后和在开始回复的时候,你需要特别细心的对待这个特别的建议。直到对你的意图有了敏锐的认知,这个方法才能让你避免从感到怠惰的时候开始往往犯下的错误。
12.永远不承认战备。怠惰,与别的阻碍一样。它可以阻挠你一时,但它不能阻挠你一世——除非你让它击败你。
如果你心里有一个大大的目标,不要放弃,不管你感到别人多么冷淡、你自己多么劳累和灰心。即使我在这里所谈论的每一点都错了,你也要这么做:保持你的梦想——即便它此时此刻并没有那么美妙。不管怎样,都要坚持。在那边,当风暴褪尽,你的梦想仍完美无瑕的时候,再次上路吧!

2009年9月4日

低头做事,抬头看路:推荐一个书单

从一些博文里发现了这些好书,非常值得一读。在读博士之前、之中、之后,这些书应该都是非常重要的。阅读它们,不但能够获得知识,而且能够提高修养、开发潜能。

 

书单如下:

《Reading Comprehension: Success in 20 Minutes a Day》
《A PhD is Not Enough》
《Making the Right Moves》
《At the Helm: A Laboratory Navigator》
《Eat That Frog !》
《The Ultimate Secrets of Total Confidence》
《The 7 Habits of Highly Effective People》
《101 Really Important Things You Already Know, But Keep Forgetting》

2009年8月29日

4个网站教会你做任何事

很久没转载了,但是这个可以转载或者说必须转载 -:)

link: http://www.yeeyan.com/articles/view/60902/56720

 

4个网站教会你做任何事

2009年5月28日 in Awesome Apps

Post by David Pierce. Find me on Twitter.

有什么是比寻宝更cool的事呢?做一个宝箱,然后把它埋起来,当然,你会再次找到它,感觉就像一个海盗,带着一个眼罩……这会使每个人都很快乐。此外,在现在这种知识型经济现状下,寻找宝藏依然十分诱人。

无论是建设一个宝藏,手洗衣服,或者如何从一只熊攻击下逃生等等所有你能想到的事,网络上都有可以帮助您学习如何去做的资源。网络上有许多视频,一步一步叫你怎么做的说明等等,这些都在教你在各个领域非常有用的技能。

这些网站都是免费的,而且很容易搜索,他们都很适合用于学习一些对你来说全新的东西——即使这个“如何能不用水培育绿色草坪”……有谁需要知道这个呢?

这里有四个这样的网站——利用这些网站,你会成为无所不能的武士。 

Howcast

Howcast上全是视频——这些影片囊括了从“如何清洁卡带机” 到“如何带着小孩外出吃饭”的所有问题。这些影片提供了使得学习这些技能变得简单(经常不可以当真)的说明。每一部视频都有一个你要做的动作列表,然后让你将所有必要步骤和信息都过一遍,用一种很通俗易懂的方式是大家明白。

一些影片的可看性远远高于它的实用性——就像“如何从一个熊的攻击下逃生”这个影片很有趣得提醒你在一只熊攻击的情况下应该带着你杀手的钩以及/或者改变内衣。但无论如何,这么有趣得影片是值得看的,这个网站还充满了许多实用的内容帮助你学习Howcast已经解决的问题。

WikiHow

WikiHow是一个维基百科式手册,用于帮住人们做他们想做的任何事情。它是由一个社区创建,编辑和维护的,任何人都可以编辑其中的任何网页。这听起来好像对HOW-To行不通,但它确实做到了——维基百科也以同样的方式对网站进行管理。用户有一些严格的准则,就是如何组织起一篇文章,使其在整个网站中阅读起来更简单,更一致。所有的文章都有短小,简单的步骤,使真正做事情时候的难度放到最低。 

WikiHow这个平台很酷的事情就是:既然每个人都可以编辑网页,那么一定有许许多多的文章介绍Howtodo那些比较少发生的事情——人们一旦知道如何做一件事情,他们就想要去分享,不管是否有人想看。这个站点一定有许多不是那么有用,也不是那么必须的文章,但是如果你稍微搜索一下,你就会发现其中许多有趣的事情(比如说:宝箱

eHow

eHow是一个巨大的资源向导,包括关于how-to-do的文字以及视频的内容。该网站拥有超过50万的文章和视频,一般都是由专业人士制作-它的质量往往比像WikiHow这类网站上的资源更高。 

您可以按类别浏览的文章,看看最流行的eHows,或者搜索你想要的东西。这个网站有评级和评论系统,它让你对这篇文章的好坏有个大概的映像,以及它可能错过的关键点。群众的眼睛是雪亮的,大家给出了他们对于如何把事做得更好一点的见解——eHow的社区特性是它的最好的特性之一。 

Instructables

Instructables介绍的全是关于如何DIY(自己动手)做东西。这里有大量的例子关于如何制作居家的小东西或者他的比较便宜的部分,如何将他们做的更酷更出众。就像自制红外护目镜一样。谁不想要红外线眼镜? 

大多数文章都和一个视频相关联,他们都被分解成几个简单的步骤,一般都有许多使生活更轻松的图片。如果你正在寻找一个有用的小东西,你能够在周六的时候做一做,或者如果你觉得你的空烟盒非常适合给你的照相机做一个完美的闪光灯,那么Instructables就是你要找的那么网站。

哪个是你做喜欢的How-to。

2009年8月3日

高企之旅第三日

今天是整个活动的最后一天,由于昨天经受了最难熬的考验,今天的行程似乎较为轻松一些。今天的行程安排是上午参观富士通,下午参观东芝。由于两个公司都位于北京的东部,而我们的住处在北京的西北部,所以早上的一路上是比较折腾的。上午的日程安排如下:
----------------------------------------------------------
7月23日上午 富士通    地址:北京市朝阳区东四环中路56号远洋国际中心A座13层
9:30-10:00   富士通公司介绍及参观
10:00-11:30  技术讨论,富士通介绍相关产品技术,同学介绍所从事的科研工作(汇报人员待定)
11:30-12:00  校友座谈
    富士通安排午餐
----------------------------------------------------------
        由于晚上我们不住原先的酒店了,涉及到退房等事宜,结果出发时间晚了一点点,结果出门打车很不容易,又想IMG_0844换 26路公交去地铁站,结果也都是人满为患。最终还是打车前往苏州街地铁站。由于我们那辆出租车早到一些,为了节省后面人员的时间,我统一买了12张地铁 票。结果由于地铁站有两个入口,后面的人为了赶时间先上了地铁,最终导致我多买了8张车票。让人不开心的是,北京地铁票只能在购票所在站点当日乘坐才有 效,换个车站就不能用了。我觉得北京的地铁购票可以学习一下新加坡的管理方式。那边可以购买临时卡,这种卡可以公交和地铁通用,而且随时都可以充值。当 然,最终我们还是在国贸站会师了 -:)

IMG_0873        为了绕过倒车比较麻烦的西直门,我们直接赶到苏州街地铁站乘坐10号线前往国贸,然后再转1号线达到四惠,随后再走过一段没有治理好的坑洼之地,就到达了 富士通所在的大楼。整个儿从酒店出发到抵达富士通所在大楼,感觉就像一趟急行军,大家的衣服都汗湿了。我们最终比预订的时间晚了15分钟。

       来到富士通所在的楼层,引映入眼帘的是一面白色墙壁上硕大的FUJITSU 标志,配上灯光和旁边的绿树,真有大公司的感觉。原来前台的这个房间也是展示富士通技术成果的展厅,里面有很多不错的演示和成品。我感觉富士通的这个布局 很不错,既美观大方,又实现了接待展示等多种功能,还让人觉得非常的开阔。第一印象不错!同行的小伙子们都觉得这个地方值得纪念,就又开始纷纷照相了。
IMG_0877照片 207IMG_0879

IMG_0887        随后10点整我们开始了正式的参观访问。首先是我们的校友于浩老师介绍富士通的情况以及北京富士通的情况。据于老师介绍,经济危机对日本的电信行业打击很 大,日本有九大电气公司,七家亏损,只有富士通和三菱没有亏损。这一点,也从我们走访的几家日企的招聘计划能看出。从于老师的介绍中我知道了子公司和集团 公司的区别。前者是直接投资建立的公司,后者是间接投资。富士通的研究工作包括很多方面,其中包括现在流行的云计算。他们做云计算的目的是想基于富士通分 布全球的80个数据中心来实现。这个工作思路不错,比那些先建数据中心,再做云计算的方法有一定的优势。

照片 188        富士通的研究工作以及覆盖的产品包括很多方面。一项有趣且实用的技术是掌静脉识别。做这项技术是因为现在大量使用的指纹识别技术需要直接的接触,容易导致 不卫生的现象,而人的手掌上的静脉纹路也具有指纹的特点,而且在识别掌静脉时可以不用接触。现在他们的这个技术已经做到了芯片里,并且形成了固化的小方块 似的硬件。可以被用到很多很多地方,现在日本已经很多地方采用了这项技术,并且受到了广泛好评。据说正在准备向中国市场推广。

      在于老师的介绍中,我还了解到一些内容。原先手机网和无线网是分离的,现在富士通在研究如何将二者结合起来,因为市场空间巨大。这一点在后续和一位移动研 究院的师兄聊天时也知道移动研究院也在做这件事情。看来市场真是技术发展的巨大推动力啊。北京富士通的研究内容可能和我们比较紧密的包括自然语言处理、 Web信息处理、云计算、OCR识别(配合扫描仪)。在富士通北京的这个部门,基本的人员配置比例是2:1,也就是每两个人做基础研究,就会有一人做应用 开发。我觉得这个路子也是非常不错的,甚至可以被高校的实验室借鉴。

照片 191       在提问环节,我询问了一下富士通对专利的态度和申请情况,因为参观完华为后我对这个事情开始比较关注。意料之外的是,于老师回答富士通这边不太重视专利。 例如他们的掌静脉识别技术就没有申请专利。因为一旦申请专利就需要将全部的细节公开,反而会被人很容易的仿制,进而不利于对市场的占有。当我问到,不申请 专利的话就不怕别人仿照相关产品么。得到的回答是别人做不了这项技术。当时我实际的想法是,能够这样说肯定是富士通掌握了一些非常难攻克的技术。

      富士通这边对员工的绩效考核首先看中产品化技术,然后是专利或者被最著名的媒体报道,最后才是文章。也就是说,最起码需要有相应的文章支持才能算是合格的员工。

     关于外包和实习生,现在很多公司都愿意招聘实习生来完成一些基本技术的实现,这样比自己的员工花时间来弄会更省时间。一些关键性的技术甚至可以直接找外包,签好协议后就可以花费相对更少的价格达到更好的效果。看来外包和实习生对公司对学生都是双赢的。

     紧接着进行的是参观富士通的技术展示。在刚进门时展厅里,我们看到了一些很有意思的技术展示,例如前面提到的手掌静脉认证&非接触型扫描仪 (OHR),彩色电子纸、CPU、RFID电子标签(能够随意刷洗和折叠,适用于物流)、超小笔记本电脑U1010(现在最新款式U2020,非常棒)等 等。这里的展台布置得感觉比MSRA的更细致些。

照片 192 照片 193 IMG_0910  P1070556 P1070555 照片 204照片 196照片 197 照片 194 

     后面的校友交流环节,是我们的大师姐和一位刚入职不久的师弟来的。从交流中感觉到这边的工作压力不会很大很大,生活也比较的舒适。得到的一个观点就是,外企没有复杂的人事斗争,做好自己的工作就可以了,比较简单。

     最后,于老师和两位校友一起非常热诚的招待了我们,在一个不错的饭店,美美的补充了我们的体力和营养。

IMG_0936 IMG_0917 照片 215

 

 

从富士通返回到地铁1号线,在繁华的王府井下车后,在地铁站直接就进入了东芝研发中心所在的大楼。下午的行程安排如下:

-----------------------------------------------------------------------------
7月23日下午 东芝    地址:北京市东城区东长安街1号东方广场W2座501室
2:00-5:30  东芝(中国)研发中心公司介绍
                公司参观
                哈工大计算机学院简要介绍相关研究成果
                技术交流,杨宇航、郎君、李文凯(15分钟/人)同学介绍所从事的科研工作
                校友座谈
                东芝安排晚餐
-----------------------------------------------------------------------------
P1070559       来到东芝的楼层,进入硕大的会议室,很明显,我们迟到了几分钟。因为会议室分为面对面的两列,东芝的研究员和员工们已经整齐的坐在靠门的一侧,另外一侧是 留给我们一行人员的,在靠近屏幕的那边,东芝研发中心的总裁以及总体负责接待我们的王海峰老师也都端坐在那里。瞬时间,我们感受到的是一种高规格的接待。 当看到我们每人的桌上都有一张彩色的参观详细安排表时,我被这种严谨认真的态度深深打动了。

       我们在众目睽睽下进入会议室,进门时看到了我的老同学晓光也在场,又看到指导并帮助我撰写ACL08报道的王海峰老师,还有到过我们实验室访问的吴华老师,顿感亲切。

P1070567        我们坐好后,2点零四分,东芝研发中心雷总裁致辞向我们表示正式的欢迎,然后是王海峰老师介绍了东芝的整体情况以及和高校关系较为密切的研究部的情况。东 芝创立于1875年,历史非常久远了。研究部现有的课题,以中文分析为基础开展了听说读写多个方面的研究和产品开发。左边这个图可以详细展示这里的研发工 作,个人感觉思路非常清晰,几乎涵盖了我们学校教育部微软语言语音重点实验室的各个方向。 P1070562

       研发中心的研究成果应该说是很丰富的。王老师先简单介绍了他们刚上市的机器翻译产品“The Honyaku 2009”,这个主要是做中日机器翻译,研发中心的核心技术嵌入其中。还有一些国际知名的国际评测中研发中心也取得了很好的成绩,在论文发表方面也是非常 的强,包括11篇ACL等一流会议,6篇优秀期刊论文。

照片 236        随后是开发部王艳丽老师介绍语音方面的工作。她所在的部门是研究医疗领域的科研工作,负责处理图像及三维重建等工作。东芝在医疗器械方面还是非常有名的, 例如一些CT机、核磁共振仪等等。他们部门的研究工作和开发工作紧密相连,包括底层核心算法的研究,并支撑一个研究平台,然后在平台的基础上对相关算法进 行移植和集成,从而嵌入到最终那个的产品或者服务中。(左图所示)这个路子非常的P1070572不 错。真有鱼和熊掌兼得的感觉。这位王老师的报告内容非常清晰的整理出了他们正在开展的工作,存在的问题以及下一步的计划。更为难得的是我们看到了他们对组 内交流的详细规划和执行情况。我个人感觉不算商业机密,应该可以放在我的这个日志里。从这个图片中的内容来看,东芝内部的学术交流以及相关的知识分享还是 很不错的,甚至包括了一些软件的使用心得。这些工作堪比高校的实验室啊。报告中最后提到了对员工的考核涉及三个方面,专利、项目、和论文。

照片 229          下个阶段就论文我们一行人的报告了。首先是我们的带队老师宋老师致辞。这也是我们这一趟参观中宋老师第一次非常正式的发言。我感觉宋老师能力很强,在这种 场合下发言丝毫不紧张,而且非常得体,而且宋老师对我们要求的“当日事当日毕”原则也非常让我敬佩。期待将来的高企之旅或者类似活动宋老师能越做越好。接 下来是杨宇航介绍哈工大计算机学院的整体情况以及我们这样高企之旅的目的。随后就是他介绍术语抽取的工作。然后是我介绍基于归纳逻辑编程的共指消解技术。 随后是李文凯介绍了他在三维重建方面的初步调研结果。我们的报告得到了东芝方面多位研究员的关注。我的报告后刘占一询问了是否是基本的训练模型并测试的那 种路子;吴华老师一针见血的询问了如何解决Entity中Mention先后放入对结果的影响,我回到我们的ILP模型在建模时考虑了这个问题;王海峰老 师询问是否对结果进行分类分析。从这一点来看,我觉得这边的研究水平还是非常高的。

        在杨宇航报告后,雷总裁询问了我们哈工大计算机学院毕业生一般的就业情况,并进一步了解了我们这趟高企之旅的初衷。

照片 348        随后进行的是座谈交流。这次交流非常的正式,首先是在场的全部人员轮流进行简短的个人介绍,然后主要讨论了如何选择企业以及如何看待企业等方面的问题。他 们对于要找工作的学生(尤其是博士生)的建议是一定要知道你的志向和你想要的生活,不要只看工资是多少,而要多想想10年后,20年后可能的事情。因为真 是那样的,10年河东10年河西啊。在这个交流中,有三点我感触很深。首先是他们很推崇有位名人的一句话,在一个地方认真呆上20年,想不成功都很难。说 这话时有人举照片 327了 一个例子,说当年本科毕业时班里一位最不起眼的同学留校了,那是大家都走了,结果现在别人是学院的副院长。我觉得这句话还真是有一定的道理。就像在一片下 面有水的空地上打井那样,在一个地方持续性的挖,而不是经常换地方,那一般都是能挖出水的。第二点,找工作的时候一定要仔细想好你需要什么样的生活。国 企、外企、高校、国内著名的IT公司,都可以考虑。但是他们进入外企后感觉缺少了一种生命,因为没有了政治上的前景,而且从外企退出后也很难在进入政界。 最后有感触的一点是,他们博士毕业找工作时也很迷茫,当时他们中有人来东芝也是偶然的机会。这样看来,大家都会经历相同的阶段。但愿看过我这几篇日志的朋 友在找工作时能够少一些迷茫,多一些自信。

照片 340           整个交流气氛非常融洽,中间不乏幽默和笑声。随后我们参观了研发中心的办公环境。有一点比较有意思的是,在其中一个大房间里,靠墙的是一排座位,每个座位 都面对一趟隔断,在这趟隔断里有6人分别面对自己的电脑,而靠墙的那个座位能够看到这6个人的电脑屏幕。据说这是日本风格的办公格局。这个房间里主要是非 研发人员,在研发人员的区域就是我们常见的那种隔断布局了。呵呵,确实很有意思啊。不知道那种6+1格局照片 353里工作效率会不会更高一些啊。

       随后就是在东芝门口的合影留念。之后东芝的几位高管以及哈工大的校友一起陪我们到王府井最好的东来顺大吃了一顿。这顿饭据王老师说算是为我们饯行的。在饭 桌上我深入了解到一位曾经是哈工大外语学院系主任的传奇经历。这位老师我以前听说过,但是不知道来了东芝。从他那里感受到了一种侠客般的经历。(涉及个人 隐私,不方便透露更多)。我们分为两桌,我和晓光坐在一起,后来在王老师的带领下,我们采用哈尔滨喝法,我们几个学生都有点喝多了。

照片 362        总之,在东芝我们感受到了和其他地方不一样的氛围。这趟高企之旅也就在这顿饭结束时画上了圆满的句号。在后续两天里,由于特殊原因,我还见到了一些校友和朋友,包括刚到北京某高校做正式老师的,还有去某国企研究院的,也有面临毕业的博照片 382士,某银行人力资源部的,以及在北京闯荡创业的。总之在京的几天几乎每顿饭都会见到不同的人。

       简单小结这趟高企之旅,我的收获颇丰,达到了预想的开阔眼界的目的,见识了各种风格企业的一些内部环境和氛围。希望我的这四篇拙作能够给你带来不一样的感 觉,如果其中某些文字或者图片有朋友不希望出现在这里,请告诉我。感谢咱们计算机学院的领导以及我一起同行的2位老师和9位同学,也感谢各个企业给予的大 力支持、帮助和热情接待。日志中的很多照片都是同行人员拍摄的,他们真的很专业。谢谢!

高企之旅第二日

今天的行程会更加紧张一些,因为要去三家企业:上午NEC,下午腾讯,晚上华为北研院。上午的行程是这样安排的。这个行程表看起来很简单,但是在NEC我们受到的接待应该是非常高规格的。
----------------------------------------------------------------------

7月22日上午 NEC    地址:北京市海�区中�村�路清�科技�1号�新大厦A座11�
  9:00-9:45    NEC公司介绍及公司参观
  9:45-10:00   哈工大计算机学院简要介绍
10:00-11:30   技术交流:NEC介绍相关研究和产品,纪荣嵘,郎君,杨宇航(15分钟/人)介绍所从事的科研
11:30-12:00   与校友或专家座谈
NEC安排午餐
----------------------------------------------------------------------

IMG_0424_1       吃完酒店安排的早餐,我们一行十二人分三辆车前往NEC。我和宋老师、张老师、李淼在一辆车,我负责指路。刚上车,我说目的地是清华科技园。结果司机的第一句话就是不太清楚该怎么走啊。由于我预先查过详细的路线,我说那就先到IMG_0432_1保 福寺桥那边吧,然后往北一会儿就到了。司机仍然说不是很清楚怎么走。呵呵,没有办法,我只好翻出酒店前前台免费领取的北京地铁,然后指给司机师傅看详细的 路线。结果这个司机根本就不看我的地图只是一味的开车。后来居然直接达到了目的地,快到之前我说在搜狐大厦旁停车就行,司机还说知道知道,拐过去就是了。 哈哈,这一刻,我们四人都明白了。这个司机是想欺负外地人,多转几个圈然后多挣钱。昨天下午我们三辆车在普天楼下汇合时,估计最后一辆车就是遇到了这样的 司机。还有前天刚到大钟寺时遇到的拒载。哎!这些司机为北京抹黑啊。还好今天手里有地图,而且之前还查过路线。

       走过一片绿草地,我们顺利来到创新大厦A座一楼大厅。没想到他们8人早就到了。猜想是遇到了好司机啊。呵呵。在约定的见面时间前10分钟,我们登上电梯, 来到了NEC中国研究院。稍事休息后我们开始参观NEC研究院。在这里我们明显感觉到了金融危机带来的影响。NEC研究院原先后一层半的写字楼,现在只有 一层了。而且现在NEC没有招聘计划。参观完,就开始正式的交流活动了。这次之所以能够来NEC研究院参观交流,也是得益于这里的院长杜军先生。他是我们 的校友。在他介绍NEC的报告首页还特地注明了是哈工大78级毕业生,报告最后一页还列举了哈工大毕业生在北京的校友情况。这也看出了杜院长浓厚的哈工大 情节。DSC02282DSC02285

        在报告之前,杜院长为我们播放了一段NEC介绍的视频,轻快而起伏跌宕的背景音乐配合大量的全篇为了核心位置的字幕,以及大量的照片,整个视频的制作水平 非常高。据说背景音乐是专门找一位音乐家制作的。在这个5分钟的视频中我们感受到了NEC的持续创新精神。其中有两点让我记忆深刻。安定的企业不安定,不 安定的企业更安定。这是在说企业的创新。第 二点是随着科技的不断发展,人们的生活越来越方便,但是人们的人际关系越来越疏远,而且地球受到的环境污染越来越严重。

       随后杜院长的报告首先介绍了NEC的历史,NEC在日本的情况,NEC在全球的情况,随后是NEC中国的情况,NEC北京的情况,以及NEC中国研究院的 情况,逻辑十分清楚。从这个报告中我了解到了一些以前不知道或者未曾思考过的问题。据杜院长讲,现在北京有800多家外资机构。之所以存在这种局面,对中 国对外企是一种双赢的局面。首先,对中国实现大量的生产和采购,集中在外企多中国政府的纳税、能够解决就业问题并培养大量人才。对外企本身,可以以中国的 杰出研究人才为原动力,以中国市场的需求及特色为导引,在中国创造出领先世界的技术研究成果,从而实现降低成本的目的。这让我想到了现在许多外资都在刘翔 人力成本最为廉价的国家和地区,例如现在中国的劳动力已经不是最廉价的了,只能排在世界第三,现在最廉价的是越南。所以才出现了这两年一些外资企业将坐落 在中国的工厂迁往越南的情况。我们的国家一定要在劳动力成本优势丧失之前实现劳动密集型向高科技型的转变。否则我们会很危险啊。DSC02289

       杜院长报告中有一页让我感触很深,那就是对世界正在变化的思考。我猜想不会引起版权的问题,所以放在右 侧。世界的变化正在从各个方面进行着,例如世界观、社会形态、追求的内容、对人类和文化的思考、对地球环境的姿态、技术的特征以及人与技术的关系。详细内 容见右侧照片。这种种转变能够衍生出各种问题和各种课题。我感觉在高校中做研究时可以多考虑一下这个问题。

       在介绍NEC的研究成果时,杜院长特别提到了月亮女神探月卫星整个都是由NEC完成的。NEC的研究成果海鸥多摄像头实时拍照和合并,合成得到超宽屏的照 片。我猜想一般数百人合影时那种拍两次再合并应该就是这种技术。现在NEC还有一种超声波定位技术,可以实P1070528时定位三维空间中的点。这里有一种技术我觉得很新颖,那就是加密检索。以往的方案是解密后再检索,现在他们掌握了不经过解密阶段直接检索的技术。

      稍后进行的是我们学生的报告。首先是小纪介绍了他在图像检索方面的工作。到我报告时,考虑到听众中有和我们实验室合作过的朋友,应该会比较熟悉我们的 LTP了,在这里介绍ACL的工作可能也不是很恰当。我临时介绍了我们LAB今年正在进行的TMS(文本挖掘系统)。随后是杨宇航介绍他的术语抽取工作。 我们三人的报告的反馈都还不错,有不少人提了问题。和我们实验室合作过的红威博士说有一堆问题会在会后和我交流。还有人询问了我TMS的领域切换问题,以 及事件和意见挖掘相互的支撑关系等问题。这些问题对我们的工作都有很好的启发。

      随后到了午餐时间,NEC给我们安排了别具一格的Lunch Talk,在交流讨论的会议室摆满了各种口味的皮萨饼,还有很多鸡翅薯条和饮料,一边交流一边午餐,感觉还真是不错。这个阶段,我们同行的其他成员各自口 述了自己的研究方向和研究成果。随后就是一对一的具体交流。和红威博士交流时看到了去年南京机器学习学习班上见到的那位朋友,原来红威是他的上司。

IMG_0774IMG_0483_1 IMG_0507_1

这个交流过程一直持续到中午12点半,NEC研究院的各位研究员也一直陪着我们,包括杜院长也一直在场,让我们感受到了非常真诚的态度。感谢他们的热情接到。

IMG_0544_1 DSC02299 DSC02303

 

 

上午的行程和接待我感觉都是高规格的,非常受重视的。下午的行程是参观腾讯研究院,这里看到的听到的是另外一种创新的感觉。行程安排如下:
----------------------------------------------------------------------
7月22日下午 腾讯    地址:北京市海淀区海淀大街38号银科大厦16层
2:00-2:15  公司参观(负责人:高校关系经理)
2:15-2:30  研究院介绍(负责人:研究院智能研究室高级总监)
2:30-3:10  学生报告(智能研究室高级总监、无线中心leader及高校关系经理等)郎君、马二磊、杨宇航、钟必能(10分钟/人)
3:10-3:40  校友座谈及交流(负责人:研究院中文处理研究室总监等)
3:40-4:10  公司用人制度及职业发展等介绍交流(负责人:人力资源经理)
4:10-4:40  根据学生的演讲汇报等情况,挑选2-3个方向对口学生进行单独交流(负责人:相应研究室的总监);
其余学生做实习/工作意向、对各公司的看法及对腾讯的意见和建议等方面的交流讨论(负责人:高校关系经理)
4:40       结束,欢送来访学生(负责人:高校关系经理)
----------------------------------------------------------------------

       以前来过腾讯所在的银科大厦,但是没有到过这里的研究院。刚进入这层楼,感受到的是一种色彩带来的高科技的感觉。这里由于刚成立不久,所以格局比较规范, 基本的工作环境和其他公司差不多,隔断的不同颜色代表了不同的组。蓝色好像是研究院的,黄色是搜索部的。这里的技术总监的办公环境和普通成员是一样的。也 都是基本的隔断。参观过程中,看到这里也有类似百度大学的腾讯学院,基本的运作方式和百度的差不多。参观的这一圈,我感觉腾讯研究院的写字楼比较大,有乒 乓球室、好多会议室培训室还有休息场所。

DSC02305DSC02307 IMG_0790 IMG_0789 IMG_0799 DSC02312

       在这里的高校关系部的工作人员(也是刚从微软亚洲研究院高校关系部跳巢过来)先带领我们参观了腾讯研究院,然后开始介绍腾讯的历史、业务、利润规模等,随 后是介绍腾讯研究院的情况,其中包括智能计算、无线技术、数据挖掘、多媒体、中文处理、网络技术。从随后的介绍中得知,腾讯现在最挣钱的业务还是网游,另 外一个特别的挣钱点就是QQ里个性人物穿衣打扮会带来很多利润。说是大家的QQ人物免费穿上衣服后想再脱下来就很难了。所以会有很多人每月付费来保持穿上 的衣服以及更换衣服。这个利润点我觉得挺巧妙的,但是对于我这样的“老人”似乎没有什么作用 -:)

IMG_0812       在介绍完腾讯的情况后,我们四位同学开始介绍我们的相关工作,首先我在12分钟内介绍了我讲过的语言技术平台和文本挖掘系统。然后马二磊介绍人物信息抽 取,杨宇航介绍属于抽取,钟必能介绍他的视频跟踪演示。在场听我们做报告的两位总监都是我们的校友,一位是中文处理组的方高林师兄,一位是智能计算组的王 建宇师兄。他们听完我们四人的报告后都没有什么问题。但是在最后的一位负责HR的人士介绍腾讯的产品时,我被单独叫出去和王建宇师兄先聊了一会儿,然后又 和方高林师兄单独聊了一会儿。聊天的内容大同小异,都是了解我以前做过工作的细节,以及如果到腾讯工作的话,希望做什么。后来方高林师兄带我去见我们实验 室毕业的IRer--刘怀军。这位师弟来腾讯应该有两年了,一直在方高林师兄的组里工作。看起色还非常不错,闲谈一阵儿后就到了我们该离开腾讯的时间了。 因为晚上临时需要到华为北研所参观。

      腾讯研究院环境非常不错,这里的腾讯学院也貌似非常的好。从市值和用户群来看,腾讯应该是非常不错的。

 

 

       据说原先今晚是没有活动的,只是华为的一位HR在朋友那里听说了我们的这次活动,便主动联系我们的带队老师,最后经过协调,就有了这随后的访问和参观。我 们准时在4点50离开腾讯大楼,坐上华为安排的汽车。一路驶向上地方向。说起上地还有一段插曲。由于这两天我一直负责一部分领路任务,和我同车的张老师问 我上地的地是哪个地。我一时随口,说成了是My god的那个帝。结果后来看到有一个标志牌上写着上地时,大家才开始哄堂大笑。呵呵,也算是开怀一笑咯。笑一笑百年少嘛 -:)

       插入一段,今天是看日食的日子,但是遗憾的是北京今年多云,一点都看不到。在去北研所的路上,有一阵子天特别黑,还下了一阵雨,随后又天光大亮。我们都猜想是日食捣的鬼,但是日食的时间应该是上午才对啊。最后也没有弄明白怎么回事。

IMG_0814       话说来到华为北研所后,我们做的第一件事情就是存放相机和笔记本等电子产品,还好没有要求我们都把手机存 放起来。因为据说任何带有数码摄像功能以及存储功能的手机都不能带入华为。然后我们每人挂好一个访客的牌子后开始进行正式的访问。由于到了晚餐时间,华为 这边安排我们吃了一顿工作餐。就是在他们的食堂里吃饭。

       在食堂能够感受到华为的那种严谨和严格的作风。我们吃饭是分为四桌,有专人打好饭菜后给我们送来,而且非常非常的客气。这里的卫生环境绝对是过关的,服务 也非常的周到。起初我们还以为是自助餐,想打什么就打什么,后来发现是之前就确定好规格的三荤一素标准餐。

       华为比较低调,好像在媒体上也很少曝光。接待我们的HR带我们进入北研所里面的一个会议室后,介绍华为时先就谈到了华为员工跳楼等事件对华为的不良影响。 他说华为有好几万员工,按照正常的跳楼概率,华为每年有人跳楼也不足为奇。华为似乎很少在媒体上对这类事件进行辩解,因为华为很低调,他们对员工是很好 的,希望我们在校学生不要误解他们就行。我个人觉得这个说法还是比较中肯的。华为的踢低调还包括整个北研所只有门口有一个华为的小标志,其他地方都看不到 华为的Logo。

       接待我们的人力资源部的HR给我们介绍了一个《高效工作快乐生活——华为技术北京研究院》的介绍。这个HR老师有点幽默。他对我们说,希望我们能够和他在 将来成为同事,如果不能成为同事的话也希望能够成为客户,即使成为竞争对手的话也希望能够手下留情。通过介绍,我们了解到,华为随着不断的壮大,越来越多 的工作内容和工作方法在和世界接轨。他们内部经历了管理变革,采用了世界级的管理实践。华为内部对这种类似的变革态度是先僵化,再固化,再优化。理由是, 别人大力推荐的东西肯定有值得借鉴的地方,我们可以先全盘接受别人的东西,即使有些地方不对或者我们感觉不对也需要全盘接受,等我们能够融汇贯通了,再开 始进行符合我们特点的优化。我觉得这个路子很正确,很像小平同志当年推荐的那种拿来主义风格。这方面的管理实践包括IPD(集成产品开发)和ISC(集成 供应链)。华为北研所主要是研究通信网络技术,每年华为10%的销售收入会投入研发,10%的研发费用会投入预研。

       这个基本介绍结束后,来了两位预研部的员工为我们进一步介绍华为的一些东西。他们强调一个概念,三流的企IMG_0815业 做产品,二流的企业做品牌,一流的企业做标准和专利。华为内部有很多很多的培训,因为很多地方都需要和国际接轨,例如一些老外会来检查你的企业内部是否符 合规范,例如是否每个房间都有消防提示以及各种电话号码的提示,甚至会检查你的食堂是否符合标准。因为只有这样才能让别人相信你确实是一家一流的企业,才 会让别人放心使用你的产品,相信你后期的产品维护是可能的。所以华为内部要求很严格。我感觉这种要求真有点像我们学校的校训“规格严格,功夫到家”。难怪 华为能够做得这么好。华为内部的职业发展通道也包含了很多内容,例如华为大学中会受到各种各样的可选培训,甚至可以学到如何打高尔夫球,因为在和某些客户 沟通时,就需要具备这样的技能。从这一点看,我觉得华为是把一些很细节的工作做到极致了。华为内部的生活,还包括Family Day和Open Day。前者是组织员工家属参观华为,让家属对员工的工作和生活放心,也希望家属和员工以及家属之间更加融合。这一点我觉得有点类似于微软亚洲研究院,那 里也有Family Day。我想这就是只有安居,才能乐业的道理吧。在Open Day,华为的员工可以到一个专门的部门投诉,投诉内容可以是任何方面,例如可以对上上层主管指出上层主管的一些错误。我觉得这个活动有点厉害,长远来看 能够保证内部的公平公正和高效工作。还有华为内部也有很多文艺晚会,不一样的是,表演者都是主管,员工只负责观赏。呵呵,这个比较有趣啊,难为主管们了 -:)

       随后的介绍中,我非常强烈的感受到了专利的意义。包括专利防御、专利攻击、专利池等概念我都是第一次听说。当然,不是说有了专利就完了,专利只有被人用上 了,才算是有价值。这一点我感觉和我们科研领域的学术论文一样,你发表了一篇论文只表示在专利池中你有了一个专利,但是如果你的论文从来没有他人引用,那 说明你的论文还是没有价值的。呵呵,这么看来最近学术领域开始采用的H指数作为评价标准应该算是一个不错的指标。

DSC02321     说到华为预研部的绩效考核方式,因为华为对预研部员工的考核方式就是专利,但是新入职的员工很难在一两年内拿到专利。他们说这里的考核方式是相对评价。就 是同事之间相互进行客观的评价,从而形成对新同事的考核。在华为内部交流能力以及工作能力也是被考核的方面之一。

       在后续参观华为北研所的办公环境时,我们看到了有些房间存放了大量的服务器,而且都在不停的用电风扇散热着。这些地方都贴上了保密守则以及定期的检查事 项。华为内部的办公环境和其他公司都差不多,就是基本的隔断。在一个办公室墙上,我看到这样一句大红标语: 十年辛苦磨一剑,泄密只卖废铁钱。 据说这是华为曾经多次经历过的惨痛教训。仔细想想,确实如此啊。看来申请专利还真是非常有必要啊。

      在华为参观不能照相,希望上述文字能够清晰的还原我们参观的经过和感受。作为非常完善的企业,华为的很多做法确实值得其他中小企业学习和仿效。