2007年4月30日

[收藏]默认状况下latex各部分字体大小

发信人: FireSimulate (火灾模拟◆全力以赴), 信区: MathTools
标 题: Re: 请问默认状况下latex各部分字体大小
发信站: BBS 水木清华站 (Fri Dec 6 17:19:54 2002), 转信

size 10pt (default) 11pt option 12pt option
\tiny 5pt 6pt 6pt
\scriptsize 7pt 8pt 8pt
\footnotesize 8pt 9pt 10pt
\small 9pt 10pt 11pt
\normalsize 10pt 11pt 12pt
\large 12pt 12pt 14pt
\Large 14pt 14pt 17pt
\LARGE 17pt 17pt 20pt
\huge 20pt 20pt 25pt
\Huge 25pt 25pt 25pt

[收藏]如何修改 \enumerate 的编号格式

发信人: blinkeye (少灌水,多运动!), 信区: TeX
标 题: Re: 如何修改 \enumerate 的编号格式?
发信站: BBS 大话西游站 (Thu May 12 14:20:25 2005), 站内

前天发现了一个enumerate宏包也挺好用的
\usepackage{enumerate}

然后enumerate环境就可以使用一个可选参数,像这样:

\begin{enumerate}[(a)]
\item $(p\rightarrow(q\rightarrow p))$;
\item $((q\lor r)\rightarrow((\neg r)\rightarrow q))$;
\end{enumerate}

[]里面的 (a) 出来的结果是 (a)(b)(c)(d)这样子的。还可以用如下的:
1,得到1,2,3,4....
i,得到i,ii,iii.....
I,得到I,II,III....
a,得到a,b,c,d.....
A,得到A,B,C,D....

还可以加各种修饰,比如
[Exer. i],得到 Exer. i,Exer. ii,Exer. iii, Exer. iv,等等

你要的这种结果稍微麻烦一点,要把[]用花括号括起来
\begin{enumerate}[{[}1{]}]
\item $(p\rightarrow(q\rightarrow p))$;
\item $((q\lor r)\rightarrow((\neg r)\rightarrow q))$;
\end{enumerate}

2007年4月26日

混沌-格物致之(续) Social Network


今天上午得到通知,下午我的博士生导师要和我谈一谈。一打听,才知道我是倒数第二个了。

怀着忐忑的心准时来到老师的办公室。为什么忐忑?因为我还没有完全确定做什么东西。老师非常和蔼的向我 询问了一些博士课题的研究进展。建议我不要再局限在指代消解上。我也详细向老师回答了自己想不再继续指代消解,转而全身心完成共指消解。在向老师介绍我的基于Social Network完成人名消歧的想法时,老师眼前一亮,感觉这个方法值得深入下去。随后的谈话让我感觉轻松了一些。老师指导我说应该把在博士开题的时候就确定好将来博士论文的构架以及相互之间的关系,这样能融合得比较好。至于是纵向的研究基于Social Network的共指消解呢,还是横向研究共指消解的各个方面则有待深入的分析和思考。这个事情需要我自己好好斟酌。

回到实验室,我和我的直接指导老师进行了交流。老师建议我从现在开始放弃单文档共指消解,转而完成跨文档共指消解。原因是跨文档共指消解引申出的重名问题比起单文档共指消解引申出的别名消解所占比例更加大些,更容易出现创新点。

晚上,思路又一次开始出现散射状态。想要找找有没有Social Network的资料大本营式的网站。呵呵,皇天不负有心人,还真的让我找到了。它就是:
http://www.insna.org
。感觉非常不错,随后还找到了一 个非常好的在线书籍
Introduction to social network methods
和专门绘制Social Network网络图形的免费软件

NetDraw

UCINET



哈哈,俺要开始好好学习SN了~!

2007年4月24日

混沌-格物致之


按照学校的规定,进来面临了博士开题的问题。这个问题一直让我很头疼的。因为,我一直没有完全确定究竟应该做什么。我时常询问自己,“你的博士方向究竟是什么?有什么过硬的创新点么?”每当这时,我的脑袋里就是嗡嗡作响的。

原本,我是热爱机器学习的,曾经想在机器学习的理论领域有所创新。那时的我,激动不已的和几位志同道合的朋友一起组织了几次全校范围的机器学习讨论活动。毕竟人的精力是有限的,随着我在原先确定的指代消解问题上理解的深入,我开始远离自己曾经的想法。

什么是指代消解呢?广义上说,就是在篇章中确定代词指向哪个名词短语的问题。按照指向,可以分为回指和预指。回指就是代词的先行语在代词前面,预指就是代词的先行语在代词后面。按照指代的类型可以分为三类:人称代词、指示代词、有定描述、省略、部分-整体指代、普通名词短语。这些类别中前四个都是和语言学息息相关的,目前国内外的研究人员主要是偏向语言学领域的,对于不同的语言需要深入了解这种语言的机制,很难实现语言无关的方法和算法。对于我曾经尝试过的人称代词消解,感觉需要借助一些高级而且准确的语言分析工具,同时还需要多向中文系的师生请教。这个问题的研究让我感觉很难深入的完成创造性的工作。部分-整体指代在英文中成为Bridge-anaphora,主要消解一些整体-部分关系的指代,例如门和房间。这是一种上下位关系的指代。这个问题在英文中大有研究人员,但是对于中文却很少有从指代消解的角度来进行研究。因为,这个更像实体关系抽取。而实体关系抽取现在是信息抽取领域研究的一个热点问题。剩下的普通名词短语的消解。这个问题仔细阅读论文发现,就是coreference resolution(共指消解)问题。

那什么是共指消解呢?通常认为,共指消解就是将现实世界中同一实体的不同描述归并到一起。共指消解和指代消解的区别和联系是什么呢?指代消解偏重语言学中篇章理论的分析和研究,对于代词有深入的研究。共指消解偏重将各种描述合并,在篇章内主要是解决别名的问题,在篇章之间主要是解决重名的问题,代词消解在其中不考虑的重点。共指消解研究主要分为两大类:篇章内部和篇章之间。篇章内部的共指消解现在由ACE大规模引导,篇章之间的共指消解目前主要的研究点是数字图书馆中参考文献标题、作者的重名和别名消解,以及搜索引擎检索人名、地名、机构名的结果的归并问题。篇章内部的研究的经典思路是对各个实体进行相关的特征抽取,然后采用分类、聚类算法来进行,这种思路是基于局部上下文信息的特征抽取;目前的趋势是采用全局域的实体特征抽取从而实现更好的分类和聚类。具体思路又有两种:先按就有思路两两判别给出相关度数值,然后采用聚类或者图模型来进行相关的归并;另外一种是同时对多个实体进行特征抽取,然后判断多个实体间的关系,最后统计每个实体在多组实体间的关系,从而得到最终的归并结果。篇章之间的共指消解在数字图书馆领域主要是采用图的相关理论和方法来进行解决,有大量的相关论文。目前采用较多的是Social Network的方法。检索结果聚类方面,主要借助无导词义消歧的方法,通过构建实体向量的方式实现聚类;也有一些是基于实体信息通过搜索引擎扩展后进行相关操作的。

综合上面的分析可以发现,共指消解是一个更符合我的研究方向。其中有大量值得研究的问题。而且对于图方法上的工作,存在一定的理论难度。具体的应用前景可以考虑人物、地理、机构等的社会化网络结构的建立、分析和挖掘。那么对于具体的研究问题是限定在篇章内或者篇章之间呢,还是二者都做;篇章之间是在数字图书馆领域呢,还是普通的Web?这两个问题又需要进一步的思索。

面临开题,我有点紧张。因为到目前为止还没有任何让人眼前一亮的研究成果。呵呵,有句古话叫十年磨一剑。看来还真的下苦功夫才行的。早上来到实验室,脑子里还是有点混乱。随便翻翻桌上的一大堆论文时,忽然想到了自己以前的一种体验:问渠哪得清如许,唯有源头活水来。就是说当思路混乱,不知所措时应该阅读一些优秀的相关论文来填补。

我的第一个想法就是把手头的论文重新分类。经过一个多小时的整理,我的一大堆论文呗分成了五类:指代消解、篇章内共指消解、跨篇章共指消解、具有启发性的相关领域论文、近期内不会考虑的论文。整理完毕后发现,前四种类型的论文数量差不多。整理过程中倒是发现一些论文值得重读了。

现在的一个决定是,放弃指代消解的研究,彻底进入共指消解的研究场景。(待续)

2007年4月23日

经典★PPT演示“10/20/30”原则

作为一个风险资本家,我不得不听取数以百计的创业者介绍他们的公司。大部分的介绍都是些废话:用六十页的幻灯片讲述“未决的专利申请”、“先动优势”、“所有我们需要做的就是让1%的中国人购买我们的产品”,诸如此类的启动方案。这些介绍是如此的恶心,以至于我一直在损耗着自己的听力,耳朵里一直在嗡嗡地叫,偶尔觉得世界都开始旋转。
——Guy Kawasaki


厌倦了冗长的阐述,这名著名的风险投资人一直在努力传播其所谓的“PowerPoint10/20/30原则”。那么,何谓“PowerPoint10/20/30原则”?

非常简单:一次PowerPoint陈述,应该只有10页幻灯片,持续时间不超过20分钟,字体不小于30磅。这一原则适用于任何能达成协议的陈述:比如,募集资本、推销、建立合作关系等等。

10,是PowerPoint陈述中最理想的幻灯片页数。一个普通人在一次会议里不可能理解10个以上概念——风险资本家也是普通人。(你和风险资本家的唯一区别只在于他是在拿别人的钱赌博给自己挣钱。)如果你必须要用超过10页的幻灯片来解释你的生意,你可能就没生意。

风险资本家关注的10个主题是:
1.问题是什么?

2.你的解决方案?

3.商业模式?

4.潜在力量/技术?

5.市场营销如何进行?

6.竞争性

7.团队

8.起始点和里程碑

9.地位和时限

10.概要和行动呼吁

简练的说明以上这些,对你赢得听众的赞许很有帮助!

20,是你必须在20分钟里介绍你的10页PPT。事实上很少有人能在很长时间内保持注意力集中,你必须抓紧时间。在一个完美的情况下,你在20分钟内完成你的介绍,就可以留下40分钟时间进行讨论——除非你不喜欢讨论,否则,最好还是尽快完成你的阐述吧。

30,是你的PPT文本内容的字体大小(其实30只是一个象征,意思是,尽可能大,估计是原作者为了1-2-3看起来舒服……)。大多数PPY都使用不超过20磅字体的文本,并试图在一页幻灯片里挤进尽可能多的文本,然后陈述者可以读它们,然而只要听众发现你在照本宣科,他们就可以在你之前读完,因为他们读起来总会比你说得更快。结果造成,你和你的听众不同步。

人们使用小号字体的原因有两方面:第一,他们对自己的材料不够熟悉;第二,他们认为更多的文本会更有说服力。这种观点很有害!强迫自己使用足够大的字体,因为这会要求你发现最重要的部分,并知道如何解释好它们。

这个PPT演示的“10/20/30”原则很值得我们思考,毕竟,一个演示的机会,不论对于创业者还是需要经常向各类客户做演示的人来说,都并不是唾手可得的。

2007年4月20日

hit-PlutoKaiTi Latex模板的修改

这学期要写开题报告了,打算继续采用Latex来书写。好在我们学校已经有人制定好了撰写开题报告的Latex模板。http://gf.cs.hit.edu.cn/frs/?group_id=91&release_id=198

我下载的是PlutoKaiTi-v0.2-070419.zip的版本。经过填写框架后发现这个模板存在几点问题:
1。没有目录

解决方案:经过分析和尝试,在format.tex文件的第322行后面加入\tableofcontents

2。这样添加的默认目录只有两级,由于Kaiti.tex中采用的框架结构是section, subsection, subsubsection。没有采用chapter,这个默认目录中生成的只有两级,即只能到subsection。在开题报告中需要展示三级的内容,所以需要解决这个问题。

解决方案:在Format.tex的第73行的“\setcounter{tocdepth}{2”修改为“\setcounter{tocdepth}{3}”这个3就是展示三级结构目录的

3。目录中每个数字和随后的第一个标题字符相隔太远

解决方案:经过对比研究哈工大博士论文的Latex模板http://gf.cs.hit.edu.cn/frs/download.php/233/pluto-PhD-1.7-final-20061112.zip,发现在其下的Format.tex中117到130行之间有如下内容:
-----------------------------
% 按工大标准, 缩小目录中各级标题之间的缩进,使它们相隔一个字符距离,也就是12pt
\makeatletter
\renewcommand*\l@chapter{\@dottedtocline{1}{0em}{5.42em}}%控制英文目录
\renewcommand*\l@section{\@dottedtocline{1}{12pt}{12pt}}
\renewcommand*\l@subsection{\@dottedtocline{2}{24pt}{24pt}}
\renewcommand*\l@subsubsection{\@dottedtocline{3}{36pt}{36pt}}
\renewcommand*\l@paragraph{\@dottedtocline{4}{48pt}{48pt}}
\renewcommand*\l@subparagraph{\@dottedtocline{5}{60pt}{60pt}}
\makeatother
%控制中文目录
\dottedcontents{chapter}[3.4em]{\vspace{0.5em}\hspace{-3.4em}\hei \bf}{0.0em}{5pt}
\dottedcontents{section}[1.16cm]{}{1.8em}{5pt}
\dottedcontents{subsection}[2.00cm]{}{2.7em}{5pt}
\dottedcontents{subsubsection}[2.86cm]{}{3.4em}{5pt}
-----------------------------
发现这段就是控制目录中相应的那个数字和字符距离的,将这段代码拷到开题报告模板下的Format.tex的90行。呵呵,问题迎刃而解了 :)

4。目录字体颜色是红色,黑白打印出来颜色有点淡
经过询问实验室Latex大牛Lee师兄,说是这个开题模板以及博士论文模板都存在这个问题,好像还没有去解决。

解决方案:我想这个红色应该在开题模板中有所体现,在文件夹中查找"red",发现Package.tex文件中出现了四次“linkcolor=red,”,生成的目录中每个条目点击就能直接定位到文中相应的位置,从而得知目录中的条目就是一种链接。尝试将四个red都改为green,发现果然目录中字体变成了绿色。呵呵,修改为black也就得到了可以打印清楚的黑色了。不过撰写的过程中还是用red的比较好,因为那样非常的醒目的。

呵呵,自此,俺的开题报告模板也就算是个性化配置完毕了哦。由于是初学Latex,需要查阅的东西还有很多。不过Latex生成文件的质量真是没的说,非常不错,而且很多东西都能个性化配置。非常佩服Tex的创始人Knuth了。

2007年4月16日

Beamer 制作 Presentation

最近写了一篇关于单复数识别的论文,还在草稿阶段。由于是第一次使用Latex撰写论文,自然是辛苦了不少。明日轮到俺做报告了,本想用Power Point做,但是一想到可以使用Latex来试试,就开始用Latex中制作专业Presentation的工具包Beamer来完成了。

呵呵,学到了很多东西的。感觉Beamer真的很专业。最为欣赏的是通常咱们做PPT的时候需要手工去制作很多的导航页。这一点在Beamer中几乎不用自己动手,完全交给Beamer了。

俺主要参考了两份文档:
中科院自动化所自由软件协会 第二十七次活动:教你用Beamer做讲稿

Beamer v3.0 指南(pdf)