2005年8月29日

Minipar使用方法:step by step

不知道各位有没有用过那个著名的Dekang Lin的英文下的依存分析工具Minipar。上午Yichen提起说不知道如何编译通过,考虑到过些日子我也会用到这个东西,我自告奋勇的把它放入VS7.0调试。本以为在当初调试C45R8经验的基础上能够很快完成这个工作,结果却迟迟调试不通。代码是Linux风格的,装上Cygwin后结果还是未能通过。刚才在Chengjie Sun的帮助下才解决掉这个问题。记得在咱们IR-BBS上有人问过类似的问题,我在这里给出运行成功下面的例子pdemo的全部过程。

1. 下载Minipar
在连接 http://www.cs.ualberta.ca/~lindek/minipar.htm下填表得到minipar-0.5-Windows.tar
2. 解压
用Winrar解压后得到minipar-0.5-Windows的没有后缀名的文件,人工添加后缀为zip然后再用Winrar解压得到解压包
里面包含如下子文件夹

minipar-0.5-Windows
|-README
|-data
|-include
|-lib
|-pdemo

3. 设置环境变量
右键单击“我的电脑”,在“高级”中选择“环境变量”。新建变量“MINIPATH”,值为上面data的绝对路径,如“D:\MiniPar\minipar-0.5-Windows\data”。

4. 设置VC7.0
新建VC++7.0 Windows控制台空项目,添加pdemo下的cpp文件pdemo.cpp。
打开项目属性设置“Configuration Properites”下面的C/C++下的General中的Additional Include Directories,添加上面的include文件夹路径
打开项目属性设置“Configuration Properites”下面的Linker下的General中的Additional Library Directories,添加上面的lib下的debug文件夹路径;在同层下的Additional Dependencies中添上“minipar.lib Ws2_32.lib”(中间有空格)

5. 编译运行
Build后在DOS界面下进入对应的Debug下,输入"pdemo.exe -p "D:\MiniPar\minipar-0.5-Windows\data" ",即可初始化依存分析平台,在>后输入英文句子即可进行依存分析,如下

> Many students like programming.
(
E0 (() fin C * )
1 (Many ~ Det 2 det (gov student))
2 (students student N 3 s (gov like))
3 (like ~ V E0 i (gov fin))
E2 (() student N 3 subj (gov like) (antecedent 2))
4 (programming ~ N 3 obj (gov like))
5 (. ~ U * punc)
)
>


至此完成了全部的工作,MINIPAR的中间结果可以被用于其它程序中,可以用来很方便的找到句子中的依存结构。
以上步骤留做记录,便于以后查找。

没有评论: