2005年11月8日

Blog&Wiki with 信息抽取

随着Blog和Wiki时代的来临,以及RSS应用日渐壮大,现在的自然语言处理面临了新的挑战。以往的信息趋向于规范化,现在的信息非规范化的程度越来越严重。在这种情形下咱们原本积累的技术就需要可持续,自适应的发展下去。在这种每日信息量剧增的时代,如何做好自然语言处理及涉及到的信息抽取的问题就越发严重起来。

信息抽取主要包含实体抽取,共指抽取,关系抽取,以及再上层的模板生成与内容自动填写。这些东西的研究都需要很多的底层资源的支持。为此我们应该做好那些底层的相关资源和技术的积累工作。其中涉及到的每个环节每个细节都需要我们严肃认真的对待和完成,需要做到professional级别。

Good chance! Try more and do more! @

没有评论: