java实现NLPIR(ICTCLAS)分词

1、NLPIR简介

        NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。

    下载地址:http://ictclas.nlpir.org/downloads

 

2、目录介绍

     技术分享

     ReadMe:介绍

     Data:  系统核心词库

     doc:  文档,用法介绍

     include:系统头文件

     sample:NLPIR示例程序

     lib:   不同环境下的支撑库

     test:  测试数据

     bin:  ICTCLAS2014----------->分词系统
                           ICTCLAS-tools.exe-->分词的支撑工具,可用于测试,本处主要用来做用户词典导入
                           importuserdict.bat-->可将用户词典自动导入到系统内
                           NLPIR.dll-->Win32下的支撑动态链接库,其他环境的库,可以访问lib对应环境的库文件
                           NLPIR.lib
                           NLPIR_WinDemo.exe-->Win32下的演示程序,在Win8 32位下编译而成,部分环境可能不支持,或者显示异常

                          userdic.txt-->用户词典,用户可以自行编辑

 

 3、java代码  

       3.1  新建工程fenci导入lib库文件(sample\JnaTest_NLPIR\lib\jna-4.0.0.jar) 

       3.2  将sample\JnaTest_NLPIR\src\目录下文件复制到工程src直接使用

        技术分享

       3.3  修改代码        

       



 

文章来自:http://blog.csdn.net/u013758116/article/details/44174811
© 2021 jiaocheng.bubufx.com  联系我们
ICP备案:鲁ICP备09046678号-3