当前位置:  软件>java软件

结巴分词(java版) jieba-analysis

    来源:    发布时间:2015-01-16

    本文导语:  首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本。 结巴分词的原始版本为python编写,目前该项目在github上的关注量为170, 打星727次(最新的数据以原仓库为准),Fork238...

首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本。

结巴分词的原始版本为python编写,目前该项目在github上的关注量为170, 打星727次(最新的数据以原仓库为准),Fork238次,可以说已经有一定的用户群。

结巴分词(java版)只保留的原项目针对搜索引擎分词的功能(cut_for_index、cut_for_search),词性标注,关键词提取没有实现(今后如用到,可以考虑实现)。

简介 支持分词模式
  • Search模式,用于对用户查询词分词
  • Index模式,用于对索引文档分词
如何获取
  • git clone https://github.com/huaban/jieba-analysis.git
  • cd jieba-analysis
  • mvn package install ,安装到本地仓库
  • 在你的 pom.xml 文件中添加以下依赖。

    
 
 
 
本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • 中文分词库 Paoding
  • 中文分词开源版 CRF
  • 中文分词PHP扩展 MFSOU
  • 开源中文分词系统 HTTPCWS
  • 简易中文分词系统 SCWS
  • 中文分词库 Chinese dialect convert
  • Lucene中文分词库 ICTCLAS4J
  • 中文分词库 PHPCWS
  • 智能中文分词模块 imdict-chinese-analyzer
  • 中文分词库 IKAnalyzer
  • 中科院中文分词 ICTCLAS
  • Ruby中文分词器 rmmseg-cpp
  • PHP中文分词扩展 robbe
  • 中文分词库 NlpBamboo
  • http协议中文分词 http-scws
  • 请问谁有中科院ICTCLAS分词程序的源码,共享一下
  • 中文分词工具包 smallseg
  • 使用Discuz关键词服务器实现PHP中文分词
  • PHPAnalysis中文分词类详解
  • 开源php中文分词系统SCWS安装和使用实例


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3