IM-ContentsSearch Ver7.1 的语言结构要素解析引擎“MeCab”以及“cmecab-java”的版本已升级。

 
【更新内容】
与IM-ContentsSearch Ver7.1中使用的用于Solr服务器的文件打包。
升级了语言结构要素解析引擎“MeCab”和JNI绑定的“cmecab-java”。

已添加用于版本升级的文件,为[im_contents_search.zip]。
http://www.intra-mart.jp/download/try/im_contents_search.zip

另外、关于版本升级的详细步骤请参阅以下链接,“MeCab/cmecab-java 版本升级手册”。
https://www.intra-mart.jp/download/product/v71_doc/im_ContentsSearch/im_contentssearch_mecab_verup_guide_v71.pdf(日语)

■对象环境 使用IM-ContentsSearch Ver7.1,在文本解析方法中使用语言结构要素解析的环境

■更新内容:版本升级
MeCab: MeCab 0.97 → MeCab 0.98
cmecab-java: cmecab-java1.3 → cmecab-java1.6

■版本升级改进的问题

[Windows/UNIX一同解决的问题]
・使用cmecab-java对大数据进行爬虫操作时、由于OutOfMemoryError发生Solr服务器停止的问题被改进。
※上述问题是因为连续使用cmecab-java1.3时,会发生native空间(JVM外)的内存溢出,并且将native空间的内存不足作为JVM内的OutOfMemoryError来处理。

[仅在UNIX中解决的问题]
・修复了在64bit环境中使用MeCab的时,可以解析的最大文本大小被限制为与32bit环境相同大小的问题。
・修复了当MeCab执行语言结构要素解析失败时,Solr服务器停止的问题。
※ 编译cmecab-java的JNI代码时,在Makefile中追加了NDEBUG选项。

-- 适用对象 -------------------------------------------------------------------
iWP/Web系统构建基础/IM-ContentsSearch
--------------------------------------------------------------------------------

FAQID:108
这篇文章有帮助吗?
0 人中有 0 人觉得有帮助
由 Zendesk 提供技术支持