Search on the blog

2016年6月15日水曜日

scalaでneologd版kuromojiを使う

依存ライブラリ
scala-sample/build.sbt

以下の2行が対象。
resolvers += "CodeLibs Repository" at "http://maven.codelibs.org/"
"org.codelibs" % "lucene-analyzers-kuromoji-ipadic-neologd" % "6.0.0-20160519"

lucene-analyzers-kuromoji-ipadic-neologdのバージョンは公式レポジトリを見て最新のものを選ぶといい。

サンプルコード
ぱるる null 名詞-固有名詞-一般
と null 助詞-並立助詞
こじはる null 名詞-固有名詞-一般
と null 助詞-並立助詞
さや姉 null 名詞-固有名詞-一般
と null 助詞-並立助詞
ゆきりん null 名詞-固有名詞-一般
仕事で使うときは製品名や地名、店名などをうまく分かち書きしてくれるので重宝するはず。
ちなみにデフォルト辞書版kuromojiを使うと、以下のように綺麗に分かち書きできない。
ぱるるとこじはるとさや 名詞,一般,*,*
姉 名詞,一般,*,* 姉
と 助詞,並立助詞,*,*
ゆき 名詞,一般,*,*
りん 副詞,助詞類接続,*,*

0 件のコメント:

コメントを投稿