MeCabの新語辞書「MeCab-ipadic-NEologd」について

形態素解析器のMeCabに、「MeCab-ipadic-NEologd」という素晴らしい新語辞書がありますので、その使い方について記します。

MeCab-ipadic-NEologd : https://github.com/neologd/mecab-ipadic-neologd

MeCab-ipadic-NEologdのインストールは下記で可能。

私はCentOSで動かしていて、MeCabはyumからインストールしており、最初はmecab-configが見つからないと言われてしまいましたが、mecab-develをyumでインストールすれば大丈夫でした。

MeCab-ipadic-NEologdが正常にインストールできましたら、辞書を指定してMeCabを実行します。

デフォルトと比べるとこんな感じに、今風の単語は固有名詞として認識してくれます。

「超電磁砲」も「レールガン」という風に、読み方も補完されています!

辞書も更新されていくみたいなので、下記コマンドでアップデートします。

毎月更新をしていくとのことなので、月末にcronで自動アップデートするようにしておきました。

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です