在 Ubuntu 16.04 上为 mecab Japanese tokenizer 安装 ipadic

install ipadic on Ubuntu 16.04 for mecab Japanese tokenizer

我正在尝试按照此处所述安装 mecab 和 ipadic 词典:http://taku910.github.io/mecab/#install-unix

我能够成功下载 mecab 并安装它并成功下载 ipadic 但卡在下面的第二行指令中:

% tar zxfv mecab-ipadic-2.7.0-XXXX.tar.gz
% mecab-ipadic-2.7.0-XXXX
% ./configure
% make
% su
# make install

我得到:

mecab-ipadic-2.7.0-20070801: command not found

我试了 chmod -x 然后又试了,但结果一样。

感谢任何帮助。

编辑(cat /etc/mecabrc 的结果)

;
; Configuration file of MeCab
;
; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $;
;
dicdir = /usr/local/lib/mecab/dic/mecab-ipadic-neologd

; userdic = /home/foo/bar/user.dic

; output-format-type = wakati
; input-buffer-size = 8192

; node-format = %m\n
; bos-format = %S\n
; eos-format = EOS\n

没有理由在 Ubuntu 16.04

上从源代码编译

简单的做法:

$ sudo apt-get update
$ sudo apt install mecab mecab-ipadic-utf8

然后用

测试
$ echo "日本語です" | mecab
日本  ニッポン    ニッポン    日本  名詞-固有名詞-地名-国        
語   ゴ   ゴ   語   名詞-普通名詞-一般      
です  デス  デス  です  助動詞 助動詞-デス  終止形-一般
EOS

如果事情不起作用,您可能需要通过设置 dicdir=SOMEPATH_TO_IPADIC

link /etc/mecabrc 到已安装的词典