MeCab
MeCabは,最も利用されている形態素解析エンジンである。インストールしたら環境変数PATHの設定を行う。MeCabのインストール先がC:\Program Files (x86)\MeCab\binである場合,環境変数PATHにこのフォルダを追加する。
〔追加する手順〕
- Windowsボタンから「設定」を開く。
- 設定画面が開いたら「システム」をクリックする。
- 左側に表示されるメニューから一番下の「詳細情報」をクリックする。
- 右側の「関連設定」から「システムの詳細設定」をクリックする。
- 「システムのプロパティ」画面が表示されたら「環境変数」ボタンをクリックする。
- 「システム環境変数」(下側)の変数「Path」を選択して「編集」ボタンをクリックする。
- 「新規」ボタンをクリックして「C:\Program Files (x86)\MeCab\bin」を入力して「OK」をクリックする。
- 「OK」を押して開いた画面を閉じる。
これで環境変数の設定が完了した。
次に,コマンドプロンプトを起動して「mecab」と入力し,「今日はいい天気です。」と入力してエンターキーを押す。すると次のような結果が表示されればMeCabは無事インストールされている。
図1.MeCabの実行 |
MeCabのインストールフォルダと設定ファイル
デフォルト設定ではMeCabは C:\Program Files (x86)\MeCab にインストールされる(下図)。
図2.MeCabのインストールフォルダ |
このフォルダ内に「etc」というフォルダがあり,その中にmecabrcというファイルがある(下図)。これがMeCabの設定ファイルである。
図3.MeCabの設定ファイル mecabrc |
この設定ファイルには,MeCabのシステム辞書やユーザ辞書が設定できる。たとえば,システム辞書の設定は以下のようになっている。
dicdir = $(rcpath)\..\dic\ipadic
リスト1.設定ファイル中のシステム辞書の設定
これは,システム辞書はmecabrcが置かれているフォルダ$(rcpath)の上のフォルダ配下にあるdicフォルダ内にあるipadicであることを意味する。辞書情報に関してはオプションに-Dを付けてmecabを実行すると,辞書ファイルや文字コード等の辞書情報が表示される(下図)。
C:\Users\mtana>mecab -D filename: C:\Program Files (x86)\MeCab\etc\..\dic\ipadic\sys.dic version: 102 charset: SHIFT-JIS type: 0 size: 392126 left size: 1316 right size: 1316
図4.辞書情報の表示
0 件のコメント:
コメントを投稿