形態素解析

MeCab

MeCabは,最も利用されている形態素解析エンジンである。インストールしたら環境変数PATHの設定を行う。MeCabのインストール先がC:\Program Files (x86)\MeCab\binである場合,環境変数PATHにこのフォルダを追加する。

〔追加する手順〕

  1.  Windowsボタンから「設定」を開く。
  2. 設定画面が開いたら「システム」をクリックする。
  3. 左側に表示されるメニューから一番下の「詳細情報」をクリックする。 
  4. 右側の「関連設定」から「システムの詳細設定」をクリックする。
  5. 「システムのプロパティ」画面が表示されたら「環境変数」ボタンをクリックする。
  6. 「システム環境変数」(下側)の変数「Path」を選択して「編集」ボタンをクリックする。
  7. 「新規」ボタンをクリックして「C:\Program Files (x86)\MeCab\bin」を入力して「OK」をクリックする。
  8. 「OK」を押して開いた画面を閉じる。

これで環境変数の設定が完了した。

次に,コマンドプロンプトを起動して「mecab」と入力し,「今日はいい天気です。」と入力してエンターキーを押す。すると次のような結果が表示されればMeCabは無事インストールされている。

図1.MeCabの実行

MeCabのインストールフォルダと設定ファイル

デフォルト設定ではMeCabは C:\Program Files (x86)\MeCab にインストールされる(下図)。

図2.MeCabのインストールフォルダ

 このフォルダ内に「etc」というフォルダがあり,その中にmecabrcというファイルがある(下図)。これがMeCabの設定ファイルである。

図3.MeCabの設定ファイル mecabrc

 この設定ファイルには,MeCabのシステム辞書やユーザ辞書が設定できる。たとえば,システム辞書の設定は以下のようになっている。

dicdir =  $(rcpath)\..\dic\ipadic

リスト1.設定ファイル中のシステム辞書の設定

これは,システム辞書はmecabrcが置かれているフォルダ$(rcpath)の上のフォルダ配下にあるdicフォルダ内にあるipadicであることを意味する。辞書情報に関してはオプションに-Dを付けてmecabを実行すると,辞書ファイルや文字コード等の辞書情報が表示される(下図)。

C:\Users\mtana>mecab -D
filename:       C:\Program Files (x86)\MeCab\etc\..\dic\ipadic\sys.dic
version:        102
charset:        SHIFT-JIS
type:   0
size:   392126
left size:      1316
right size:     1316

図4.辞書情報の表示

0 件のコメント:

コメントを投稿

退院サマリーの標準化

 頼んでおいた「退院サマリー標準化の試み」 1) が届いたので読んでみた。この中に「 病院での診療録の質を向上させるために最も有効な方法の1つは、退院サマリーを監査することである 」という記述がある。その理由として「 日常的な診療記録(経過記録;progress note)は、入...