Pythonによるデータ分析・機械学習ブログ

Pythonによるデータの前処理・グラフ化、機械学習、統計解析、画像処理、Webスクレイピング、自然言語処理の基礎について紹介していきます。

MENU

【第1回】Pythonを用いた形態素解析に必要なMecabのインストールと設定方法

はじめに

 自然言語処理(Natural Language Processing:NLP)は、人間の言語(自然言語)を機械で処理し、内容を抽出することです。自然言語処理には、形態素解析構文解析、意味解析、文脈解析などがあります。

 Pythonを用いて形態素解析をしようとすると、形態素解析用のライブラリであるMecabが必要になります。しかし、初心者の私はpip installはしたけど、Mecabの部分でエラーが出て非常に焦りました。その後、Mecabの動かし方を調べて実践したところ、正常に動作するようになりました。

 本記事では、Pythonを用いた形態素解析に必要なMecabのインストールと設定方法について説明します。

 

インストール方法と設定方法

公式ではないですが、以下のURLから取得すると簡単にMecabをインストールすることができます。

以下のURLに入って、「mecab-64-0.996.2.exe」をダウンロードしてください。

https://github.com/ikegami-yukino/mecab/releases

 

ダウンロードが完了したら、そのexeファイルをダブルクリックしてください。

そしたら以下の画面のように、セットアップに使用する言語を聞かれるので、「日本語」で「OK」ボタンをクリックください。

 

次は辞書の文字コードの選択を聞かれるので、「UTF-8」を選択して、「次へ」ボタンをクリックしてください。

 

次に、使用許諾契約書の同意が出るので、「同意する」を選択して「次へ」ボタンをクリックしてください。

 

次にインストール先の指定の画面が出てきます、デフォルトの「C:\Program Files\Mecab」のまま「次へ」のボタンを押してください。

※インストール先を変更したい人はここで変更してください。またその際にそのアドレスを後程使いますので、覚えておいてください。

 

次に、インストール準備完了が出るので、「インストール」ボタンをクリックしてください。

 

次に以下のようなメッセージが出ますが、「はい」ボタンをクリックしてください。

 

次に以下のようなメッセージが出ますが、「OK」ボタンをクリックしてください。

 

MeCab64セットアップウィザードの完了、と出てきます。「完了」ボタンをクリックしてください。

 

次に、システムのプロパティを開きます。まず、キーボードの「Windows」と「R」を押してください。そうすると、ファイル名を指定して実行、と表示されるので、名前の部分に「sysdm.cpl」と打ち込んで、「OK」をクリックしてください。

 

そうすると、システムのプロパティが開きます。その画面の上部にある「詳細設定」のタブをクリックしてください。

 

次に、「環境変数」をクリックしてください。

 

次にPathを選択して、その下にある「編集」ボタンをクリックしてください。

 

「新規」ボタンをクリックして、「C:¥Program Files¥Mecab¥bin」を追加してください。

 

そうすると、以下の画像のようになるので、下の「OK」ボタンをクリックしてください。以降、開いている画面も「OK」をクリックして終了です。

 

オススメ書籍

Pythonによるあたらしいデータ分析の教科書

Python3エンジニア認定データ分析試験の教科書にもなっている書籍で、データ分析に必要なPythonの基礎手法を身に付けることができます。具体的には、numpyとpandasを用いたデータの前処理、matplotlibを用いたデータのグラフ化、scikit-learnを用いた機械学習の基礎記述方法を身に付けることができます。これ一つで基礎はバッチリで、実務でも十分活用できると思います。個人的には見やすい書籍でした。

データサイエンス教本 Pythonで学ぶ統計分析・パターン認識・深層学習・信号処理・時系列データ分析

こちらの書籍は初心者から少し記述できるようになった人、かつ数学的な理論と一緒にPythonの記述方法を理解したい方にオススメです。統計分析、パターン認識、深層学習、信号処理、時系列データといった幅広く実務で使用する手法を学びたい方にもオススメです。

東京大学のデータサイエンティスト育成講座 ~Pythonで手を動かして学ぶデ―タ分析~

こちらの基礎を抑えながら実務で必要なPython記述法を学べる書籍です。基礎を一つ一つ抑えるというよりも実務で活用できるように必要な知識を身に付けられると感じました。これ一冊あれば十分かなと思いました。

 

スキル修得&転職

 近年、DXの進展に伴うデジタル人材の需要の高まりに追いついていない状況が続いていると経済産業省がホームページで記載している通り、DX人材、IT人材が不足しているのが現状です。さらにコンピュータの性能向上やAI技術の発展により、よりDX人材、IT人材の需要が高まってきます。さらには、今後の長期間安定して職がある業種とも考えられます。

以下の求人では、IT業界の転職や、IT未経験だけどIT人材を志望する就活を支援してくれます。無料で会員登録もできるので、まずは登録だけでもして様子を見てみてはいかがでしょうか?

▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼

▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲

 


おわりに

Python用いた形態素解析に必要なMecabのインストールと設定方法について説明しました。皆様のPythonを用いた形態素解析の役に立てば幸いです。