Pythonによるデータ分析・機械学習ブログ

Pythonによるデータの前処理・グラフ化、機械学習、統計解析、画像処理、Webスクレイピング、自然言語処理の基礎について紹介していきます。

MENU

【第11回】 matplotlibを用いた散布図の作成

はじめに

matplotlibは様々な種類のグラフを描画するライブラリで、描画できるのは主に2次元のプロットですが、3次元プロットの機能も追加されてきています。

例えば以下の様なグラフを作成することができます。

本記事では、matplotlibを用いた散布図の描画方法を確認していきます。

SAMURAI TERAKOYA

 

1. 散布図の基本的な書き方

散布図を描画するには以下のようにplt.scatter()を用います。公式のページはこちらです。以下の例では、x1,y1の20個のプロットデータ、x2,y2のプロットデータを作成してplt.scatter()を用いて散布図を描画しています。

主な引数は以下の表になります。他にも知りたい方はこちらの記事を参照してください。

引数 意味
x,y グラフに表示するデータ
s マーカーのサイズ
c マーカーの色
marker マーカーの形
alpha マーカーの透明度(0~1)
linewidths マーカーの淵の線の太さ
edgecolors マーカーの淵の線の色

 

2. マーカーの形の設定

以下の例のように、マーカーの形の設定は引数markerを使います。設定できるマーカーの種類はこちらを参考にしてください。

3. マーカーのサイズの設定

以下の例のように、マーカーのサイズの設定は引数sを使います。デフォルトは20となっています。

4. マーカーの色の設定

以下の例のように、マーカーのサイズの設定は引数cを使います。設定できるマーカーの色はこちらをご確認ください。

5. マーカの淵の線の太さと色の設定

以下の例のように、マーカーの淵の線の太さの設定は引数linewidthsを、色の設定は引数edgecolorsを使います。

6. マーカーの透明度の設定

以下の例のように、マーカーの透明度の設定は引数alphaを使います。

オススメ書籍

Pythonによるあたらしいデータ分析の教科書

Python3エンジニア認定データ分析試験の教科書にもなっている書籍で、データ分析に必要なPythonの基礎手法を身に付けることができます。具体的には、numpyとpandasを用いたデータの前処理、matplotlibを用いたデータのグラフ化、scikit-learnを用いた機械学習の基礎記述方法を身に付けることができます。これ一つで基礎はバッチリで、実務でも十分活用できると思います。個人的には見やすい書籍でした。

データサイエンス教本 Pythonで学ぶ統計分析・パターン認識・深層学習・信号処理・時系列データ分析

こちらの書籍は初心者から少し記述できるようになった人、かつ数学的な理論と一緒にPythonの記述方法を理解したい方にオススメです。統計分析、パターン認識、深層学習、信号処理、時系列データといった幅広く実務で使用する手法を学びたい方にもオススメです。

東京大学のデータサイエンティスト育成講座 ~Pythonで手を動かして学ぶデ―タ分析~

こちらの基礎を抑えながら実務で必要なPython記述法を学べる書籍です。基礎を一つ一つ抑えるというよりも実務で活用できるように必要な知識を身に付けられると感じました。これ一冊あれば十分かなと思いました。

 

スキル修得&転職

 近年、DXの進展に伴うデジタル人材の需要の高まりに追いついていない状況が続いていると経済産業省がホームページで記載している通り、DX人材、IT人材が不足しているのが現状です。さらにコンピュータの性能向上やAI技術の発展により、よりDX人材、IT人材の需要が高まってきます。さらには、今後の長期間安定して職がある業種とも考えられます。

以下の求人では、IT業界の転職や、IT未経験だけどIT人材を志望する就活を支援してくれます。無料で会員登録もできるので、まずは登録だけでもして様子を見てみてはいかがでしょうか?

▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼

▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲

 

おわりに

本記事では、matplotlib散布図の描画方法を確認しました。簡単ではございますが、本記事はこのくらいの紹介で終了いたします。