【Python】seabornで折れ線グラフを並べて描画する

seabornはmatplotlibと並ぶグラフ描画ライブラリです。今回は、複数のグラフをまとめて描画する方法について紹介します。

実際グラフを描いて可視化する場面では、似たようなグラフを大量に描画する場面もあると思います。例えば、x軸とy軸は同じで、期間や種類が異なるグラフを複数描画するといったことはよくあります。

seabornではこんな場面を想定して(?)複数グラフを描画できるオブジェクトが用意されています。今回は折れ線グラフを並べて描画してみたいと思います。本記事では、以下のようなグラフを描画できます。

※今回紹介する方法はseabornのバージョン0.11.0以降が動作要件となります。

使用するデータ

seabornではプロットを試すため各種データセットが用意されています。今回は、”flights”データセットを使用します。

import seaborn as sns

flights = sns.load_dataset("flights")
sns.load_dataset("flights")

描画する

relplot

棒グラフを並べて表示するためにrelplot()を用います。横軸”month”、縦軸”passengers”のグラフを”year”ごとに並べて描画した場合は以下のようになります。

sns.set_theme(style="dark")
g = sns.relplot(
    data=flights,
    x="month", y="passengers", col="year", col_wrap=3, hue="year",
    kind="line", palette="crest", linewidth=4, 
    height=2, aspect=1.5, legend=False,
)

この例では以下のようなグラフが描画されます。

sns.set_themeではグラフのテーマを指定します。今回はstyleを”dark”にしています。

パラメータがいくつかあるので、各意味を以下に示します。

data

インプットとなるデータセットを指定します。pandasのデータフレームやnumpyのndarrayが指定できます。ドキュメントにはその他フォーマットのデータセットも指定可能とありますが、明確な記載はありませんでした。

x, y

各グラフのxおよびy軸となる列を指定します。

row, col

グラフとして分けて描画する基準となる(グルーピングする)列を指定します。例では”year”ごとにグラフを分けるためにcol=”year”としています。

row= とすると複数のグラフが縦方向に並んで描画されます。col= とすると、グラフが横方向に並んで描画されます。

rowを指定した場合
rowを指定した場合
colを指定した場合
colを指定した場合

col_wrap

colを指定している場合に使用できるパラメータです。横一列に並んだグラフを、指定した数で区切って行方向に折り返します。

このパラメータはrowと一緒には使用できません。

hue

このパラメータを指定すると、グルーピングしたグループごとにグラフの色を分けて表示することができます。たとえば例のように”year”を指定すると、1949年と1960年のグラフでは色が異なるように描画されます。

kind

グラフの種類を指定します。relplotでは散布図または折れ線グラフを描画できます。よって、”scatter”または”line”のどちらかを指定します。

scatterを指定すると散布図が描画されます。

scatterを指定した場合
“scatter”とした場合

palette

グラフの色のパターンを指定します。以下の中から指定します。

'Accent', 'Accent_r', 'Blues', 'Blues_r', 'BrBG', 'BrBG_r', 'BuGn', 'BuGn_r',
'BuPu', 'BuPu_r', 'CMRmap', 'CMRmap_r', 'Dark2', 'Dark2_r', 'GnBu', 'GnBu_r',
'Greens', 'Greens_r', 'Greys', 'Greys_r', 'OrRd', 'OrRd_r', 'Oranges', 'Oranges_r',
'PRGn', 'PRGn_r', 'Paired', 'Paired_r', 'Pastel1', 'Pastel1_r', 'Pastel2', 
'Pastel2_r', 'PiYG', 'PiYG_r', 'PuBu', 'PuBuGn', 'PuBuGn_r', 'PuBu_r', 'PuOr', 
'PuOr_r', 'PuRd', 'PuRd_r', 'Purples', 'Purples_r', 'RdBu', 'RdBu_r', 'RdGy',
'RdGy_r', 'RdPu', 'RdPu_r', 'RdYlBu', 'RdYlBu_r', 'RdYlGn', 'RdYlGn_r', 'Reds',
'Reds_r', 'Set1', 'Set1_r', 'Set2', 'Set2_r', 'Set3', 'Set3_r', 'Spectral', 'Spectral_r',
'Wistia', 'Wistia_r', 'YlGn', 'YlGnBu', 'YlGnBu_r', 'YlGn_r', 'YlOrBr', 'YlOrBr_r', 'YlOrRd',
'YlOrRd_r', 'afmhot', 'afmhot_r', 'autumn', 'autumn_r', 'binary', 'binary_r', 'bone', 'bone_r',
'brg', 'brg_r', 'bwr', 'bwr_r', 'cividis', 'cividis_r', 'cool', 'cool_r', 'coolwarm', 
'coolwarm_r', 'copper', 'copper_r', 'crest', 'crest_r', 'cubehelix', 'cubehelix_r', 'flag',
'flag_r', 'flare', 'flare_r', 'gist_earth', 'gist_earth_r', 'gist_gray', 'gist_gray_r',
'gist_heat', 'gist_heat_r', 'gist_ncar', 'gist_ncar_r', 'gist_rainbow', 'gist_rainbow_r',
'gist_stern', 'gist_stern_r', 'gist_yarg', 'gist_yarg_r', 'gnuplot', 'gnuplot2', 'gnuplot2_r',
'gnuplot_r', 'gray', 'gray_r', 'hot', 'hot_r', 'hsv', 'hsv_r', 'icefire', 'icefire_r',
'inferno', 'inferno_r', 'jet', 'jet_r', 'magma', 'magma_r', 'mako', 'mako_r', 'nipy_spectral',
'nipy_spectral_r', 'ocean', 'ocean_r', 'pink', 'pink_r', 'plasma', 'plasma_r', 'prism',
'prism_r', 'rainbow', 'rainbow_r', 'rocket', 'rocket_r', 'seismic', 'seismic_r', 'spring',
'spring_r', 'summer', 'summer_r', 'tab10', 'tab10_r', 'tab20', 'tab20_r', 'tab20b', 'tab20b_r',
'tab20c', 'tab20c_r', 'terrain', 'terrain_r', 'turbo', 'turbo_r', 'twilight', 'twilight_r',
'twilight_shifted', 'twilight_shifted_r', 'viridis', 'viridis_r', 'vlag', 'vlag_r', 'winter',
'winter_r'

linewidth

グラフの線の太さです。

height, aspect

各グラフ間の間隔を指定します。heightは高さ、aspectは間隔のアスペクト比を指定します。なのでheight * aspectのインチ単位で間隔が決定します。したがって、height、aspectの両方が指定されていないと、意図した間隔にはならないので注意してください。

legend

凡例表記のルールを指定します。Falseの場合凡例は表示されません。その他、”auto”、”brief”、”full”を指定できます。

グラフの見た目を整える

あとは、グラフの見た目をかっこよくしていきます。

タイトルをかっこよくする

各グラフのタイトル(year=〇〇)の部分をいい感じにグラフ内に描画します。

for year, ax in g.axes_dict.items():
    ax.text(.8, .85, year, transform=ax.transAxes, fontweight="bold")
グラフ内にタイトルを描画

グラフ内にタイトルを表示できました。relplotではサブプロットの機能を内包しているので、for文で1つ1つのグラフに処理を加えることもできます。

細かい調整

最後にmatplotlibと同じようにグラフの見た目を調整します。

#x軸目盛の表示数を減らす
ax.set_xticks(ax.get_xticks()[::2])

#year=〇〇を消す(空白にする)
g.set_titles("")
#x軸とy軸のラベル表示指定
g.set_axis_labels("", "Passengers")
#レイアウト調整
g.tight_layout()

これで冒頭でお見せしたようなグラフが描画できます。

グラフ完成形

コード全体

ここまでのコードをまとめると以下のようになります。

import seaborn as sns


flights = sns.load_dataset("flights")

sns.set_theme(style="dark")
g = sns.relplot(
    data=flights,
    x="month", y="passengers", col="year", col_wrap=3, hue="year",
    kind="line", palette="crest", linewidth=4, 
    height=2, aspect=1.5, legend=False,
)

for year, ax in g.axes_dict.items():
    ax.text(.8, .85, year, transform=ax.transAxes, fontweight="bold")


#x軸目盛の表示数を減らす
ax.set_xticks(ax.get_xticks()[::2])

#year=〇〇を消す(空白にする)
g.set_titles("")
#x軸とy軸のラベル表示指定
g.set_axis_labels("", "Passengers")
#レイアウト調整
g.tight_layout()

Pythonでデータサイエンスするなら

Pythonでデータサイエンスをするなら、以下の書籍がおすすめです。Pandas、matplotlib、Numpy、scikit-learnといったデータサイエンスに必要なライブラリを、体系立てて一通り学ぶことができます。

ややお値段高めですが、これ1冊で十分という内容・ボリュームなので、損はしないと思います^^

まとめ

seabornで折れ線グラフを複数まとめて表示する方法を紹介しました。seabornはmatplotlibをベースにしていますが、簡単なコードでおしゃれなグラフを描画することができます。

是非試してみてください^^

ではでは👋