- 2022年7月20日
- 2023年5月15日
【Python】Noneとnumpy.nanの違いを把握する
Pythonで欠損値を扱う際に、Noneとnumpy.nanを混同すると欠損判定で思いがけないミスを起こしかねません。 今回はNoneとnumpy.nanの挙動の違いをまとめてみます。 定義 None None is the sole instance of the NoneTy […]
Pythonで欠損値を扱う際に、Noneとnumpy.nanを混同すると欠損判定で思いがけないミスを起こしかねません。 今回はNoneとnumpy.nanの挙動の違いをまとめてみます。 定義 None None is the sole instance of the NoneTy […]
以前に二項分布の概要をまとめ、その分布をPythonで可視化してみました。 二項分布を用いて検定を行うこともできます。二項検定は結果が2つに分類されるデータの比率が期待される比率に対して偏っているかを調べる際に用いる検定です。 今回は二項分布を用いた検定の流れを把握し、Pythonで検定を行ってみた […]
これまでに二項分布、ポアソン分布について紹介しましたが、確率分布には幾何分布という分布も存在します。今回は幾何分布がどういう分布なのかということを確認し、Pythonで幾何分布を描画してイメージを掴んでいきたいと思います。 本記事では、ポアソン分布をどのように求めるかではなく、ポアソンとはどういうも […]
統計では以前に紹介した二項分布のほかに、ポアソン分布というのも出てきます。ポアソン分布も二項分布同様確率分布のお話ですが、どのような分布なのかというところを確認していこうと思います。また、分布のイメージを掴むためにもPythonで分布の描画もしていきます。 本記事では、ポアソン分布をどのように求める […]
確率分布の1つに二項分布があります。今回は二項分布がどんなものなのかということを、Pythonでグラフを描いて、実際の分布を確認しながら見ていこうと思います。 二項分布とは ベルヌーイ試行 「成功か失敗か」「表か裏か」のように、2種類の結果しか得られないような試行をベルヌーイ試行と呼びます。ベルヌー […]
PandasのデータフレームやSeriesでは、パーセンタイルを取得してデータの特徴を把握したり、外れ値となるようなデータを除外することができます。 今回は、対象データのパーセンタイルを取得する方法を紹介します。 パーセンタイルについて パーセンタイルとは?について確認しておきます。その前に、中央値 […]
Pandasではcsvファイルをデータフレームとして読み込んだり、データフレームをcsvファイルに出力することができます。 今回はそれら操作の方法について紹介します。 csvの読込 まずはpandasモジュールを読み込む必要があるので、import文でpandasを読み込みます。 csvの読込にはp […]
PandasではExcelファイルをデータフレームとして読み込んだり、データフレームをExcelファイルに出力することができます。 今回はそれら操作の方法について紹介します。 Excelの読込 まずはpandasモジュールを読み込む必要があるので、import文でpandasを読み込みます。 Exc […]
多くの場合、ある集団の真の平均(母平均)は闇に包まれています。 たとえば、世界中の全ての男性の平均身長を正確に割り出すには、全ての男性の身長を測定しなければなりません。そんなん無理です。 こういった場合には、一部のサンプルからだいたいこれくらいの範囲に平均が収まるであろうという推測をします。それが母 […]
matplotlibはPythonのグラフ描画ライブラリで、様々なグラフを描画することができます。そんなmatplotlibですが、なんとアニメーションで動くグラフを描画することもできるのです。 今回はサンプルデータを使ってグラフのアニメーション動画を作成する方法を紹介します。 出力結果とコード 今 […]