- 2022年3月16日
- 2023年5月15日
【Pandas】DataFrame、Seriesのユニークな要素をカウントする
PandasはPythonにおける表計算ライブラリです。Excelで列のユニークな要素数および出現回数をカウントできるように、Pandasでも同様の操作が可能です。 今回はPandasのデータでユニークな要素をカウントする方法を紹介していきます。 使用するデータ Kaggleから、FIFA22のML […]
PandasはPythonにおける表計算ライブラリです。Excelで列のユニークな要素数および出現回数をカウントできるように、Pandasでも同様の操作が可能です。 今回はPandasのデータでユニークな要素をカウントする方法を紹介していきます。 使用するデータ Kaggleから、FIFA22のML […]
PandasではDataFrameだけでなく、Seriesというデータ構造も存在します。DataFrameとSeriesは相互に関連した構造ですが、それぞれ異なる特徴を持ち合わせています。 今回はSeriesの特徴とその作成方法について紹介します。 Seriesとは Pandas公式によると、Ser […]
前回はt検定について、中身と流れをまとめました。 https://www.learning-nao.com/?p=2589 今回は、そのt検定をPythonでやってみようと思います。 使用するデータ 今回は定番のアイリスデータセットを使っていきます。 さらに種類を追加します。iris.targetに […]
統計の勉強をしていると、t分布というワードに出くわします。母平均の区間推定をする際などに出てきますが、t分布とか難しそうなので後回しに、、というケースもあるあるだと思います(?)。 そこで今回は、t分布とはいったい何者なのかということを探っていこうと思います。実際にPythonでコードを書きながら、 […]
数学の世界には中心極限定理という必殺技のような定理が存在します。中心極限ってなんかかっこいいw 数学の定理を文字や式で眺めても、なかなかイメージできないこともあると思います。私自身も、学生の頃は教科書を眺めてもよく理解できず困りました。 ところがPythonを使えば、実際に計算したり図示したりしてそ […]
グラフを描画する際には見せたい値を描画するだけでは不十分な場合があります。それは、標準偏差や標準誤差を一緒に示すのが好ましい場合です。 標準偏差や標準誤差を示すことで、そのデータがどれほどのばらついているのかということがわかります。学術誌などでは、これがないグラフは信ぴょう性が低い結果として扱われる […]
前回はNumPy配列の構造を確認する方法および要素の指定方法(インデックス、スライシング)について紹介しました。 https://www.learning-nao.com/?p=2498 今回は配列での計算処理についてです。NumPy配列では各要素に対して計算処理が可能です。本記事では、配列での計算 […]
前回は、NumPy入門として配列の作成方法およびソートや要素の追加・削除といった操作を紹介しました。 https://www.learning-nao.com/?p=2477 今回は前回に続いてNumPy入門の2回目です。今回は、配列の構造の確認、変更および要素の指定方法(インデックス、スライシング […]
NumPyとは数値計算に特化したPythonのライブラリです。NumPyは科学や工学分野をはじめ広い分野で利用されているのも特徴です。 そのため、PythonでコーディングをするにあたってNumPyは避けて通れないといえます。そこで今回はNumPy初心者、ひいてはPython初心者の方に向けてNum […]
Pythonでは、数値計算ライブラリであるNumpyを用いることで、正規分布に従うデータを作成することができます。 本記事では、正規分布とは?というところから、Numpyで任意の正規分布データを作成する方法を紹介します。 正規分布とは 正規分布とは統計学でよく用いられる連続型確率分布で、ガウス分布と […]