- 2022年4月27日
- 2023年3月4日
【Python】PostgreSQLを操作する② -SELECT結果を取得する
前回はpsycopg2を使ってPythonからPostgreSQLに接続する方法を紹介しました。 https://www.learning-nao.com/?p=3002 今回はさらにSELECTのSQLを実行し、取得した結果の扱い方について触れていきたいと思います。本記事ではSQLでお望みのデータ […]
前回はpsycopg2を使ってPythonからPostgreSQLに接続する方法を紹介しました。 https://www.learning-nao.com/?p=3002 今回はさらにSELECTのSQLを実行し、取得した結果の扱い方について触れていきたいと思います。本記事ではSQLでお望みのデータ […]
多くの場合、ある集団の真の平均(母平均)は闇に包まれています。 たとえば、世界中の全ての男性の平均身長を正確に割り出すには、全ての男性の身長を測定しなければなりません。そんなん無理です。 こういった場合には、一部のサンプルからだいたいこれくらいの範囲に平均が収まるであろうという推測をします。それが母 […]
PandasはPythonにおける表計算ライブラリです。Excelで列のユニークな要素数および出現回数をカウントできるように、Pandasでも同様の操作が可能です。 今回はPandasのデータでユニークな要素をカウントする方法を紹介していきます。 使用するデータ Kaggleから、FIFA22のML […]
PandasではDataFrameだけでなく、Seriesというデータ構造も存在します。DataFrameとSeriesは相互に関連した構造ですが、それぞれ異なる特徴を持ち合わせています。 今回はSeriesの特徴とその作成方法について紹介します。 Seriesとは Pandas公式によると、Ser […]
前回はt検定について、中身と流れをまとめました。 https://www.learning-nao.com/?p=2589 今回は、そのt検定をPythonでやってみようと思います。 使用するデータ 今回は定番のアイリスデータセットを使っていきます。 さらに種類を追加します。iris.targetに […]
統計の勉強をしていると、t分布というワードに出くわします。母平均の区間推定をする際などに出てきますが、t分布とか難しそうなので後回しに、、というケースもあるあるだと思います(?)。 そこで今回は、t分布とはいったい何者なのかということを探っていこうと思います。実際にPythonでコードを書きながら、 […]
数学の世界には中心極限定理という必殺技のような定理が存在します。中心極限ってなんかかっこいいw 数学の定理を文字や式で眺めても、なかなかイメージできないこともあると思います。私自身も、学生の頃は教科書を眺めてもよく理解できず困りました。 ところがPythonを使えば、実際に計算したり図示したりしてそ […]
グラフを描画する際には見せたい値を描画するだけでは不十分な場合があります。それは、標準偏差や標準誤差を一緒に示すのが好ましい場合です。 標準偏差や標準誤差を示すことで、そのデータがどれほどのばらついているのかということがわかります。学術誌などでは、これがないグラフは信ぴょう性が低い結果として扱われる […]
前回はNumPy配列の構造を確認する方法および要素の指定方法(インデックス、スライシング)について紹介しました。 https://www.learning-nao.com/?p=2498 今回は配列での計算処理についてです。NumPy配列では各要素に対して計算処理が可能です。本記事では、配列での計算 […]
前回は、NumPy入門として配列の作成方法およびソートや要素の追加・削除といった操作を紹介しました。 https://www.learning-nao.com/?p=2477 今回は前回に続いてNumPy入門の2回目です。今回は、配列の構造の確認、変更および要素の指定方法(インデックス、スライシング […]