CATEGORY

Pandas

  • 2022年9月23日
  • 2023年5月15日

【Pandas】条件に一致する行にのみ処理を実行する -loc, mask(), where()

Pandasでデータの前処理をするときによくある処理に、「特定の条件に一致する行にのみに処理を加える」というのがあります(あると思います)。 今回はデータフレームに対して、ある条件に一致する行にのみ処理を実行する方法を紹介します。 前提 以下のようなデータフレームを準備します。ウォルマートの株価デー […]

  • 2022年9月18日
  • 2023年3月2日

【Pandas】データフレームの1行ごとに複雑な処理を実行する -apply()

Pandasのデータフレームで、1行ごとに処理を回したいケースというのはデータの前処理などでよくあると思います。 そういう場合に使えるのがapply()です。今回は、apply()の使い方をまとめていこうと思います。 前提 以下のようなデータフレームを準備します。ウォルマートの株価データです。 この […]

  • 2022年8月9日
  • 2023年5月15日

【Python】Pandasで単一列をDataFrameとして抽出する

PandasのDataFrameで1列だけを抽出したいとき、意図せずSeriesになってしまって後続処理で扱いづらいケースがしばしばあります。 1列だけをDataFrameとして抽出することもできるので、どうすればSeriesになってどうすればDataFrameとして抽出できるのかを確認していきたい […]

  • 2022年8月1日
  • 2023年5月15日

【Python】PandasのDataFrameで指定のデータ型列のみ抽出する

PandasのDataFrameでは列ごとに決まったデータ型のデータを保持しなければなりませんが、それさえ守れば様々なデータ型のデータを1つのDataFrameで持つことができます。 色々な型のデータが存在する中で、指定のデータ型の列のみを抽出したいケースは少なからずあると思います。 Pandasで […]

  • 2022年6月23日
  • 2023年5月15日

【Python】Pandasでパーセンタイルを取得する方法

PandasのデータフレームやSeriesでは、パーセンタイルを取得してデータの特徴を把握したり、外れ値となるようなデータを除外することができます。 今回は、対象データのパーセンタイルを取得する方法を紹介します。 パーセンタイルについて パーセンタイルとは?について確認しておきます。その前に、中央値 […]

  • 2022年6月5日
  • 2023年5月15日

【Pandas】csvファイルの読込、書き出し方法を紹介

Pandasではcsvファイルをデータフレームとして読み込んだり、データフレームをcsvファイルに出力することができます。 今回はそれら操作の方法について紹介します。 csvの読込 まずはpandasモジュールを読み込む必要があるので、import文でpandasを読み込みます。 csvの読込にはp […]

  • 2022年6月2日
  • 2023年5月15日

【Pandas】Excelファイルの読込、書き出し方法を紹介

PandasではExcelファイルをデータフレームとして読み込んだり、データフレームをExcelファイルに出力することができます。 今回はそれら操作の方法について紹介します。 Excelの読込 まずはpandasモジュールを読み込む必要があるので、import文でpandasを読み込みます。 Exc […]

  • 2022年3月16日
  • 2023年5月15日

【Pandas】DataFrame、Seriesのユニークな要素をカウントする

PandasはPythonにおける表計算ライブラリです。Excelで列のユニークな要素数および出現回数をカウントできるように、Pandasでも同様の操作が可能です。 今回はPandasのデータでユニークな要素をカウントする方法を紹介していきます。 使用するデータ Kaggleから、FIFA22のML […]

  • 2022年3月13日
  • 2023年5月15日

【Pandas】Seriesの特徴と作成方法を解説

PandasではDataFrameだけでなく、Seriesというデータ構造も存在します。DataFrameとSeriesは相互に関連した構造ですが、それぞれ異なる特徴を持ち合わせています。 今回はSeriesの特徴とその作成方法について紹介します。 Seriesとは Pandas公式によると、Ser […]

  • 2022年1月24日
  • 2023年5月15日

【Pandas】 データフレームをコピーしたいときにcopy()を使う意味

データフレームはPandasにおいてメインを担うであろう2次元表形式のオブジェクトです。プログラムの上ではデータフレームを加工する場面が多いですが、一方でオリジナルのデータフレームも保持しておきたいものです。そういう際は別変数にコピーしますが、=を使ってそのままデータフレームをコピーする場合と、co […]