SEARCH

「Pandas」の検索結果82件

  • 2023年2月5日
  • 2023年5月15日

【Pandas】データフレームでgroup byを使った集約・集計

Pandasでは様々なデータを加工、整形することができますが、その中の機能としてある条件でデータを集計することができます。 今回はPandasの集計関数であるgroupbyを用いてデータを集約・集計する方法を紹介します。 使用するデータ 今回はMicrosoftの株価データを使います。集計しやすいよ […]

  • 2023年1月25日
  • 2023年3月2日

【Pandas】FileNotFoundErrorの原因と対策

PandasのFileNotFoundErrorとは、指定したファイルが見つからない場合に返されるエラーです。 原因 ファイル名が誤っている 読み込めない理由として、指定しているファイル名が誤っている可能性があります。読み込みたいファイル名が正しいか確認してください。 また、ファイルのディレクトリ指 […]

  • 2022年12月28日
  • 2023年3月2日

【Python】ZeroDivisionErrorの原因と対策

今回はZeroDivisionErrorについてです。 どんな時に起こるのか ZeroDivisionErrorは、文字通りゼロ(0)で割ろうとして起きるエラーです。例えば以下のような場合に起きます。 数値を0で割るという概念は数学的に存在しえず、プログラム上でこのように0で割ろうとするとエラーが返 […]

  • 2022年12月12日
  • 2023年5月15日

【Pandas】DataFrame、Seriesの重複を抽出する/取り除く

膨大で整理されていないデータセットには、切り口によって重複するデータも存在しえます。 Pandasではそうした重複している行を抽出したり、除去することができます。今回はその方法について紹介します。 使用するデータ Kaggleから、FIFA22のMLS(Major League Soccer)所属の […]

  • 2022年11月14日
  • 2023年5月15日

【Python】オフラインでパッケージをインストールする

PythonではPandasやOpenCVをはじめとして、便利なパッケージが多数提供されています。それらは通常ネットワークを経由してAnacondaやpip等のリポジトリからインストールします。 しかし、時にはネットワークの繋がらない閉鎖的な環境にPython環境を構築する必要もあり、その際はリポジ […]

  • 2022年11月9日
  • 2023年5月15日

【Python】環境にパッケージを一括インストール

全く同じPython環境を複数のサーバ環境に構築しなければいけない場面は、少なくないと思います。例えば開発環境、テスト環境、ステージング環境、本番環境で同じPython環境を構築する場合です。 その環境に多数のパッケージをインストールしなければならない場合、手間になるだけではなくインストール抜けとい […]

  • 2022年11月4日
  • 2023年5月15日

【Pandas】日付(datetime)型のデータを操作する

今回はPandasのDataFrameやSeriesで日付のデータを扱いたい場合の変換方法等を紹介していきます。 使用するデータ 今回はS&P500データを使用します。 日付型への変換 日付列をdatetime64型に変換 文字列項目をdatetime64型に変換するには、to_dateti […]

  • 2022年10月25日
  • 2023年3月2日

【Pandas】移動平均を求める -rolling()

時系列データの分析をする際に「移動平均」という言葉を聞いたことがあると思います。 今回は移動平均とはなにかということと、Pandasで移動平均の求め方について取り上げます。 移動平均とは 株価や気温など、時間の推移によって細かく値が変化するデータは、その変動の細かさ故に全体の傾向を掴むのが難しいケー […]

  • 2022年9月23日
  • 2023年5月15日

【Pandas】条件に一致する行にのみ処理を実行する -loc, mask(), where()

Pandasでデータの前処理をするときによくある処理に、「特定の条件に一致する行にのみに処理を加える」というのがあります(あると思います)。 今回はデータフレームに対して、ある条件に一致する行にのみ処理を実行する方法を紹介します。 前提 以下のようなデータフレームを準備します。ウォルマートの株価デー […]

  • 2022年9月18日
  • 2023年3月2日

【Pandas】データフレームの1行ごとに複雑な処理を実行する -apply()

Pandasのデータフレームで、1行ごとに処理を回したいケースというのはデータの前処理などでよくあると思います。 そういう場合に使えるのがapply()です。今回は、apply()の使い方をまとめていこうと思います。 前提 以下のようなデータフレームを準備します。ウォルマートの株価データです。 この […]