CATEGORY

Pandas

  • 2024年6月16日
  • 2024年6月15日

【Pandas】データフレームをExcelのテンプレートファイルに出力する

PandasではデータフレームをExcelファイルとして出力することができます。場合によっては、所定フォーマットのExcelに対してデータフレームの値を出力したい場合もあると思います。 今回は、Excelのテンプレートファイルにデータフレームを出力する方法を紹介します。 前提 今回は、以下のような請 […]

  • 2024年6月6日
  • 2024年6月6日

【Pandas】固定長データを読み込む

今回はPandasで固定長ファイルを読み込む方法を紹介します。 固定長とは 固定長データは、その名の通りデータの長さが固定の形式です。各レコードの長さが一定の長さに設定されており、各フィールドにはその長さの中で一定の桁数が与えられます。 固定長データの例を以下に挙げます。ヘッダは見やすいように付与し […]

  • 2023年6月17日
  • 2023年6月16日

【Pandas】Seriesで文字列をあいまい検索する

今回はPandasのSeriesで文字列のあいまい検索をする方法を紹介します。あいまい検索にもいくつか種類があり、Pandasでは部分一致、前方一致、後方一致で検索が可能です。 使用するデータ あいまい検索をする対象のSeriesを用意します。今回はフルーツの名前を10個集めたSeriesを作成しま […]

  • 2023年3月25日
  • 2023年6月6日

【Python】FlaskでWebアプリケーションを作る⑤ -DBから取得したPandasテーブルを画面に表示する

これまでFlaskでWebアプリケーションを構築する方法について紹介してきましたが、今回はGETメソッドでのリクエストに応じてデータベースから取得したデータをテーブル形式で画面に表示してみようと思います。 過去のFlaskに関する記事は以下からご覧ください。 https://www.learning […]

  • 2023年3月17日
  • 2023年5月15日

【Python】データフレームの各要素に関数を適用する -applymap()

今回はPandasでデータフレームの各要素に関数を適用する方法について紹介します。以前apply()について紹介しましたが、今回はapplymap()についてです。 各行ごと、列ごとに処理を行いたい場合はaplly()の方が適しています。apply()については以下をご覧ください。 applymap […]

  • 2023年3月3日
  • 2023年5月15日

【Pandas】PostgreSQLからデータフレームに読み込む

Pandasでは様々なデータソースからのデータ連携に対応できるようにメソッドが用意されています。その中にはDBのテーブルから直接データをデータフレームに格納するメソッドもあります。 今回はPostgreSQLからSQLでSELECTしたデータをPandasデータフレームに格納する方法を紹介します。 […]

  • 2023年2月12日
  • 2023年5月15日

【Pandas】データフレームを行方向(縦方向)に結合する

今回は複数のデータフレームを行方向(縦方向)に結合する方法を紹介します。SQLではUNIONにあたるこの処理ですが、Pandasではappend()またはconcat()にて実装します。 それぞれの処理について見ていきます。 使用するデータ 今回は株価データを使いますが、属性(列)の同じデータフレー […]

  • 2023年2月5日
  • 2023年5月15日

【Pandas】データフレームでgroup byを使った集約・集計

Pandasでは様々なデータを加工、整形することができますが、その中の機能としてある条件でデータを集計することができます。 今回はPandasの集計関数であるgroupbyを用いてデータを集約・集計する方法を紹介します。 使用するデータ 今回はMicrosoftの株価データを使います。集計しやすいよ […]

  • 2023年1月25日
  • 2023年3月2日

【Pandas】FileNotFoundErrorの原因と対策

PandasのFileNotFoundErrorとは、指定したファイルが見つからない場合に返されるエラーです。 原因 ファイル名が誤っている 読み込めない理由として、指定しているファイル名が誤っている可能性があります。読み込みたいファイル名が正しいか確認してください。 また、ファイルのディレクトリ指 […]

  • 2022年12月12日
  • 2023年5月15日

【Pandas】DataFrame、Seriesの重複を抽出する/取り除く

膨大で整理されていないデータセットには、切り口によって重複するデータも存在しえます。 Pandasではそうした重複している行を抽出したり、除去することができます。今回はその方法について紹介します。 使用するデータ Kaggleから、FIFA22のMLS(Major League Soccer)所属の […]