- 2023年6月17日
- 2023年6月16日
【Pandas】Seriesで文字列をあいまい検索する
今回はPandasのSeriesで文字列のあいまい検索をする方法を紹介します。あいまい検索にもいくつか種類があり、Pandasでは部分一致、前方一致、後方一致で検索が可能です。 使用するデータ あいまい検索をする対象のSeriesを用意します。今回はフルーツの名前を10個集めたSeriesを作成しま […]
今回はPandasのSeriesで文字列のあいまい検索をする方法を紹介します。あいまい検索にもいくつか種類があり、Pandasでは部分一致、前方一致、後方一致で検索が可能です。 使用するデータ あいまい検索をする対象のSeriesを用意します。今回はフルーツの名前を10個集めたSeriesを作成しま […]
これまでFlaskでWebアプリケーションを構築する方法について紹介してきましたが、今回はGETメソッドでのリクエストに応じてデータベースから取得したデータをテーブル形式で画面に表示してみようと思います。 過去のFlaskに関する記事は以下からご覧ください。 https://www.learning […]
今回はPandasでデータフレームの各要素に関数を適用する方法について紹介します。以前apply()について紹介しましたが、今回はapplymap()についてです。 各行ごと、列ごとに処理を行いたい場合はaplly()の方が適しています。apply()については以下をご覧ください。 applymap […]
Pandasでは様々なデータソースからのデータ連携に対応できるようにメソッドが用意されています。その中にはDBのテーブルから直接データをデータフレームに格納するメソッドもあります。 今回はPostgreSQLからSQLでSELECTしたデータをPandasデータフレームに格納する方法を紹介します。 […]
今回は複数のデータフレームを行方向(縦方向)に結合する方法を紹介します。SQLではUNIONにあたるこの処理ですが、Pandasではappend()またはconcat()にて実装します。 それぞれの処理について見ていきます。 使用するデータ 今回は株価データを使いますが、属性(列)の同じデータフレー […]
Pandasでは様々なデータを加工、整形することができますが、その中の機能としてある条件でデータを集計することができます。 今回はPandasの集計関数であるgroupbyを用いてデータを集約・集計する方法を紹介します。 使用するデータ 今回はMicrosoftの株価データを使います。集計しやすいよ […]
PandasのFileNotFoundErrorとは、指定したファイルが見つからない場合に返されるエラーです。 原因 ファイル名が誤っている 読み込めない理由として、指定しているファイル名が誤っている可能性があります。読み込みたいファイル名が正しいか確認してください。 また、ファイルのディレクトリ指 […]
膨大で整理されていないデータセットには、切り口によって重複するデータも存在しえます。 Pandasではそうした重複している行を抽出したり、除去することができます。今回はその方法について紹介します。 使用するデータ Kaggleから、FIFA22のMLS(Major League Soccer)所属の […]
今回はPandasのDataFrameやSeriesで日付のデータを扱いたい場合の変換方法等を紹介していきます。 使用するデータ 今回はS&P500データを使用します。 日付型への変換 日付列をdatetime64型に変換 文字列項目をdatetime64型に変換するには、to_dateti […]
時系列データの分析をする際に「移動平均」という言葉を聞いたことがあると思います。 今回は移動平均とはなにかということと、Pandasで移動平均の求め方について取り上げます。 移動平均とは 株価や気温など、時間の推移によって細かく値が変化するデータは、その変動の細かさ故に全体の傾向を掴むのが難しいケー […]