pandas

Python

【Python】PandasのDataFrameとSeriesの違い

PandasはPythonのデータ分析ライブラリで、データ操作における基本的なデータ構造としてDataFrameとSeriesの2つがあります。 これらの違いを理解することは、Pandasを使いこなすための重要なステップです。 この記事では...
Python

【Python】Pandasのmelt関数の使い方 縦持ちに変換

Pandasのmelt関数は、データフレームを所謂「横持ち形式」から「縦持ち形式」に変換するのに非常に便利なツールです。 データを可視化する際や、統計分析の前処理として使用することが多いです。 melt関数の基本的な使い方から、応用例までを...
Python

【Pandas】read_csvの複数回実行でデータが読み込めなくなる問題

Pandasのread_csv関数を使用して、CSVファイルからデータを読み込むことは頻繁に行われると思いますが、同じファイルストリームからread_csvを複数回実行すると、2回目以降の読み込みでデータが得られないという問題が発生すること...
Python

【Python】データフレームのCSV出力で指定できる文字コードの例

PandasのDataFrameをCSVに出力する際に指定できる文字コード(エンコーディング)には多種多様なものがありますが、主要なものをまとめます。 CSVファイルはテキストデータを格納するためのファイル形式であり、文字コードを指定するこ...
Python

【Python】pandasのSettingWithCopyWarningの対処法

事象 以下のコードでSettingWithCopyWarningが発生していました。 def proc(df) df = df[df[col] == 'test'] # 集計値項目を数値型に変換 df.loc[:, col_1] = pd....
Python

【Streamlit】「クリップボードにコピー」ボタンを作成

Streamlitでクリップボードにコピーボタンを実装するコードをメモしておきます。 コード streamlit.components.v1.htmlを利用したHTMLとJavaScriptの組み合わせで実装します。 この方法では、ボタンを...
Python

ワーニング解消 FutureWarning: The provided callable is currently using SeriesGroupBy.max.

Pythonの以下のようなコードでワーニングが発生しました。 コード df[col+'_max'] = df.groupby(['A','B','C'])[col].transform(max) ワーニング FutureWarning: T...
Python

【Python】SnowflakeへSQLを発行しSELECT結果をデータフレームに取得する方法

SnowflakeにSQLを発行して、結果をデータフレームに取得し、ついでにCSVファイルに出力してみます。 ライブラリをインストールしておきます。 pip install snowflake-connector-python pandas...
Python

【Django】テーブルを結合してデータフレームに取得する方法

django_pandas.io の read_frame 使用時に、結合したテーブルの項目をデータフレームに格納する方法に少しつまづいたため、方法を記載しておきます。 models.pyは以下のとおりです。商品テーブルと購入履歴テーブルが...