Python

【Python】Pandas データフレームに列を追加する方法

Pandasはデータ処理に非常に便利なライブラリで、データフレームに新しい列を追加する操作はよく行われます。 列を追加する方法について、簡単にまとめます。 単純な列追加 Pandasでは、新しい列を追加するのはとても簡単です。 データフレー...
Python

【Python】Pandas データフレームを辞書やリストに変換する方法

Pandasのデータフレームを辞書やリストに変換することは、データをPythonのネイティブな形式で扱いたい場合に便利です。 この記事では、具体的なコード例を交えながら、データフレームを辞書やリストに変換する方法を詳しく解説します。 データ...
Python

【Python】Pandas データフレームの重複削除(ユニーク化)

データ分析を行う際に、データフレームから重複行を取り除いてユニークな行を取得することはよくあります。 Pandasは、この操作を簡単かつ効率的に行えるメソッドを提供しています。 drop_duplicates メソッド Pandasでデータ...
Mathematics

正規分布とその重要性を分かりやすくまとめ

統計学の基本としてよく耳にする「正規分布」。 身近な例や応用を通じて、初心者にもわかりやすくその概念と重要性をまとめます。 また、正規分布がなぜ多くの現象に現れるのかを「中心極限定理」と関連づけて解説します。 正規分布とは? 正規分布とは、...
Mathematics

標準偏差と分散の意味を分かりやすくまとめ

統計学における「標準偏差」と「分散」は、データがどれだけバラついているかを測る重要な指標です。 それぞれの意味や使い方について、まとめてみます。 分散と標準偏差の違い 分散分散はデータのバラつきを数値化したもので、「データが平均値からどの程...
Mathematics

平均値・中央値・最頻値の違いを分かりやすくまとめ

統計学でよく使われる「平均値」「中央値」「最頻値」は、それぞれデータの中心を表すための指標です。 それぞれの意味や特徴、使いどころをまとめてみます。 平均値(Mean) 平均値は、データの合計をデータの数で割った値です。 日常的に「平均」と...
Python

【Python】Pandas データフレームを使ったランク計算

Pandasには、データをランク付けするための便利なメソッド rank() が用意されています。 これを使用することで、数値データに基づく順位を簡単に計算できます。 ランク計算の方法をまとめます。 基本的なランク計算 Pandasの ran...
Python

【Python】Pandas データフレームで相関係数を計算する方法

相関係数は、2つの変数間の関係性を示す統計量です。 Pythonのデータ分析ライブラリであるpandasを使用することで、簡単に計算することができます。 pandasを使った相関係数の計算方法をまとめます。 相関係数とは? 相関係数は、2つ...
Python

【Python】Pandas データフレームのカラム名変更方法

Pythonでは、データ分析ライブラリとして広く使用されているpandasを用いてデータフレーム(DataFrame)を操作します。 データを扱う中で、カラム名(列名)を変更する必要がある場面がよくあります。 カラム名を変更する理由として、...
Python

【Python】Pandas データフレームの列・行削除 drop

Pandasのdropメソッドを使用すると、データフレームから指定した行または列を削除できます。 以下に使い方の詳細を説明します。 行を削除する 行を削除する場合、axis=0を指定します(デフォルト)。 構文 df.drop(labels...