Python

【Python】Pandas データフレームの重複削除(ユニーク化)

データ分析を行う際に、データフレームから重複行を取り除いてユニークな行を取得することはよくあります。 Pandasは、この操作を簡単かつ効率的に行えるメソッドを提供しています。 drop_duplicates メソッド Pandasでデータ...
Mathematics

正規分布とその重要性を分かりやすくまとめ

統計学の基本としてよく耳にする「正規分布」。 身近な例や応用を通じて、初心者にもわかりやすくその概念と重要性をまとめます。 また、正規分布がなぜ多くの現象に現れるのかを「中心極限定理」と関連づけて解説します。 正規分布とは? 正規分布とは、...
Mathematics

標準偏差と分散の意味を分かりやすくまとめ

統計学における「標準偏差」と「分散」は、データがどれだけバラついているかを測る重要な指標です。 それぞれの意味や使い方について、まとめてみます。 分散と標準偏差の違い 分散分散はデータのバラつきを数値化したもので、「データが平均値からどの程...
Mathematics

平均値・中央値・最頻値の違いを分かりやすくまとめ

統計学でよく使われる「平均値」「中央値」「最頻値」は、それぞれデータの中心を表すための指標です。 それぞれの意味や特徴、使いどころをまとめてみます。 平均値(Mean) 平均値は、データの合計をデータの数で割った値です。 日常的に「平均」と...
Python

【Python】Pandas データフレームを使ったランク計算

Pandasには、データをランク付けするための便利なメソッド rank() が用意されています。 これを使用することで、数値データに基づく順位を簡単に計算できます。 ランク計算の方法をまとめます。 基本的なランク計算 Pandasの ran...
Python

【Python】Pandas データフレームで相関係数を計算する方法

相関係数は、2つの変数間の関係性を示す統計量です。 Pythonのデータ分析ライブラリであるpandasを使用することで、簡単に計算することができます。 pandasを使った相関係数の計算方法をまとめます。 相関係数とは? 相関係数は、2つ...
Python

【Python】Pandas データフレームのカラム名変更方法

Pythonでは、データ分析ライブラリとして広く使用されているpandasを用いてデータフレーム(DataFrame)を操作します。 データを扱う中で、カラム名(列名)を変更する必要がある場面がよくあります。 カラム名を変更する理由として、...
Python

【Python】Pandas データフレームの列・行削除 drop

Pandasのdropメソッドを使用すると、データフレームから指定した行または列を削除できます。 以下に使い方の詳細を説明します。 行を削除する 行を削除する場合、axis=0を指定します(デフォルト)。 構文 df.drop(labels...
Mathematics

不偏分散の分母が n-1 である理由 〜分かりやすい説明と数学的説明〜

不偏分散は、母集団分散の推定値をサンプルデータから計算するときに用いる統計量です。 サンプルデータから分散を計算するとき、単純にサンプルサイズで割るだけでは偏りが生じ、母集団分散の真の値を正確に推定できません。 その偏りを補正するために、分...
Python

【Python】icecreamライブラリを使用したデバッグ

Pythonの icecream は、デバッグをより簡単かつ効率的にするための便利なライブラリです。 コードの中で変数や式の値を確認する際、従来の print() 関数の代わりに使用することで、コードの内容や値の変化をわかりやすく表示 して...