Mathematics

Mathematics

期待値とは何か?分かりやすくまとめ

統計学における期待値(Expected Value)とは、確率分布における平均的な値のことを指します。 これは、確率的な試行を繰り返したときに、長期的に得られる平均的な結果を示します。 例えば、サイコロを振る場合、出る目の平均的な値を求める...
Mathematics

二項分布とは?分かりやすくまとめ

統計や確率の分野では、「成功・失敗」のような2つの結果がある試行を繰り返すことがよくあります。 例えば、「サイコロを投げて1が出るかどうか」「製品を検査して不良品かどうか」などです。 このようなケースで役に立つのが 二項分布(Binomia...
Mathematics

ベルヌーイ分布とは?分かりやすくまとめ

統計学や機械学習でよく登場する「ベルヌーイ分布(Bernoulli Distribution)」についてまとめます。 ベルヌーイ分布とは? ベルヌーイ分布とは、試行の結果が2つに分かれる確率分布です。 例えば、以下のような試行の結果です。 ...
Mathematics

指数型分布族とは?

統計学や機械学習において重要な「指数型分布族(exponential family)」は、多くの確率分布を統一的に表現できる便利な枠組みです。 正規分布やベルヌーイ分布、ポアソン分布など、幅広い分布がこの族に属します。 指数型分布族の定義、...
BI

BIやデータ分析における「チャート」の意味とは?

データの集計や分析の中で、しばしば「チャート」という言葉を使いますが、あらためてどういう意味?どの範囲?と思い、調べました。 「チャート(Chart)」とは、データを視覚的に表現するためのグラフや図表の総称です。 単なる数表は「チャート」と...
Mathematics

ロジスティック回帰とは?分かりやすくまとめ【Pythonサンプルコード付き】

ロジスティック回帰(Logistic Regression)は、分類問題を解くための機械学習アルゴリズムです。 名前に「回帰」と付いていますが、実際には回帰ではなく分類に使われます。 ロジスティック回帰の概要 ロジスティック回帰は、確率モデ...
Mathematics

【Python】k-means法を実装する方法

k-means法(k-means clustering)は、データをk個のクラスター(グループ)に分割するための教師なし学習アルゴリズムです。 データの分類やパターン認識、異常検知などに広く使われます。 k-means法の基本的な流れ k-...
Mathematics

異常値を含むデータのスケーリング方法 – ロバストスケーリングの活用

データ分析や機械学習において、特徴量のスケーリング(標準化や正規化)は非常に重要です。 しかし、データに異常値(外れ値)が含まれている場合、一般的な標準化や正規化手法では適切にスケーリングできないことがあります。 そこで、異常値の影響を抑え...
Marketing

標本調査におけるサンプルサイズの決め方

標本調査では、母集団の一部(標本)を抽出し、その結果を元に全体の特性を推定します。 しかし、適切なサンプルサイズを決めないと、精度が低かったり、過剰なコストがかかったりする可能性があります。 本記事では、サンプルサイズの決定方法をまとめます...
Mathematics

偏差値とは何か?分かりやすくまとめ

偏差値は、テストの得点などを比較する際に用いられる指標であり、特定の集団の中でどの程度の位置にいるのかを示します。 一般的には受験や統計分析の場面で使われることが多いです。 偏差値の定義 偏差値は、標準偏差と平均値を基に計算される指標です。...