Mathematics

Mathematics

期待値とは何か?分かりやすくまとめ

統計学における期待値(Expected Value)とは、確率分布における平均的な値のことを指します。これは、確率的な試行を繰り返したときに、長期的に得られる平均的な結果を示します。例えば、サイコロを振る場合、出る目の平均的な値を求めること...
Mathematics

二項分布とは?分かりやすくまとめ

統計や確率の分野では、「成功・失敗」のような2つの結果がある試行を繰り返すことがよくあります。例えば、「サイコロを投げて1が出るかどうか」「製品を検査して不良品かどうか」などです。このようなケースで役に立つのが 二項分布(Binomial ...
Mathematics

ベルヌーイ分布とは?分かりやすくまとめ

統計学や機械学習でよく登場する「ベルヌーイ分布(Bernoulli Distribution)」についてまとめます。ベルヌーイ分布とは?ベルヌーイ分布とは、試行の結果が2つに分かれる確率分布です。例えば、以下のような試行の結果です。コインを...
Mathematics

指数型分布族とは?

統計学や機械学習において重要な「指数型分布族(exponential family)」は、多くの確率分布を統一的に表現できる便利な枠組みです。正規分布やベルヌーイ分布、ポアソン分布など、幅広い分布がこの族に属します。指数型分布族の定義、具体...
BI

BIやデータ分析における「チャート」の意味とは?

データの集計や分析の中で、しばしば「チャート」という言葉を使いますが、あらためてどういう意味?どの範囲?と思い、調べました。「チャート(Chart)」とは、データを視覚的に表現するためのグラフや図表の総称です。単なる数表は「チャート」とは呼...
Mathematics

ロジスティック回帰とは?分かりやすくまとめ【Pythonサンプルコード付き】

ロジスティック回帰(Logistic Regression)は、分類問題を解くための機械学習アルゴリズムです。名前に「回帰」と付いていますが、実際には回帰ではなく分類に使われます。ロジスティック回帰の概要ロジスティック回帰は、確率モデルを用...
Mathematics

【Python】k-means法を実装する方法

k-means法(k-means clustering)は、データをk個のクラスター(グループ)に分割するための教師なし学習アルゴリズムです。データの分類やパターン認識、異常検知などに広く使われます。k-means法の基本的な流れk-mea...
Mathematics

異常値を含むデータのスケーリング方法 – ロバストスケーリングの活用

データ分析や機械学習において、特徴量のスケーリング(標準化や正規化)は非常に重要です。しかし、データに異常値(外れ値)が含まれている場合、一般的な標準化や正規化手法では適切にスケーリングできないことがあります。そこで、異常値の影響を抑えなが...
Marketing

標本調査におけるサンプルサイズの決め方

標本調査では、母集団の一部(標本)を抽出し、その結果を元に全体の特性を推定します。しかし、適切なサンプルサイズを決めないと、精度が低かったり、過剰なコストがかかったりする可能性があります。本記事では、サンプルサイズの決定方法をまとめます。サ...
Mathematics

偏差値とは何か?分かりやすくまとめ

偏差値は、テストの得点などを比較する際に用いられる指標であり、特定の集団の中でどの程度の位置にいるのかを示します。一般的には受験や統計分析の場面で使われることが多いです。偏差値の定義偏差値は、標準偏差と平均値を基に計算される指標です。数学的...