Mathematics

BI

BIやデータ分析における「チャート」の意味とは?

データの集計や分析の中で、しばしば「チャート」という言葉を使いますが、あらためてどういう意味?どの範囲?と思い、調べました。 「チャート(Chart)」とは、データを視覚的に表現するためのグラフや図表の総称です。 単なる数表は「チャート」と...
Mathematics

ロジスティック回帰とは?分かりやすくまとめ【Pythonサンプルコード付き】

ロジスティック回帰(Logistic Regression)は、分類問題を解くための機械学習アルゴリズムです。 名前に「回帰」と付いていますが、実際には回帰ではなく分類に使われます。 ロジスティック回帰の概要 ロジスティック回帰は、確率モデ...
Mathematics

【Python】k-means法を実装する方法

k-means法(k-means clustering)は、データをk個のクラスター(グループ)に分割するための教師なし学習アルゴリズムです。 データの分類やパターン認識、異常検知などに広く使われます。 k-means法の基本的な流れ k-...
Mathematics

異常値を含むデータのスケーリング方法 – ロバストスケーリングの活用

データ分析や機械学習において、特徴量のスケーリング(標準化や正規化)は非常に重要です。 しかし、データに異常値(外れ値)が含まれている場合、一般的な標準化や正規化手法では適切にスケーリングできないことがあります。 そこで、異常値の影響を抑え...
Marketing

標本調査におけるサンプルサイズの決め方

標本調査では、母集団の一部(標本)を抽出し、その結果を元に全体の特性を推定します。 しかし、適切なサンプルサイズを決めないと、精度が低かったり、過剰なコストがかかったりする可能性があります。 本記事では、サンプルサイズの決定方法をまとめます...
Mathematics

偏差値とは何か?分かりやすくまとめ

偏差値は、テストの得点などを比較する際に用いられる指標であり、特定の集団の中でどの程度の位置にいるのかを示します。 一般的には受験や統計分析の場面で使われることが多いです。 偏差値の定義 偏差値は、標準偏差と平均値を基に計算される指標です。...
Marketing

マーケティング・ミックス・モデル(MMM)とは?分かりやすくまとめ Pythonコード付

マーケティング・ミックス・モデル(Marketing Mix Modeling、MMM)は、広告、価格、販促、流通などのマーケティング施策が売上に与える影響を統計的手法で分析するモデルです。 MMMは、過去のマーケティングデータを活用し、各...
Marketing

ランダム化比較実験とは?分かりやすくまとめ

ランダム化比較実験(Randomized Controlled Trial, RCT)は、統計学的に因果関係を明確にするための手法の一つです。 RCTでは、対象となる被験者を無作為(ランダム)に介入群と対照群に分け、特定の処置(介入)を行っ...
Marketing

クロス集計とは?分かりやすくまとめ

クロス集計(Cross Tabulation)とは、2つ以上のカテゴリ変数(質的データ)を組み合わせてデータの関係性を分析する手法です。 通常、行と列に異なるカテゴリ変数を配置し、それらの交差するセルに集計結果を表示する表(クロス集計表)を...
Mathematics

統計とビッグデータ分析の違いを分かりやすくまとめ

統計とビッグデータ分析はどちらもデータを扱う分野ですが、その目的、手法、データ量、適用範囲などにおいて大きな違いがあります。 本記事では、この2つの分野の違いをまとめます。 目的の違い 統計 統計の主な目的は、データを基に仮説を立て、その仮...