Mathematics

指数型分布族とは?

統計学や機械学習において重要な「指数型分布族(exponential family)」は、多くの確率分布を統一的に表現できる便利な枠組みです。 正規分布やベルヌーイ分布、ポアソン分布など、幅広い分布がこの族に属します。 指数型分布族の定義、...
BI

BIやデータ分析における「チャート」の意味とは?

データの集計や分析の中で、しばしば「チャート」という言葉を使いますが、あらためてどういう意味?どの範囲?と思い、調べました。 「チャート(Chart)」とは、データを視覚的に表現するためのグラフや図表の総称です。 単なる数表は「チャート」と...
Python

【Streamlit】Selectboxの状態をセッションに保持する方法

Streamlitのst.selectboxは、ページをリロードすると選択状態が初期化される仕様になっています。 しかし、アプリの操作中にページを遷移しても、選択した値を維持したいケースがあるでしょう。 本記事では、StreamlitのSe...
Mathematics

ロジスティック回帰とは?分かりやすくまとめ【Pythonサンプルコード付き】

ロジスティック回帰(Logistic Regression)は、分類問題を解くための機械学習アルゴリズムです。 名前に「回帰」と付いていますが、実際には回帰ではなく分類に使われます。 ロジスティック回帰の概要 ロジスティック回帰は、確率モデ...
Azure

【Azure】サービスエンドポイントとプライベートエンドポイントとは

はじめに Azureでネットワークセキュリティを強化し、リソースに安全にアクセスするための方法として「サービスエンドポイント」と「プライベートエンドポイント」があります。 本記事では、それぞれの特徴、メリット、設定方法についてまとめます。 ...
Azure

Azure App Serviceとは?Webアプリを簡単デプロイ

Azure App Serviceは、Microsoft Azureが提供するフルマネージドのPaaS(Platform as a Service)環境であり、WebアプリケーションやAPIを迅速にデプロイし、スケーリングできるクラウドサー...
Mathematics

【Python】k-means法を実装する方法

k-means法(k-means clustering)は、データをk個のクラスター(グループ)に分割するための教師なし学習アルゴリズムです。 データの分類やパターン認識、異常検知などに広く使われます。 k-means法の基本的な流れ k-...
Mathematics

異常値を含むデータのスケーリング方法 – ロバストスケーリングの活用

データ分析や機械学習において、特徴量のスケーリング(標準化や正規化)は非常に重要です。 しかし、データに異常値(外れ値)が含まれている場合、一般的な標準化や正規化手法では適切にスケーリングできないことがあります。 そこで、異常値の影響を抑え...
PowerShell

【PowerShell】moreコマンドの使い方

moreは、PowerShellで大量の出力をページ送りしながら表示するためのコマンドです。 Out-Host -PagingがPowerShell 7以降で削除されたため、代替手段としてmoreを活用できます。 Linuxのlessほど高...
Marketing

標本調査におけるサンプルサイズの決め方

標本調査では、母集団の一部(標本)を抽出し、その結果を元に全体の特性を推定します。 しかし、適切なサンプルサイズを決めないと、精度が低かったり、過剰なコストがかかったりする可能性があります。 本記事では、サンプルサイズの決定方法をまとめます...