混合ガウス分布
こんごうがうすぶんぷ
平均や分散共分散行列の異なるガウス分布を,何らかの重みで足し合わせてできる確率分布を混合ガウス分布とよぶ.クラスタリングの文脈においては,K個のクラスタに相当する異なるガウス分布が存在し,各データ点が,いずれかのガウス分布から生成される過程をモデル化している.そして,k-means法と類似したアプローチとして,現在の混合ガウス分布に基づいて各細胞がどのガウス分布に由来していそうかという期待値を求めるステップと,K個のガウス分布の平均と分散共分散行列および各ガウス分布の存在比を先述の期待値をもとに推定するステップをくり返すことで,最終的には各ガウス分布のパラメータと各データの由来するクラスタの期待値を得ることができる(これをEMアルゴリズムとよぶ)."k-means法と比較すると,分散共分散行列がクラスタごとに違うような場合や,クラスタの存在比が違う場合などをうまく考慮できる.また,各データ点がどのクラスタに所属するかは確率的に定量され,クラスタが曖昧なデータ点などを検出することもできる.(実験医学増刊3820より)
機械学習を生命科学に使う!
シークエンスや画像データをどう解析し、新たな生物学的発見につなげるか?
解説は発行当時の掲載内容に基づくものです
本コンテンツは,2018年まで更新されていた同名コンテンツを元に,新規追加・再編集したものです