2019-05-27 【ラビットチャレンジ】機械学習:その5 アルゴリズム ラビットチャレンジ 機械学習:その5 k近傍法 分類のための機械学習法 ある点から近いk個から自身の分類を決定する手法 k個のクラスラベルの中で最も多いラベルを割り当てる 特徴 kの個数を変化させると結果も変わる kを大きくすると決定境界滑らかになる k平均法(k-means) 教師なし学習 クラスタリング手法 与えられたデータをk個のクラスタに分類する ※何個に分ければ良いかをどうやって決めるのか? → ビジネスの専門家が決めるなど… DeepLearningでもビジネスを理解している人といっしょにシステム構築、評価を実施するなどがプラクティスにはなってきている k平均法(k-means)のアルゴリズム 1) 各クラスタ中心初期値を設定する 2) 各データ点に対して、各クラスタ中心と距離を計算し、 最も距離が近いクラスタを割り当てる 3) 各クラスタ平均ベクトル(中心)を計算する 4) 収束するまで2, 3処理を繰り返す