【ラビットチャレンジ】機械学習:その5 アルゴリズム

ラビットチャレンジ 機械学習:その5

k近傍法

  • 分類のための機械学習
  • ある点から近いk個から自身の分類を決定する手法
  • k個のクラスラベルの中で最も多いラベルを割り当てる

特徴

  • kの個数を変化させると結果も変わる
  • kを大きくすると決定境界􏰁滑らかになる

k平均法(k-means)

※何個に分ければ良いかをどうやって決めるのか? → ビジネスの専門家が決めるなど… DeepLearningでもビジネスを理解している人といっしょにシステム構築、評価を実施するなどがプラクティスにはなってきている

k平均法(k-means)のアルゴリズム

  • 1) 各クラスタ中心􏰀初期値を設定する
  • 2) 各データ点に対して、各クラスタ中心と􏰀距離を計算し、 最も距離が近いクラスタを割り当てる
  • 3) 各クラスタ􏰀平均ベクトル(中心)を計算する
  • 4) 収束するまで2, 3􏰀処理を繰り返す