/kmeans

K-Meansの試作コード

Primary LanguageRuby

K-Means

データを分類するクラスタリング技法のひとつである、K-Meansを実験的にRubyで実装してみた。

##参考文献

  • パッケージユーザーのための機械学習(7):K-meansクラスタリング Here!
  • k平均法 - Wikipedia Here!

memo

使用にあたって

  • 簡単な学習データ(低次元、分類データ少数)で、動作確認したのみ
  • 本格的に使用すると計算時間滅茶苦茶かかるので覚悟(マシンパワー必須)
  • 基本的にデータ数に計算時間比例します

学習データファイルのフォーマット

# N次元の特徴ベクトル(データ)
[data1] [data2] ... [dataN]   #一個目の学習ベクトル
[data1] [data2] ... [dataN]   #二個目の学習ベクトル

半角スペース区切りとする

# 記述例(二次元データの場合)
-2.416682586290083 -1.6340630148871529
-0.4611169335807954 1.1720161088656624
1.771127779864452 0.6400316433636748
0.3076072954507474 0.47308423467735405