サポートベクトルマシン1
どうも、今日はデートの日です。安静時心拍数は平均100を超えています。心のリハビリをしてきますね!!
いきなりのカミングアウトすみません。
さて、本日の話題は、
サポートベクトルマシン
サポートベクトルマシンは、データ分析の現場において、注目されているモデルの1つです。”マージン最大化”と言う考え方に基づいて、主に2値の分類問題に使用されます。(2値以上も可能ですが、、)
しかし、計算コストが大きいので、大規模なデータセットには向いているとは言えません。小ー中規模のデータに適していると言うことです。
マージン最大化
この画像を見たらなんとなく分かるかもしれませんが。赤グループと青グループの最も近いデータの距離が最も遠くなるような、サポートベクトルを引きます。このいサポートベクトルから最も遠いと言うことは、偽陽性が少なくなると言うことです。少し難しいかもしれません。すみません。
理学療法やリハビリの分野っぽく解説
この画像の赤玉が歩行自立群、青玉が非歩行自立群のデータと仮定します。一番上、一番したにあるデータは分類しやすそうですが、境界部にあるデータは分類し辛いかもしれません。境界部のデータで最も群間に近いデータを正確に分類することができれば、正しく分類できるかと思います。と言うことで、最も近いデータに対してできるだけ正確に分けられるよう線(サポートベクトル)を引くことで、歩行自立群か非歩行自立群を分類できるのではないかと思いませんか?東京大学の研究室の資料が公開されていたので載せておきます。
非常に簡単になりましたが、失礼します。