アンサンブル学習-機械学習-
どうも、彼女を呼ぶ際に、なんて呼ぶのか?と聞かれて、とっさに"子猫ちゃん"と答えてしまったんですよ。いきなりのカミングアウトすみません。Guchinakaです。
アンサンブル学習
アンサンブル学習とは、複数の学習器を組み合わせて予測をするモデルのことです。単一のモデルより、精度が高くなることが多いです。非常に簡単に説明すると決定木を組み合わせるとより、分類問題などを正確に回答出来るでしょ!と言うことですね。
具体的には、平均とか多数決などの処理を組み合わせます。最近、医療の分野でも流行っているランダムフォレストやブースティングなどがあります。
学習器を組み合わせると行っても、同じデータを組み合わせても意味はないんですよね。アイドルの嵐も全員が、松潤だったらいやでしょう。そんな感じですよ。でも、普通はデータって1つしかないんですよ。
と言うことで、ブースストラップと言う方法を使います。
ブーストラップ(Bootstrap sampling)
母集団から重複を許してランダムにいくらかデータを取り出して再標本化をする手法です。バギング(ブースストラップ集約)ともいいます。
スタッキング
ブースストラップは個々の予測値の重要度を考慮出来ていないので、スタッキングと言う方法を使用します。スタッキングは、予測値の加重平均を最終的な予測値として、モデルの重要度を考慮します。
バンピング
複数の予測器の中から、最も当てはまりの良いモデルを探すための手法です。予測誤差を最小にするモデルを最良のモデルとして選びます。
次回は、ランダムフォレストあたりを簡単に書いてみます。
前回の↓↓
あまり知らない方はこちらを↓