2.理学療法士のための人工知能概論 その2
[
AI(人工知能)の広い意味と画像を数字にするとは?
第1回目で早速うそをついてしまいましてた(笑)人工知能を3つ作っていました!
今回は、なぜ、コンピューターが画像を認識・分類できるのか?というイメージをしましょう。目標はイメージです。
ちょっと難しいかもしれないので、浅く説明したり、ちょっと深く説明したりと、いったり来たりしながら説明したいと思います。
まず、人工知能とか機械学習、ニューラルネットワークの言葉の違いについてです。
人工知能というのは、すごく広い概念のようなものです。リハビリテーションといえば広い概念ですよね。おそらくそんな感じで人工知能と呼ばれています。
ですから、機械翻訳も人工知能ですし、カメラの顔認識機能も人工知能です!チェスや囲碁の人工知能が人間に勝ったというニュースがありましたが、それも人工知能です!
ですが、それぞれ、人工知能でありながら中身の統計手法や数学的なところは様々。
医療に関する人工知能を安全に使うには、最低限、主成分分析やロジスティック回帰のような回帰分析など多変量解析のことを何となくでも知っておく必要があります!
(人工知能でなくても、最低限の統計知識は理学療法士に必要ですが)
ただ、ロジスティックのように2値化したものではなく 、最終的に10個以上に分けることも出来ます!上記のロジスティック回帰の図のように2次元にだと分類可能だとわかりますよね。
(なんとなくのイメージで大丈夫です)
この図はどうでしょう?
これだと赤と青の特徴的な部分が重なりすぎです。この状態だと、赤と青を分類するのは難しい。2次元だからです。
次は、この図です!
これは3次元空間ですよね!これなら分類できそうじゃありませんか?
青、緑、赤のプロットはそれぞれ別のものとして分けられそうです。
人間のイメージは3次元空間より高い次元空間のイメージは出来ませんが、次元空間を増やしていくと特徴量が増えても分類できそうです。
コンピューターには4次元空間以上も数学上で再現可能なんですね。
では、少し深く勉強して行きましょう。
理解しやすいのは手書き文字の認識です!
これは、人工知能を作る際に練習で使用されます。
手書き文字の数字と英語はフリーで学習素材が公開されているんですよね!
「MNIST」というサイトでダウンロードできます!こちらがMNISTです
MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges
これまで、人は手書き文字や画像認識についてルールベースで行ってきた背景があります。
例えば、「2」という数字は、上部が半分丸くて、斜めの線があって、最後は横に線がある! このような感じでルールを決めてコンピューターに覚えさせてきました!
ですが、これでは上手く行かない…
現在は、文字や画像の特徴もコンピューターが決めて、その特徴を学習するという手法を取っています!例えば、数字の5の画像です。
数字 ベクトル・行列に変換すると…
こんな感じです。
そして、この画像から変換した数字が数字の5なんだよーというようにコンピューターに教えてあげるんです。でも数字の5は人の手書きではパターンがありますよね!
手書きの文字を沢山集めてコンピューターに学習させることで、判別する精度があがります!
つまり、コンピューターが学習するから、機械学習ですね!
文字のように非常に多く分類する必要があっても次元をどんどん増やしていくと分類できるようになるということはイメージできましたか??
今回のような、答えとデータという材料(教師)がある機械学習は
「教師あり学習」といいます!
機械学習には「教師なし学習」というのもありますが、今回は教師あり学習にしました。
つたない文章で申し訳ございません。次の記事は↓↓
今回も最後までお付き合い頂きましてありがとうございました。