最近AI(特にディープラーニング)がブームになっていますよね。
そのなかでも一番目立つ成果といえば、「画像認識技術」ではないでしょうか。
しかし、
「画像認識技術ってAIがどう関わってくるの?」
「実際なにが凄いの??」
とあまり世間一般では画像認識技術の凄さが伝わっていないのも事実。
そこでこの記事では、スマートフォンやパソコンの顔認証技術など日常的なことも交えてAIの画像処理技術についてご紹介します。
ぜひ参考にして下さい。
AIの画像認識技術
文字認識
文字認識のタスクはDeep Learningを始め、様々な機械学習アルゴリズムによって挑戦されてきました。
特にMNISTという手書きの数字の認識タスクは様々なDeep Learningフレームワークのチュートリアルページに例題が載っているほどです。
結論から述べますが、CNN(畳み込みネットワーク)によって文字認識の性能向上は実用レベルになっています。
最近の研究はほぼ100%認識できる文字認識技術を使って何をするか、という段階に来ています。
また、英語のように文字数が少ない言語だけでなく、日本語や中国語のような文字数の多い言語に対しての文字認識も挑戦されています。
物体検知
動画やリアルタイムの物体検知もDeep Learningで超高性能化しています。
物体検知の分野で非常に有名なアルゴリズムであるYOLOのデモ動画を見れば、その凄さがわかるはず!
画面上を高速で動く物体や、カメラからは重なって見えてしまっている人間であっても、しっかりその物体が何であるかを分類できていますね。
リアルタイム物体認識の分野は自動運転を始めとして様々な応用先があります。
例えば組み込みシステムで使うのならば、限られたコンピュータ性能の中でより高性能なモデルが求められています。
非常に面白い分野なので、最新の動向をチェックしていきたいですね。
AIの画像生成技術
リアルな画像の生成
実際の人間と見紛うようなリアルな顔画像を生成する研究も盛んに行われてます。
人間の顔画像を生成するにはGANという、ニューラルネットを使ったアルゴリズムを用いることが多いです。
GANは様々なデータを生成するために使われているアルゴリズムなので、画像以外にも様々な分野で名前を見ることになるでしょう。
GANはその性能から、最近流行のモデルです。
本当に毎週のように新しい論文が登場する進歩の早い分野なので、いつまでも飽きることは無いですよ!
アニメ画像の生成
アニメのような画像を生成する研究も流行っています。
これまでも様々な方法で検討されていましたが、これを高い完成度で生成する事ができるサイトが話題になりました。
MakeGirlsMoe
このサイトを使うと数クリックでアニメキャラクターが生成できます。
また、キャラクターだけでなく動きも含めた生成を行うシステムも提案されています。
上のデモ動画はDeNAによって提案されたPSGANを使ったものです。
これまでイラストレーターに頼むしかなかったイラストの生成も、徐々にAIによる自動化の波が起こりはじめています。
画風を変更
画像や動画の画風するアルゴリズムは、下のデモ動画が発表されたあたりから非常に実用的なレベルに達しています。
様々な異なる画風の画像を元にして、動画のタッチを変更する技術はDeep Learningによりこのレベルまで完成されています。
Chainerなどの有名なライブラリを使った実装も公開されていて、実際に動作を試してみることも可能です。
画像処理AIに入門する
チュートリアル
画像処理AIに入門するための参考書、参考サイトがたくさんあります。
代表的なところでいうと、TensorFlowなどの有名なDeep Learningフレームワークのチュートリアルがおすすめです。
CNNなどの例題として必ずと行っていいほど画像処理の問題が出現します。
自力で試してみるなら、フリーで閲覧できるこれ以上無い教科書となります。
もっと効率的に勉強するには
自力で勉強するには限界もあります。
初学者は学習の見通しを立てるのが難しいですし、最新研究を試すレベルに達する前に挫折することもしばしば。
そんなときはオンラインのプログラミングスクールを使って勉強するのもおすすめですよ!
まとめ
この記事では、最新研究のデモを元にして画像処理AIでできることについてまとめました。
画像処理の分野は日進月歩、今まで大きな工数が必要だったことも徐々に自動化されていきます。
ビジネスの効率化やAIと絡めた新しいチャレンジを狙うためにも、最新研究のチェックは欠かせませんね!