マスログ

2020/04/26

マスクしていても顔を識別可能!AIブームを支える技術「ディープラーニング」とは

最近自粛要請によって、なかなか外に出られない日々が続いていますね。外出時にマスクを着用されている方も多いことと思います。普段と違う生活に、ご不便を感じられていることもあるのではないでしょうか。今日はそんなある日のお話。

ある日、スタッフが困った顔で「また認識されない…」とこぼしました。

「どうしたんですか?」と尋ねると、

スタッフ:「マスクしているとiPhoneのFaceID(顔認証によりログインできる機能)がうまく使えなくて、毎回パスワードを入力しないといけないんですよ」

岡崎(私):「それは手間がかかりますね。」

スタッフ:「そうなんですよ。最近外出中だとマスクをずらすのもなんだかしづらいし…」

岡崎:「ですよねぇ。でも、最近マスクしていても顔認証できる技術が開発されたみたいですね」

スタッフ:「本当ですか?いますぐ使いたいです。」

岡崎:「グローリーという会社がマスクをしていても顔認証できる技術を開発したみたいです。ディープラーニングの技術を応用しているそうですよ。」

グローリー株式会社による顔認証技術。マスク・サングラスの方も正しく認識されている。

スタッフ:「マスクしていても認識してくれるのは、すごく便利ですね。ディープラーニングという言葉は最近よく耳にするのですが、それってどういう技術なんでしょうか?」

岡崎:「そうですね、それでは今日はディープラーニングの話でもしましょう」

ディープラーニングとは

ディープラーニングは、機械が人間と同様に考えることができるように、人間の脳の仕組みを機械の上で再現できるよう設計された技術です。1940年代にアメリカで初めてコンピューターが実用化されて、その膨大な計算力を目の当たりにした科学者たちは、「いつの日か我々人間よりも賢くなってしまうだろう」と考えるようになります。

その後1956年にはAI(Artificial Intelligence)という言葉が生まれ、機械に人間と同様の知性を獲得できるのでは、という期待とともにAI研究が始まりました。機械が人間と同じように考えるプログラムを作るには、まず「人間がどう考えているか」を正しく理解する必要があります。当時の脳科学で、人間の脳は小さな「ニューロン」からなり、「ニューロン」同士が電気信号を送り合うことで情報が伝わる、ということがわかっていました。これをそのまま機械の上で再現したものが、現在の「ニューラルネットワーク」、ディープラーニングの仕組みそのものです。

ニューロンによる信号伝達の仕組み。2020年現在は、脳の仕組みはこれよりも遥かに複雑なものであることがわかっています。

スタッフ「ずいぶん昔から『ニューラルネットワーク』ってあったんですね。てっきり最近生まれたばかりだと思っていました」

岡崎「アイディアが生まれたのは1950年代ですけど、当時は全く実用的なものはできなかったんです。今に比べれば当時のPCの計算力はないも同然でしたし、インターネットもないためPCに学ばせるためのデータも用意できません。とても期待された技術だったけれど、結局ごく単純なゲームを解くのに使われた程度でした。実用化の目処が立たず、だんだん見向きもされなくなっていったようですね。」

スタッフ「辛い時期ですね。」

岡崎「その流れが変わったのは、つい最近、2012年のことです」

ディープラーニング隆盛のきっかけ

ディープラーニングが一躍脚光を浴びるきっかけになったのは、脳科学の分野ではなく、人間工学でもなく、画像認識分野でした。画像認識といえば、空港での顔認証などを想像されるかもしれませんが、ディープラーニングが登場する前までは非常に原始的な方法に頼っていました。

どんな方法かというと、イメージとしては、シンデレラの靴を想像されると良いです。シンデレラの物語では、落し物の靴の持ち主を探し出すのに、一人一人の女性に靴を履かせて、合うかどうかを確認させていますね。

シンデレラの靴。一人一人に履いてもらって、合った人がシンデレラと判断する。

ディープラーニング以前の画像認識も同じです。画像の識別を行うために、あらかじめ各個人の「画像」を用意して、重ねるようにして当てはめていきながら、より用意した画像と一致するものが答えとなります。

識別したいものの画像

一致率 80%

一致率 40%

一致率5%

それぞれの画像に合わせて、猫の画像に最も近いから猫、という具合ですね(より厳密には画像から取り出した「特徴マップ」と呼ばれるものを合わせているのですが、ここでは単純に考えていただいて問題ありません。)。ただこの方法は、実用上様々な問題があります。

  • ・横を向いていたり、後ろを向いていたりする場合
  • ・小さく写っている場合、または大きく写っている場合
  • ・被写体の一部が隠れて見えない場合

画像認識技術は何十年もの間研究されてきたものの、上記の課題は解決されないまま実用レベルには至りませんでした。そこに突如現れて、実用上の問題を全て解決してしまったのが、ディープラーニングなのです。

なぜマスクがあっても認識できるの?

従来の機械学習モデルでは、より精度を高めるためには先ほどの「画像(シンデレラの靴に当たる部分)」を非常に精密に作る必要がありました。例えば人の顔を認識するのに、「口角の位置」「目尻の角度」「目と鼻の距離」など、とても細かく指定する必要があります。しかし、みなさんが日常的に人の顔を識別するとき、例えば10年来の友人に会うとき、「この人は目尻の向きが●°で目と鼻の距離が●cmだから、●●さんだな」と思うことはないはずですね。なんとなく、マスクしていても「あ、●●さんだ」と分かってしまうでしょう

ディープラーニングはまさにその境地にいるのです。

人間が無意識で判断するレベル、ともすると人間の感覚を超える認識まで可能になりつつあります。たとえ顔がマスクで隠れていても、目の下のしわ、鼻筋やこめかみ、マスクで隠れていない部分から個人を特定できるようになっているのです。

ディープラーニングは、画像認識技術に文字通り「革命」をもたらしました。AIの第一人者である松尾 豊先生は、「ディープラーニングによって、機械に『目』がもたらされた」と話しています。

岡崎:「ディープラーニングによる画像認識は現在、無人店舗や無人運転、空港の顔認証など、様々な場面で活用されています。先日行ってきた無人店舗『TOUCH TO GO』もその一つですね。」

スタッフ「いろんなところに活用されていますね。少し興味が湧いてきました。」

岡崎:「それでは、より理解するために、微積分学と線形代数を…」

スタッフ「結構です」

岡崎:「冗談です。ディープラーニングを理解するのが目的なら、高度な数学は必要ありませんよ」

スタッフ「それなら勉強してみたいです!」

現在ディープラーニングは無人店舗や無人運転に代表される画像認識技術はもちろん、カスタマーサービスなどの音声認識、機械翻訳などのテキストマイニングなど様々な応用が進められています。皆さんが普段乗る車や、毎日利用するコンビニなど、あなたの日常のどこかに画像認識が用いられる日も、もうすぐそこまで来ています。

今後のAI革新の中心となるディープラーニング技術を、ぜひこの時期に勉強してみてはいかがでしょうか。和から株式会社ではディープラーニングについても講義も行っておりますので、よければぜひご参加してみてください。いずれもオンラインでの受講可能です。

■Deep Learningによる画像認識の仕組みを知りたい!という方向け

Excelではじめるディープラーニング(Deep Learning) さまざまな最先端技術で利用されている「深層学習(Deep Learning)」の数理・動作原理を、エクセルを使って基礎から解説します。ディープランニングをテーマにしたセミナー・講習会は無数に存在します。しかし、そのほとんどがRやPhythonの使い方や、応用方法だったりするため、本セミナーでは「Deep Learningの基本的な数理・仕組み」について、エクセルを利用して理解することを目的とします。

■Deep Learningを実際に組んでみたい!という方向け

Pythonで学ぶDeep Learning 本セミナーでは、近年注目を集める「Deep Learning」の仕組みを理解して、まずは実装することを目標にしています。「Deep Learning」の基礎であるニューラルネットワークの仕組みを概説し、実際にプログラミング言語「Python」を用いて画像認識モデルを実装します。その後作成したモデルの評価法と、精度を向上させるための方法を学ぶことができます。

Deep Learningにご興味がある方は、人工知能研究の第一人者である松尾 豊先生の本が非常にわかりやすい言葉で、どう使われているのか、また今後どう使われているか解説しています。 ぜひお手にとって読んでみてください。

人工知能は人間を超えるか 松尾 豊著 角川EPUB選書

<文/岡崎 凌> ⇒ 講師紹介ページへ

TAGS: