Column

たてヨコラム

たてヨコメンバーによるフリーテーマのコラム

AIの秘め事

Hey Siri

知り合いの娘ちゃんが、iphoneのsiriに「アレクサ」と呼んでみました。

Siri、ちょっとマウント取りつつ拗ねたそうです。

今度はしっかりとアレクサと呼びます

SiriはSiriのままでいたいという思いをぶつけたそうです

表情豊かな返答をするために、いろんなデータをインプットさせて学習させているのがスマートスピーカーなんです。YesNoで答えるのではなく、人間味のある表情が加わると親しみも増しますよね!

表情豊かな受け答えをするために、これまでいろんな感情をセットさせてきたんだろうなぁ。
きっと知り合いのSiriの中には、他社のスマートスピーカーで呼ばれた時に何て反応しようか悩んだと思いますよ。悲しもうか皮肉を言おうか、笑い飛ばそうかとか。人間のように考えるのがAIです(*´ω`*)カワイイ

仕事の中でAIに携わることがありまして、今回はAIの脳みそになる「教師データ(アノテーション)」について紹介していきます!難しい話は苦手なのでできるだけわかりやすく紹介したいです!(願望)

少しでもAIが身近に感じますように!

例えばAIが赤ちゃんだったとして

AI=人工知能と言いますが、AIは最初から頭が良い天才というわけでなく、どちらかというと”あかちゃん”です。

可愛くて無垢で毛穴を知らない尊いあかちゃんです。

そして、赤ちゃんが立派に成長するために言葉などを教える大人が、「教師データ」です。「教師」というのはその名の通り、子どもが知らない情報を教えてあげるので、教師データと呼ばれています。

無垢な赤ちゃんは何も知りません。そんな中、赤ちゃんが車のおもちゃを使って遊んでいるとしましょう。そして赤ちゃんが教師たちに「これは何?」と尋ねます。

皆さんが教師役だった場合、赤ちゃんが持っているものをなんと説明しますか?

知識がありすぎるのも困りもんです(´・ω・`)

情報を知り過ぎているからこそ、情報がとっ散らかってしまうことってありますよね。良かれと思っていろんなことをいっきに伝えても、初めて聞いた側からすると「・・・つまり?」と混乱させてしまうことがあります。大人の悪いところ!

大人から教えてもらった情報は、AIの中では「タグ」と呼ばれています。新しく覚えるときに、いきなりたくさんの同義語を言われても覚えられないですよね。

赤ちゃんに覚えてもらうためには、「これが」「なにか」を覚えさせる必要があります。

画像解析の時に覚えてもらう時には、↑のように物体を囲み、それが何なのかをタグで教えてあげます。その情報を積み重ねていくことで、赤ちゃん(AI)は学習していくんです。本当に赤ちゃんに教えるみたいなんですよね。

学習用の画像の準備も大変

画像を使ったAIを作る場合、画像の準備も必要になります。例えば、カメラで犬を撮影したら犬種を自動的に検出してくれるAIを作ることになった場合、教師データとして犬の画像と犬種の印が必要になります。

①あなたが教師データ役の大人だった場合、この画像の犬は何の犬種と伝えますか?

②あなたが教師データ役の大人だった場合、この画像の犬は何の犬種と伝えますか?

日頃から見ていたり、ペットの専門学校へ通っていた私で、ギリギリ「これかな・・・?」と思うくらいです。(ちなみに、写真は友だちのワンコです。①がシェルティーで②がチワワです。可愛い)

曖昧ルールをそぎ落とす

教師データを作る際には、作る大人が持っている知識にも左右されることがあります。専門性の高いデータを作ろうと思えば思うほど、↑の画像のように判断する部分が見えないデータなどが増えるほど、教師データの難易度が上がっていきます。

そして、教師データは正確なものにしなくてはならず、そのためには人間の曖昧な判断をそぎ落とす必要があるんです。人間が普段考えていることは曖昧なものが多く、人によって答えが変わるような情報は、機械が学習をする時には不要なことが多いんです!

そう!2進数の世界に主観はいらない!!

じゃあどうやって学習させるの?

主観を捨てるためには、ルール決め(要件定義)が大事です。

例えばドラレコの画像に「車を囲んでください」という指示があった場合、下の図のような車を見つけたら、あなたは囲みますか?囲むとしたらどうやって囲みますか?

細かなルールを設けずに複数の大人へ教師データを作ってもらうと、こんな感じになりました。

意見がバラバラ!

この状態で赤ちゃんに説明しても車を認識するには情報が統一されず、使えない教師データ(ゴミデータ)になってしまうんです。これを防ぐために、細かなところもルールを決めないといけないのが、教師データの大変なところでもあり、楽しいところ(*´ω`*)

まとめ

こういうことです。(雑)

しかしながら、最初に紹介したSiriみたいに、人間らしさを求めているのも事実!それをいかにしっかりとルールを決めてAIへ学習させるのか、工夫が大事。そしてそれをしっかりと決めるには、まだまだ人間の目でみた情報と、ルールが必要なんです。

AIを作りたい、作ろうとしているけど推論結果がうまくいかない!なんて人は、教師データが足りなかったり、詰め込みすぎてたり、データが粗すぎるのかもしれませんよ(´・ω・`)

身近にあるAIについて知ってもらいたくて、今回はAIの頭脳になる教師データについて紹介しました!と言いつつ、AIの学習法にはすでにいろんな方法があるので、興味のある方はいろいろ調べてみてください!

最後に

忘れてました、最近まつげパーマしたので描きおろし載せておきます!

誰も待ってない

ABOUT ME
中山 梓
変な絵につられてクリックした方、どうも中山です。 よく分からないタッチの絵を描くのが好きなのと堅いことが苦手なことから派生して、最近はイラレコ(グラレコ)を始めました。仕事ではAI用の教師データを全国の家で働く人たちや複業の人とかれこれ5年以上作り続けてます。なかなか表に出せないので「未来に繋がる仕事」ってまとめてます。