忍者ブログ

独楽帳

青天を行く白雲のごとき浮遊思考の落書き帳

AIの「読解」と「回答」

湯浅誠の書いた記事だが、出典をメモしていない。
AIが一番苦手なのは「読解」であるという。そもそも、AIへの質問自体、回答が出せる形にしないとAIには回答不能であるらしい。つまり、数学でも物理でも、人間への質問の形そのままでは通じないわけだ。質問がインプットされても、実は「質問の意味を理解しないままに質問に答える」と言っていい。理解はしないが、何らかの回答が可能ならば回答する、ということで、その回答は確率的に蓋然性が高い回答であるにすぎない。それは多くの馬鹿学生や馬鹿児童がやっていることでもある。ある意味、秀才よりも馬鹿のほうがAI的であるわけだ。


(以下引用)




関ヶ原の戦いは何年?の解き方

――そもそもAIが「読める」とか「読めない」というのは、どういうことですか。

AIを含むコンピュータが得意なのは、情報とパターンで問題解決すること。

たとえば「徳川家康は(    )年の関ヶ原の戦いで、石田三成らの西軍を破った」の(    )に何が入るか。

答えは1600年。

コンピュータは、この答えを膨大な情報を瞬時に検索して答えを出す。

教科書、Wikipedia、百科事典など、デジタル化された情報すべてにアクセスし、検索をかけられる。

コンピュータは「戦う」とか「破る」という事態が、どのような事態なのかはわからない。

その言葉がリアルな世界で何を表すのかはわからない

それでも、字も追えるし、検索もかけられ、それによって正解にたどりつく。

「読めない」が解ける、というのはそういうことだ。

コンピュータがイヌとネコを見分ける仕組みを説明する新井紀子教授。コンピュータは現実のイヌやネコを知っているわけではないが、見分けられる
コンピュータがイヌとネコを見分ける仕組みを説明する新井紀子教授。コンピュータは現実のイヌやネコを知っているわけではないが、見分けられる

検索と確率だけの世界

さっきの問題文は、コンピュータにとって、意味不明の記号の羅列にすぎない。

人間にとっての「●△※×★÷◎◆▼□+」と同じだ。

でも、膨大な検索をかけると「●△※」と「◆▼□」がセットで出てくることの多いことがわかる。

「●△※」と「◆▼□」は強い結びつきがありそうだと推論する。

これが確率だ。

そこで、選択肢の中から「◆▼□」を選ぶ。

これが「1600」だ。

膨大な検索を通じて、確率的にありそうなことを選び出す。

これがAIのやっている作業だ。



PR