宇野教授 資料[PDF]

人工知能技術の最新動向
人工知能技術の最新
動向
〜 人工知能技術の現状とビジネスへの応用の可能性と
人工知能技術の現状とビジネスへの応用の可能性と課題〜
課題〜
宇野 毅明 (国立情報学研究所
&総合研究大学院大学)
http://research.nii.ac.jp/~uno/index-j.html
e-mail: uno@nii.ac.jp
2016年
年 12月
月6日
日 人工知能ビジネス創出協会 設立記念フォーラム
知能とは
• 知能 ≠ 頭脳
知能は優れた「考える力」、頭脳は「考える機能」
• 知能にもいろいろな側面がある
記憶、計算、整理、、、
推理、推論、関連づけ、判断、、、
認知、認識、類別、判別、、、
理解、読解、想像、経験、、、
感情、創造性、愛、感覚、直感、笑い、、、
• 一緒くたに人工知能といっても、出来ること出来ないことがある
東ロボプロジェクト
• 2011年に始まったプロジェクト
(ワトソンとは独立。模倣ではない)
• 現在の自動証明、自然言語処理、データベース検索、物理シ
ミュレーション、画像認識などの処理を使って、どこまで人間の知
性に迫れるか、という基本問題に対する問いかけ
• 具体的な挑戦は、解きやすいものから行いたい
入試問題は、回答が明確に定まっており、課題として非常に
良い。問題例もビッグデータのように沢山ある
課題設定︓⼊⼒の設定
• 現在は、テキストと画像を入力して、回答を導くような問題設定
で挑戦を行っている
+ 数学は、(図として与えられた)数式の解釈自体が難しい
そこを与えてしまうと、意外と問題は易しい
+ 物理や英語のイラスト的な絵は、記号化できるレベルである
が、それを読み解くことは難しく、それを与えてしまうと問題は易
しくなる
• 最終的には、ロボットに、実際に東大に受験に行って欲しい
赤門をくぐり、受験票を見て講義室に入って自分の席に座り、
問題分をめくって内容をスキャンし、、、
東ロボ君、現在の学⼒
• 2014年、代々木ゼミナールの公開模試を受験しました
結果は、平均よりもちょっといい、という感じ
かなりがんばっている!!
400校の私大に合格率80%以上(A判定)が出ました
• 2016年、偏差値57.1、 535の大学にA判定
問題文の手入力もせず、全部自動
DENSOさんが、東ロボ手くんを作ってくれました!
• でも東大は断念。ちょいと届きませんで。今後は産業応用です
東ロボ⼿くん︕
東ロボ君、現在の学⼒
● 大学入試センター試験の模試(マーク式)
得点
95(80)
全国平均
偏差値
92.9 50.5(48.4)
英語(リスニング)
14(16)
26.3 36.2(40.5)
国語(現代文+古文)
数学IA
数学ⅡB
96(90)
70(75)
59(77)
96.8 49.7(45.1)
54.4
57.8(64)
46.5 55.5(65.8)
世界史B
77(76)
44.8 66.3(66.5)
日本史B
52(55)
47.3 52.9(54.8)
物理
62(42)
45.8 59.0(46.5)
525(511)
437.8 57.1(57.8)
英語(筆記)
合計=950点満点
● 2次試験の模試(論述式)
得点
地理歴史(世界史)
数学(文系)
数学(理系)
16
46
80
全国平均
14.5
19.9
30.8
偏差値
51.8
68.1
76.2
社会の時間
基本的にどのような問題か
• A は B である、というような、事実を答える問題が多い
+ 徳川幕府7代目の将軍の名前を答えよ
+ 日本一りんごの収穫量が大きい市はどこか
• 「ファクトアンサー」と呼ばれる問題
基本的に、自然言語解析+データベース技術に収まる問題
「何を聞かれているか」を自然言語解析で取得
それを、データベースで検索し、最も近いものを出力
• 歴史は時間、地理は地域を数量的に扱うので、その獲得も必要
• 「ワトソン」は、いくつかの種類の問題に対して、ファクトアンサー
を解いている
含意関係
• 回答が名詞ではないとき、特に、次の中から正しい文章を選べ、
というような場合、含意関係問題を解く必要がある
+ 徳川幕府7代目の将軍は、徳川家家である
+ 徳川幕府は15代続いた
+ 関ヶ原の戦いに西軍が勝っていたら、豊臣幕府が誕生
したかも知れない
• 含意関係とは、A の文章の主張が B の文章(複数)から導ける
かどうかを判定する問題
A: AIは発展した
B: 近年、AI技術開発により試験問題が解けるようになってきた
含意関係の解き方
• 含意は意外と難しい
A: AI技術は発展した
○○は技術である、のコーパスが必要
発展したことに対応する言い回しのコーパスも必要
B: 近年、AI技術開発により試験問題が解けるようになってきた
こちらも同じように意味を変形できる
Aを変形してBが得られるか、という問題とも捉えられる
• 係り受け解析で構文構造を得て、それを変形する探索問題
コーパス作り
• 辞書を作るには 「人力」 が一つの手。でも、これは大変
• Webテキストや国語辞書などから、コーパスを自動作成する
+ 単語辞書:
Webテキストを、頻度が急激に変化する位置で切る
+ 品詞辞書:
各単語の次に来る言葉、前に来る言葉の統計情報で判定
+ 係り受け辞書:
「AのB」「AなB」などの使われ方を収集して構築
• 細かい例外などがあり、単純にがつんと作れるわけではない
難しい問題
• 写真から読み解く問題
+ 図の中で、北国の暮らしに典型的なものを述べよ
+ 図のAのエリアではどのような作物を育てると良いか
© 十日町市
© Wikipedia
英語の時間
どういう問題を解くか
• 用例を問う問題は、Web検索で十分
例) arrive □ Tokyo university
□ のところに at や on や to を入れて検索して、一番多かった
ものを選ぶ
• 言語はそもそもそういうものなので、これが正しいアプローチ
• 翻訳は、google 翻訳にお任せ
実は、上記のことを、英語対日本語で行っているだけ
対訳コーパスの文章たちに 当てはまりが良くなるよう
単語のならびの尤度を最大化
• 文章題は、含意関係なので社会と同じアプローチ
対応関係を調べる
• 当てはまりの良さを調べるのに、対訳の例文集を使う
(あるいは、日本語英語両方で記述された、要約など)
例) 「知能」を含む文の英訳文に、どの単語が含まれるか?
Intelligence
artificial
wisdom
you
this the
人工知能ならどうか。2つの単語からなる熟語が出てくるだろう
• 翻訳したい文に近い文を集め、その対訳や
慣用句などと、なるべくつじつまが合うよう
単語を並べる
難しい問題
• 絵の中身を読み解く問題
● 以下の文章は、スミスさん一家のある一日を表している。この
文章が表している絵は次のどれか
+ 弟は野球に行って、試合に勝った
+ 母はカーペットを買ってきた
+ 父は家で夕食を食べた
ディープラーニング
• ニューラルネットは、「ここに論理構造がありそうだ」というところ
を狙って、ネットワークを設計しなければならない
そこが、汎用化や高精度化を難しくしている
• ディープラーニングは、そこの自動化を、多階層化で、図る
・・・
局所的な構造の獲得
第1階層の各ノードは、局所的なパターンが現れたら発火、の意味
第2階層は、より抽象度の高いパターンが現れたら、発火
細かいパターンの組合せとして、大きな構造の概念を獲得する
強みと弱み
• ディープラーニングは、いわば巨大な自由度を持つニューラル
ネット。決めなければならないパラメータが大量にある
大量のデータがないと、パラメータが定まらない
計算コストが巨大
• ネットワークの詳細構造が与えられなくても自動的にできる
(画像など、大量に教師データがあれば、自動学習できる)
• ネットワークの概念的な骨格がないと、うまくいかない
(音声のセグメント、画像のメッシュなど)
グラフや、ゲノムの属性などでは、構造が作りにくい
機械と人間の認識の違い
• コンピュータは、人間とはまったく違うルールで画像を認識する
人間は、心霊写真のように、顔ではないものを顔っぽく見てしま
うことがある
ディープラーニングにもそれはあるが、人間にはまったく似てい
るように見えない!
右のパンダの画像は、機械には「テナガザルそのもの」に見える
© http://karpathy.github.io/2015/03/30/breaking-convnets/
数学の時間
基本的なアプローチ
• 数学の証明は、与えられた条件から、ゴールとなる条件を導ける
かどうかの問題
• 自動定理証明システムに突っ込むと、意外と上手に解いてくれる
• 文章を読み解いて、数式に変換するところが一番大変
• 数式になってしまえば、あとはソルバーがけっこう解いてくれる
自動証明技術の研究開発は長く、そこそこ優秀
(数式OCR、なんてのも最近あります。けっこう良くできてる!)
難しい問題
• 統計の問題
● この町の子供達の勉強時間を、地区ごとに集計した
ところ表のようになった
+ A のところに入る数字は何か
+ B のところが何以上になると、分散が10以上になるか
+ C地区に、3人の子供が引っ越してきたところ、平均が
○○になった。ところが何以上になると、分散が10
以上になるか
物理の時間
基本的な問題パターン
• 物理の問題は、基本的には数学的な問題が多い
物理
(数式の証明、あるいは値の計算)
• 文章から式を導ける物もあるが、多くのものは図がついている
(数式になれば、あとは数学と同じ)
• 絵から、実際の空間上に
どのように配置されているのかを
読み解くのは、以外と大変
• 文章も、正確に理解するのは大変
• 配置がわかれば、後は物理
シミュレーションで何がおきるかわかる
© http://schoolbutsuri.blogspot.jp/
2013/01/blog-post.html
文章が示す意味の揺らぎ
• 言葉は、常識を取り去ると非常に揺らぎが大きい
例) 机の上にある四角い板の上にひもで繋がれたボールがある
全部作ってしまえ
• 揺らぎに背景知識を当てはめて絞り込むのが王道だが、それで
完全に正しい状況を得ることは難しい
ならばすべての可能性を列挙してしまえ。
全てのモデルで物理シミュレーションを行って、
うまくいくものを求める
•••
全ての組合せ
• 問題文から、どのような物体があるかはわかる
ボール、机、板、ひも
• それらの接続関係、位置関係、力のかかり具合などに違いがある
• 接している、でも、どこで接しているか、あるいは動いているような
状況もある
• しかし、高々5個の物体が4通りの位置関係の可能性を持つ程度
なら、45 = 1024通りの組合せにしかならない
• 10個の物体が10通りの位置関係の可能性を持つ、くらいになると
厳しい
難しい問題
• 社会的な、あるいは現実世界の常識を利用する問題は難しい
+ ここに、ピーという音が来ると前に進み、プーという音が聞こ
える後ろに進むロボットがあります。図のAとBのスイッチを同時
に入れて音を出したとき、ロボットはどちらに進むでしょうか
化学の時間
基本的なアプローチ
• 化学の問題には、数学的な問題と物理学的な問題と知識を問
う問題がある
• 知識を問う問題へのアプローチは、社会と同じ
• 数学的な問題、物理的な問題は、基本はだいたい同じなのだ
が、両者のソルバーを転用することはできない
化学式ソルバー
• 化学の式は、数学には出てこないタイプの変形がある
+ 原子が分子になる
+ エネルギーが出る、あるいは吸収する
+ 触媒や温度など、外部要因がある
2H2 + O2
2H2O + e (約分できない、等式は成り立たない)
C6H12 + HCOOH
C6H11 COOH (C はいっしょにしちゃだめ)
• 代数とは異なる公理系であり、状態の変化というものがある
• つまり、専門のソルバーが必要。
技術的には簡単だが、労力は途方もない
化学系シミュレーション
• 物理と同じようだが、やはり異なるポイントがいくつもある
+ 固体・液体・気体の状態変化がある
+ 化学反応を起こして熱を出す
+ 気体、液体同士が混ざる
+ 熱が伝わる
+ 膨張・収縮する、融ける、曲がる
• 通常の物理シミュレーションとは異なることが起きる
• ただし、気体にしても液体にしても、記号化しても大丈夫な程度
の抽象度を持っており、実現は困難ではない
道徳の時間
どこが深化したのか
• 知能にもいろいろな側面がある
記憶、計算、整理、、、
記憶、計算、整理、、、
推理、推論、関連づけ、判断、、、
推理、推論、関連づけ、判断、、、
認知、認識、類別、判別、、、
認知、認識、類別、判別、、、
理解、読解、想像、経験、、、
感情、創造性、愛、感覚、直感、笑い、、、
• 大幅に深化した。試験もかなりとけるようになった。
つまり、世の多くの問題は、理解する必要はない
• シンギュラリティには来そうですか?
仕事を奪われる人は︖
• 多くの仕事が、「AIに奪われる」と言われている
本当でしょうか?
考えてみましょう
接客:
接客
いわゆる「タッチパネル端末」でできることが、AIでできる
できないことは、
雑談、仲良くなる、笑顔、「このお酒持ち込んでいいかな」
「そばに離乳食売ってるところないですか」「どういう服が
似合うでしょうか」「心配しなくても大丈夫ですよ」
• 言語インターフェースと含意検索により、「今日のおすすめ」「最
新のファッション」など、多少端末以上のことができるようになる
事務職
営業: お客の質問に「ファクトアンサー」はできる
営業
できないことは、
関係を作る、相手のポイントを理解し、適切な提案を作ること
経理・総務: 書類の自動作成はできる
経理・総務
できないことは、
事例に適切な解釈を与えること、例がいい対応すること、業務
体系の問題点を明らかにして、改善案を作る
人事: いい雰囲気を作る。問題人物に対処する。人物評価!
人事
・・・ 難しいと言わざるを得ない
士業
弁護士、弁理士、税理士など
知識を問うだけなら簡単。そもそもWeb検索で十分
顧客の状況が、法律や条件と当てはめるとどうなるのか、重要な
ポイント探しや要約、論旨展開などが求められる
芸術家、音楽家
絵や音楽の自動生成方法が出てきたけど、、、
それなりにいいけれども、やはりストーリーがないものには、大
きな価値は見いだしづらいのでは? スマホのチープなゲームの
音楽くらいならなんとかなりそう
結局、今までの「作業が楽になる」ことはあっても、
「奪われる」ほどではない
AIで未来予測
AI
で未来予測
• AIで未来予測を、と言われますが。。。
• 未来が予測できるのは、未来に起こることの予兆が現在確認で
きる場合だけ、です
• しかも、なんでもいいから予兆を見つける、はできません
ある程度の仮説が必要で、対象が絞り込まれないとできません
× 地震の予兆をなんでもいいから見つけてくれ
○ 地震の直前におかしな雲が出てないか (自動で) 調べよう
× この商品を買う、あるいは買いそうな客の予兆を見つけてくれ
○ 商品を買う前には、どこかのサイトを見たり、商品のページを
長い間見たり、生活パターンが変わったりするだろう。その様子を
調べることはできないか
総合の時間
ビジネスでAI
ビジネスで
AIを使うには︖
を使うには︖
• AI、と言ってもほんとの人工知能というモノはないわけで
自動的に何かしてくれるもの、がAI と見られているんです
• AIより、「最近進化した情報技術」のほうが見通しがいいです
+ 近年のAIの進化は、ビッグデータの利用から来てます
まず、データを上手に使って利得を得ることを考えましょう
+ 画像認識が進化しました。カメラ+物体認識、を、
センサーの一種と考えて良いでしょう
+ 自然言語処理が高度になりました。翻訳、含意検索を
音声認識と一緒に使えば、様々なことが出来ます
実際には使うところは
• 技術的に人工知能が突出しているのは、
推論と囲碁将棋、自然言語、画像と音声、の3つ
+ 囲碁将棋のようなゲームの深読みは、普通は不必要
+ 画像・音声認識の場合、考えることは、環境を整備すること
大量のデータが手に入るか、
ノイズ消したり、ものだけ真ん中に写るようにできるか
誤認識しそうなほどたくさん現れているものはないか
たくさんのカメラやマイクをおいて、認識精度を上げられるか
+ 自然言語の場合、意味理解を伴わないでできるか、が重要
現れる単語の数、自動翻訳の利用、同じことに対して、
異なる表現が使われるか、など
自分でトライアルしてみる
• 自然言語や画像解析の結果から、自動分類や、推論、予測をし
たいときには、それが人間にできるものなのか、試せばいい
人間にできない推論は、コンピュータにもできない
機械が強いところは、規模とミスのなさだけ
+ 購買予測をしたいなら、購買した人のデータを数件、
じっくり見てみる。なんか、共通の予兆はあるか
+ 特許や会計、法律や医療などで、自動判断(適法か、新規性
があるか、病気か、など)をしたいなら、
実際のデータ(判例、症状、明細書など)だけを使って判断でき
るかどうか、試してみる。
一般常識や善悪、感覚、経験、意味理解しての推論などが入っ
ていたら、それはAIには難しいと言うこと。 なしでできるか?
小売店での思考実験
• アパレルなどの小売店での活用を考えてみる
まず、なんのデータを、何に使えそうなのか?
+ ビデオで顧客の表情を見て、タイプ分けや興味を測るか?
データを集めるのが大変そう。人間の判断もフィーリングだから、
機械に学ばせるのも難しそう
着ている服の感じならわかるかも。値段とか雰囲気とか
勧める服は、データから選ぶか、それともクリエイターが決めるか
+ メンバーズカードや売り上げデータ
過去にどういう服を買ったか、でお勧めできるものはありそうだ
今までの傾向に沿うか、変化をつけるか、という戦略が必要
住所や購入日などからライフスタイルを推測できるか
+ Webデータ:
評判や、どういうサイトに行ってる人が興味あるか、などがわかる
まとめ
• 人工知能が大学入試を受ける
意味理解を伴わず、推論や認識だけでできることはたくさんある
• 意味理解ができるようにならないと、シンギュラリティはこない
• ビジネスでは、最近進化した部分を使うのが重要
アブストラクト
近年のAIの難しさは、まずは見通しの悪さにあると考えている。
自分のビジネス・活動に対して、AIは助けになるのか、AIを使っ
て新しいビジネスが始められるのか。ライバル、関連業界がAIを
使い、自分が取り残されることはないのか。これらの疑問は、す
べてAIに対する見通しの悪さが原因である。もっとわかりやすい
技術、たとえば自動車エンジンの技術であれば、いくらエンジン
が発達しても、花屋は自分のビジネスには直接役に立たないだ
ろうと思うわけだし、床屋は、それで自分がライバルに取り残され
るとは思わない。 新しいビジネスを始めるときに、どう使えばい
いのか、ということもわかりやすい。しかしAIの場合は、こういっ
た直感が働かない。本公演では、AIの「機能と特性」をかいつま
んでお話しし、どんなことに使うとどの程度の効果が得られるの
か、を解説し、AIのビジネスでの利用に対して直感的な理解がで
き、将来の動きがなんとなくイメージできるようにする。