人工知能技術の最新動向 人工知能技術の最新 動向 〜 人工知能技術の現状とビジネスへの応用の可能性と 人工知能技術の現状とビジネスへの応用の可能性と課題〜 課題〜 宇野 毅明 (国立情報学研究所 &総合研究大学院大学) http://research.nii.ac.jp/~uno/index-j.html e-mail: uno@nii.ac.jp 2016年 年 12月 月6日 日 人工知能ビジネス創出協会 設立記念フォーラム 知能とは • 知能 ≠ 頭脳 知能は優れた「考える力」、頭脳は「考える機能」 • 知能にもいろいろな側面がある 記憶、計算、整理、、、 推理、推論、関連づけ、判断、、、 認知、認識、類別、判別、、、 理解、読解、想像、経験、、、 感情、創造性、愛、感覚、直感、笑い、、、 • 一緒くたに人工知能といっても、出来ること出来ないことがある 東ロボプロジェクト • 2011年に始まったプロジェクト (ワトソンとは独立。模倣ではない) • 現在の自動証明、自然言語処理、データベース検索、物理シ ミュレーション、画像認識などの処理を使って、どこまで人間の知 性に迫れるか、という基本問題に対する問いかけ • 具体的な挑戦は、解きやすいものから行いたい 入試問題は、回答が明確に定まっており、課題として非常に 良い。問題例もビッグデータのように沢山ある 課題設定︓⼊⼒の設定 • 現在は、テキストと画像を入力して、回答を導くような問題設定 で挑戦を行っている + 数学は、(図として与えられた)数式の解釈自体が難しい そこを与えてしまうと、意外と問題は易しい + 物理や英語のイラスト的な絵は、記号化できるレベルである が、それを読み解くことは難しく、それを与えてしまうと問題は易 しくなる • 最終的には、ロボットに、実際に東大に受験に行って欲しい 赤門をくぐり、受験票を見て講義室に入って自分の席に座り、 問題分をめくって内容をスキャンし、、、 東ロボ君、現在の学⼒ • 2014年、代々木ゼミナールの公開模試を受験しました 結果は、平均よりもちょっといい、という感じ かなりがんばっている!! 400校の私大に合格率80%以上(A判定)が出ました • 2016年、偏差値57.1、 535の大学にA判定 問題文の手入力もせず、全部自動 DENSOさんが、東ロボ手くんを作ってくれました! • でも東大は断念。ちょいと届きませんで。今後は産業応用です 東ロボ⼿くん︕ 東ロボ君、現在の学⼒ ● 大学入試センター試験の模試(マーク式) 得点 95(80) 全国平均 偏差値 92.9 50.5(48.4) 英語(リスニング) 14(16) 26.3 36.2(40.5) 国語(現代文+古文) 数学IA 数学ⅡB 96(90) 70(75) 59(77) 96.8 49.7(45.1) 54.4 57.8(64) 46.5 55.5(65.8) 世界史B 77(76) 44.8 66.3(66.5) 日本史B 52(55) 47.3 52.9(54.8) 物理 62(42) 45.8 59.0(46.5) 525(511) 437.8 57.1(57.8) 英語(筆記) 合計=950点満点 ● 2次試験の模試(論述式) 得点 地理歴史(世界史) 数学(文系) 数学(理系) 16 46 80 全国平均 14.5 19.9 30.8 偏差値 51.8 68.1 76.2 社会の時間 基本的にどのような問題か • A は B である、というような、事実を答える問題が多い + 徳川幕府7代目の将軍の名前を答えよ + 日本一りんごの収穫量が大きい市はどこか • 「ファクトアンサー」と呼ばれる問題 基本的に、自然言語解析+データベース技術に収まる問題 「何を聞かれているか」を自然言語解析で取得 それを、データベースで検索し、最も近いものを出力 • 歴史は時間、地理は地域を数量的に扱うので、その獲得も必要 • 「ワトソン」は、いくつかの種類の問題に対して、ファクトアンサー を解いている 含意関係 • 回答が名詞ではないとき、特に、次の中から正しい文章を選べ、 というような場合、含意関係問題を解く必要がある + 徳川幕府7代目の将軍は、徳川家家である + 徳川幕府は15代続いた + 関ヶ原の戦いに西軍が勝っていたら、豊臣幕府が誕生 したかも知れない • 含意関係とは、A の文章の主張が B の文章(複数)から導ける かどうかを判定する問題 A: AIは発展した B: 近年、AI技術開発により試験問題が解けるようになってきた 含意関係の解き方 • 含意は意外と難しい A: AI技術は発展した ○○は技術である、のコーパスが必要 発展したことに対応する言い回しのコーパスも必要 B: 近年、AI技術開発により試験問題が解けるようになってきた こちらも同じように意味を変形できる Aを変形してBが得られるか、という問題とも捉えられる • 係り受け解析で構文構造を得て、それを変形する探索問題 コーパス作り • 辞書を作るには 「人力」 が一つの手。でも、これは大変 • Webテキストや国語辞書などから、コーパスを自動作成する + 単語辞書: Webテキストを、頻度が急激に変化する位置で切る + 品詞辞書: 各単語の次に来る言葉、前に来る言葉の統計情報で判定 + 係り受け辞書: 「AのB」「AなB」などの使われ方を収集して構築 • 細かい例外などがあり、単純にがつんと作れるわけではない 難しい問題 • 写真から読み解く問題 + 図の中で、北国の暮らしに典型的なものを述べよ + 図のAのエリアではどのような作物を育てると良いか © 十日町市 © Wikipedia 英語の時間 どういう問題を解くか • 用例を問う問題は、Web検索で十分 例) arrive □ Tokyo university □ のところに at や on や to を入れて検索して、一番多かった ものを選ぶ • 言語はそもそもそういうものなので、これが正しいアプローチ • 翻訳は、google 翻訳にお任せ 実は、上記のことを、英語対日本語で行っているだけ 対訳コーパスの文章たちに 当てはまりが良くなるよう 単語のならびの尤度を最大化 • 文章題は、含意関係なので社会と同じアプローチ 対応関係を調べる • 当てはまりの良さを調べるのに、対訳の例文集を使う (あるいは、日本語英語両方で記述された、要約など) 例) 「知能」を含む文の英訳文に、どの単語が含まれるか? Intelligence artificial wisdom you this the 人工知能ならどうか。2つの単語からなる熟語が出てくるだろう • 翻訳したい文に近い文を集め、その対訳や 慣用句などと、なるべくつじつまが合うよう 単語を並べる 難しい問題 • 絵の中身を読み解く問題 ● 以下の文章は、スミスさん一家のある一日を表している。この 文章が表している絵は次のどれか + 弟は野球に行って、試合に勝った + 母はカーペットを買ってきた + 父は家で夕食を食べた ディープラーニング • ニューラルネットは、「ここに論理構造がありそうだ」というところ を狙って、ネットワークを設計しなければならない そこが、汎用化や高精度化を難しくしている • ディープラーニングは、そこの自動化を、多階層化で、図る ・・・ 局所的な構造の獲得 第1階層の各ノードは、局所的なパターンが現れたら発火、の意味 第2階層は、より抽象度の高いパターンが現れたら、発火 細かいパターンの組合せとして、大きな構造の概念を獲得する 強みと弱み • ディープラーニングは、いわば巨大な自由度を持つニューラル ネット。決めなければならないパラメータが大量にある 大量のデータがないと、パラメータが定まらない 計算コストが巨大 • ネットワークの詳細構造が与えられなくても自動的にできる (画像など、大量に教師データがあれば、自動学習できる) • ネットワークの概念的な骨格がないと、うまくいかない (音声のセグメント、画像のメッシュなど) グラフや、ゲノムの属性などでは、構造が作りにくい 機械と人間の認識の違い • コンピュータは、人間とはまったく違うルールで画像を認識する 人間は、心霊写真のように、顔ではないものを顔っぽく見てしま うことがある ディープラーニングにもそれはあるが、人間にはまったく似てい るように見えない! 右のパンダの画像は、機械には「テナガザルそのもの」に見える © http://karpathy.github.io/2015/03/30/breaking-convnets/ 数学の時間 基本的なアプローチ • 数学の証明は、与えられた条件から、ゴールとなる条件を導ける かどうかの問題 • 自動定理証明システムに突っ込むと、意外と上手に解いてくれる • 文章を読み解いて、数式に変換するところが一番大変 • 数式になってしまえば、あとはソルバーがけっこう解いてくれる 自動証明技術の研究開発は長く、そこそこ優秀 (数式OCR、なんてのも最近あります。けっこう良くできてる!) 難しい問題 • 統計の問題 ● この町の子供達の勉強時間を、地区ごとに集計した ところ表のようになった + A のところに入る数字は何か + B のところが何以上になると、分散が10以上になるか + C地区に、3人の子供が引っ越してきたところ、平均が ○○になった。ところが何以上になると、分散が10 以上になるか 物理の時間 基本的な問題パターン • 物理の問題は、基本的には数学的な問題が多い 物理 (数式の証明、あるいは値の計算) • 文章から式を導ける物もあるが、多くのものは図がついている (数式になれば、あとは数学と同じ) • 絵から、実際の空間上に どのように配置されているのかを 読み解くのは、以外と大変 • 文章も、正確に理解するのは大変 • 配置がわかれば、後は物理 シミュレーションで何がおきるかわかる © http://schoolbutsuri.blogspot.jp/ 2013/01/blog-post.html 文章が示す意味の揺らぎ • 言葉は、常識を取り去ると非常に揺らぎが大きい 例) 机の上にある四角い板の上にひもで繋がれたボールがある 全部作ってしまえ • 揺らぎに背景知識を当てはめて絞り込むのが王道だが、それで 完全に正しい状況を得ることは難しい ならばすべての可能性を列挙してしまえ。 全てのモデルで物理シミュレーションを行って、 うまくいくものを求める ••• 全ての組合せ • 問題文から、どのような物体があるかはわかる ボール、机、板、ひも • それらの接続関係、位置関係、力のかかり具合などに違いがある • 接している、でも、どこで接しているか、あるいは動いているような 状況もある • しかし、高々5個の物体が4通りの位置関係の可能性を持つ程度 なら、45 = 1024通りの組合せにしかならない • 10個の物体が10通りの位置関係の可能性を持つ、くらいになると 厳しい 難しい問題 • 社会的な、あるいは現実世界の常識を利用する問題は難しい + ここに、ピーという音が来ると前に進み、プーという音が聞こ える後ろに進むロボットがあります。図のAとBのスイッチを同時 に入れて音を出したとき、ロボットはどちらに進むでしょうか 化学の時間 基本的なアプローチ • 化学の問題には、数学的な問題と物理学的な問題と知識を問 う問題がある • 知識を問う問題へのアプローチは、社会と同じ • 数学的な問題、物理的な問題は、基本はだいたい同じなのだ が、両者のソルバーを転用することはできない 化学式ソルバー • 化学の式は、数学には出てこないタイプの変形がある + 原子が分子になる + エネルギーが出る、あるいは吸収する + 触媒や温度など、外部要因がある 2H2 + O2 2H2O + e (約分できない、等式は成り立たない) C6H12 + HCOOH C6H11 COOH (C はいっしょにしちゃだめ) • 代数とは異なる公理系であり、状態の変化というものがある • つまり、専門のソルバーが必要。 技術的には簡単だが、労力は途方もない 化学系シミュレーション • 物理と同じようだが、やはり異なるポイントがいくつもある + 固体・液体・気体の状態変化がある + 化学反応を起こして熱を出す + 気体、液体同士が混ざる + 熱が伝わる + 膨張・収縮する、融ける、曲がる • 通常の物理シミュレーションとは異なることが起きる • ただし、気体にしても液体にしても、記号化しても大丈夫な程度 の抽象度を持っており、実現は困難ではない 道徳の時間 どこが深化したのか • 知能にもいろいろな側面がある 記憶、計算、整理、、、 記憶、計算、整理、、、 推理、推論、関連づけ、判断、、、 推理、推論、関連づけ、判断、、、 認知、認識、類別、判別、、、 認知、認識、類別、判別、、、 理解、読解、想像、経験、、、 感情、創造性、愛、感覚、直感、笑い、、、 • 大幅に深化した。試験もかなりとけるようになった。 つまり、世の多くの問題は、理解する必要はない • シンギュラリティには来そうですか? 仕事を奪われる人は︖ • 多くの仕事が、「AIに奪われる」と言われている 本当でしょうか? 考えてみましょう 接客: 接客 いわゆる「タッチパネル端末」でできることが、AIでできる できないことは、 雑談、仲良くなる、笑顔、「このお酒持ち込んでいいかな」 「そばに離乳食売ってるところないですか」「どういう服が 似合うでしょうか」「心配しなくても大丈夫ですよ」 • 言語インターフェースと含意検索により、「今日のおすすめ」「最 新のファッション」など、多少端末以上のことができるようになる 事務職 営業: お客の質問に「ファクトアンサー」はできる 営業 できないことは、 関係を作る、相手のポイントを理解し、適切な提案を作ること 経理・総務: 書類の自動作成はできる 経理・総務 できないことは、 事例に適切な解釈を与えること、例がいい対応すること、業務 体系の問題点を明らかにして、改善案を作る 人事: いい雰囲気を作る。問題人物に対処する。人物評価! 人事 ・・・ 難しいと言わざるを得ない 士業 弁護士、弁理士、税理士など 知識を問うだけなら簡単。そもそもWeb検索で十分 顧客の状況が、法律や条件と当てはめるとどうなるのか、重要な ポイント探しや要約、論旨展開などが求められる 芸術家、音楽家 絵や音楽の自動生成方法が出てきたけど、、、 それなりにいいけれども、やはりストーリーがないものには、大 きな価値は見いだしづらいのでは? スマホのチープなゲームの 音楽くらいならなんとかなりそう 結局、今までの「作業が楽になる」ことはあっても、 「奪われる」ほどではない AIで未来予測 AI で未来予測 • AIで未来予測を、と言われますが。。。 • 未来が予測できるのは、未来に起こることの予兆が現在確認で きる場合だけ、です • しかも、なんでもいいから予兆を見つける、はできません ある程度の仮説が必要で、対象が絞り込まれないとできません × 地震の予兆をなんでもいいから見つけてくれ ○ 地震の直前におかしな雲が出てないか (自動で) 調べよう × この商品を買う、あるいは買いそうな客の予兆を見つけてくれ ○ 商品を買う前には、どこかのサイトを見たり、商品のページを 長い間見たり、生活パターンが変わったりするだろう。その様子を 調べることはできないか 総合の時間 ビジネスでAI ビジネスで AIを使うには︖ を使うには︖ • AI、と言ってもほんとの人工知能というモノはないわけで 自動的に何かしてくれるもの、がAI と見られているんです • AIより、「最近進化した情報技術」のほうが見通しがいいです + 近年のAIの進化は、ビッグデータの利用から来てます まず、データを上手に使って利得を得ることを考えましょう + 画像認識が進化しました。カメラ+物体認識、を、 センサーの一種と考えて良いでしょう + 自然言語処理が高度になりました。翻訳、含意検索を 音声認識と一緒に使えば、様々なことが出来ます 実際には使うところは • 技術的に人工知能が突出しているのは、 推論と囲碁将棋、自然言語、画像と音声、の3つ + 囲碁将棋のようなゲームの深読みは、普通は不必要 + 画像・音声認識の場合、考えることは、環境を整備すること 大量のデータが手に入るか、 ノイズ消したり、ものだけ真ん中に写るようにできるか 誤認識しそうなほどたくさん現れているものはないか たくさんのカメラやマイクをおいて、認識精度を上げられるか + 自然言語の場合、意味理解を伴わないでできるか、が重要 現れる単語の数、自動翻訳の利用、同じことに対して、 異なる表現が使われるか、など 自分でトライアルしてみる • 自然言語や画像解析の結果から、自動分類や、推論、予測をし たいときには、それが人間にできるものなのか、試せばいい 人間にできない推論は、コンピュータにもできない 機械が強いところは、規模とミスのなさだけ + 購買予測をしたいなら、購買した人のデータを数件、 じっくり見てみる。なんか、共通の予兆はあるか + 特許や会計、法律や医療などで、自動判断(適法か、新規性 があるか、病気か、など)をしたいなら、 実際のデータ(判例、症状、明細書など)だけを使って判断でき るかどうか、試してみる。 一般常識や善悪、感覚、経験、意味理解しての推論などが入っ ていたら、それはAIには難しいと言うこと。 なしでできるか? 小売店での思考実験 • アパレルなどの小売店での活用を考えてみる まず、なんのデータを、何に使えそうなのか? + ビデオで顧客の表情を見て、タイプ分けや興味を測るか? データを集めるのが大変そう。人間の判断もフィーリングだから、 機械に学ばせるのも難しそう 着ている服の感じならわかるかも。値段とか雰囲気とか 勧める服は、データから選ぶか、それともクリエイターが決めるか + メンバーズカードや売り上げデータ 過去にどういう服を買ったか、でお勧めできるものはありそうだ 今までの傾向に沿うか、変化をつけるか、という戦略が必要 住所や購入日などからライフスタイルを推測できるか + Webデータ: 評判や、どういうサイトに行ってる人が興味あるか、などがわかる まとめ • 人工知能が大学入試を受ける 意味理解を伴わず、推論や認識だけでできることはたくさんある • 意味理解ができるようにならないと、シンギュラリティはこない • ビジネスでは、最近進化した部分を使うのが重要 アブストラクト 近年のAIの難しさは、まずは見通しの悪さにあると考えている。 自分のビジネス・活動に対して、AIは助けになるのか、AIを使っ て新しいビジネスが始められるのか。ライバル、関連業界がAIを 使い、自分が取り残されることはないのか。これらの疑問は、す べてAIに対する見通しの悪さが原因である。もっとわかりやすい 技術、たとえば自動車エンジンの技術であれば、いくらエンジン が発達しても、花屋は自分のビジネスには直接役に立たないだ ろうと思うわけだし、床屋は、それで自分がライバルに取り残され るとは思わない。 新しいビジネスを始めるときに、どう使えばい いのか、ということもわかりやすい。しかしAIの場合は、こういっ た直感が働かない。本公演では、AIの「機能と特性」をかいつま んでお話しし、どんなことに使うとどの程度の効果が得られるの か、を解説し、AIのビジネスでの利用に対して直感的な理解がで き、将来の動きがなんとなくイメージできるようにする。
© Copyright 2024 Paperzz