平成17年度大学院知識システム特論

平成23年度大学院
Webインテリジェンス論
やまぐちたかひら
山口高平
居室：慶應義塾大学矢上キャンパス 24-619A
内線：42673
電話：045-566-1614
FAX; 045-566-1617
メール：yamaguti@ae.keio.ac.jp
Web： www.yamaguti.comp.ae.keio.ac.jp
授業内容と授業計画，講義資料，成績評価
授業内容
人工知能に関する基本的知識を修得した後、次世代Webとして、
セマンティックWebとオントロジーに関する知識とスキルを身につける。
授業計画
①4/19 ガイダンス，人工知能歴史
②4/26 エキスパートシステム
5/3 休講
③5/10 知識モデリング
④5/17 セマンティックWeb概論
⑤5/24 RDF/RDFS
⑥5/31 RDF Graphical Tool MR3 （休講？）
⑦6/7 オントロジー言語OWL
⑧6/14 オントロジーエディター Protege
⑨6/21 セマンティックWebサービス
⑩6/28 セマンティックWebアプリケーション
⑪7/5 LOD
⑫7/12 まとめ
講義資料：ｐｐｔやｐｄｆ資料をWebに掲載
www.yamaguti.comp.ae.keio.ac.jp
成績：レポート数回で評価
人工知能(AＩ)の歴史
１９５６年ダートマス会議 ↑
•
•
•
•
•
•
•
John McCarthy (LISP)
Marvin Minskey （フレーム理論）
Shannon （情報理論，チェス）
オートマトン≠人工知能（ＡＩ）
ＡＩ：人間のような知的な動作を機械にさせるには？
ＧＰＳ (General Problem Solver)
探索の研究 A*アルゴリズム
１９６５年～ＡＩの３（４）大事件 →
・導出原理：拡張三段論法J.A.Robinson
1972:Prolog処理系
1982～１９９４：第５世代コンピュータ
・ＤＥＮＤＲＡＬ:スペクトラム分析→分子構造
ファイゲンバウム（スタンフォード大学）
一つのアプリケーションにしかすぎない，汎用性
・ピアス勧告：ＭＴは不可能
・ファジィ理論：ｻﾞﾃﾞｰ教授
推論の時代→ Toy Problems、ＡＩ冬の時代へ
1970年代：冬の時代 ↓
1980年代→知識工学 ↑
• ＨＰＰ：Ｈｅｕｒｉｓｔｉｃｓ Programming Project
完全ではないがたいていの場合うまくいく知識や方法
• ＭＹＣＩＮプロジェクト（１９７３～１９７６）
•
•
•
•
ＭＹＣＩＮ，ＴＥＩＲＥＳＩＡＳ，ＧＵＩＤＮ，ＥＭＹＣＩＮ
知識表現、知識利用、知識獲得→知識工学
There is power in the knowledge ! (1977)
by Feigenbaum
1980年代→知識の時代へ
エキスパートシステム，自然言語・画像・音声理
解システム，知的教育支援システム，．．．
国家プロジェクト，ＡＩハード・ソフトベンダー
Machine Intelligence
過去
1956年：ダートマス会議（汎用知能，探索，チェス，定理証明）
1965年：推論（演繹）→Toy Problem
1970年代：AI冬の時代へ
1980年代 : Knowledge is Power! (ファイゲンバウム教授，スタンフォード大）
知識工学，エキスパートシステム知識表現、知識獲得，知識の利用（推論）
説明
機能
知識
ベース
推論
エンジン
知識
獲得
作業
領域
(専門家)
ユーザ
対話
I/F
デモ１：対話デモ（Eliza, 人工無能）
デモ２：献立支援ES
1990年代：大規模データの活用
新パラダイムの誕生 ↓
• 知識獲得ボトルネック→機械学習，ニューラルネット，
GA（進化計算），ベイジアンネット，データマイニング
• エージェントの研究：自律，マルチエージェント
• 自然言語処理：スキーマ(‘70)，文法重視(’80)からコーパス（統計）へ
• DeepBlue：チェスの世界チャンピオンに勝利
カスパロフ（ロシア人）１勝２敗 DeepBlue(iBM) 1997年
512台並列処理，1秒間2億手，α-β法（量は質の変化を生む）
「毎回、対戦相手が違っていた気がする」
学習パラメータを人手により変更（MLは使っていない）→DeepBlueの振る
まいが変わる
でもゲームだよね．閉じた問題，整構造問題だからできるんだ
• ロボットとAI:ロボカップ(1995) ，ホンダヒューマノイドASIMO
(二足歩行1996), ＡＩＢＯ(1999)
• 生物とＡＩ（ゲノム情報．．．）
GACTTTCAGTAA…… 機能分析，バイオ特許
過去
1990年代：知識獲得ボトルネック
知識（ルール）
→ESが専門家代行という過大な期待.
知識ベース開発のための知識獲得は大変だ！
通産省：第5世代コンピュータ(1982-1994)の失敗？
→推論マシンに特化しすぎ．知識は
1990年代：大規模知識ベース，大規模辞書プロジェクト
CYC, EDR, WordNet(フリーなので現在も広く使われる）
でも，あまり変化しない静的知識だけ．現実には動的知識が
多い．使えないなぁ．AIブームは完全にさめて下火へ
1997年：Deep Blueがチェス世界チャンピオンに勝利．
でもゲームだよね．閉じた問題，整構造問題だからできるんだ．
2000- H/Wの進展と共にAIの成熟
データマイニング
多くの応用が生まれる
①米国ウォールマートが購入された商品分析
日曜日，既婚若者男性，購入商品組合せ
缶ビール－（？）
②10年前，日本のスーパーマーケットで，
右図の商品配置は非常識？
※10年間のGB単価の大凡減尐傾向（不正確？）
2000年（1000円），2001年（400円），2002年（200円）
2003年（150円）， 2004年（120円)，2005年（100円）
2006年（60円）， 2007年（50円）， 2008年（20円）
2009年（10円），2010年（5円）
コンピュータ将棋｢あから２０１０｣vs女流名人
知能ロボットの展開
ロボット産業
知能ロボット
（サービスロボット）
産業用ロボット
工場（自動車や電
子部品など）
・溶接ロボット
・塗装ロボット
・運搬ロボット
・電子部品実装ロ
ボット
期待
成熟
家庭・介護・医療など
・セラピーロボット
・コミュニケーションロ
ボット
・多目的（受付・案
内・誘導など）ロ
ボット
・レスキューロボット
・清掃ロボット
知能ロボットの分類
アシモ
Bigdog
（移動型ロボット：運動能力）
http://bigdogrobotvideos.com/
アイボ
パロ
（ペット型ロボット：癒し）
http://paro.jp/?page_id=247
コミュニケーション
ロボット
石黒教授
ジェミニ
（アンドロイドロボット：見た目）
http://www.youtube.com/watch?v=QMEXBWJDUMk
2000- NWの進展と共にAIの成熟
• インターネットに保存されている文書量は？
１ZB？(KB, MB, GB, TB, PB, EB, ZB)
http://www.emc.com/leadership/
digital-universe/expanding-digital-universe.html
自然言語処理＋高度ML
検索エンジンの高度化
TREC-QAシステム
セマンティックWeb（ページの意味が分かるWebへ）
2003年 QA Challenge !(1) IBM PIQUANT
• 2003～ IBM，PIQUANT(Practical Intelligent
Question Answering Technology)プロジェクト
★チェスのような閉じた問題ではなく、事前に分からないクイズ
に解答するという開いた悪構造問題に挑戦することがポイント
深い論理形式分析と浅い機械翻訳ベースのアプローチを統合
でも、この難しい問題にチェレンジするには、AI技術が未熟で、
マシンパワーも不足して、大きな成果はあげられずに終わる。
2007年 QA Challenge !(2) Powerset
(2008年にMSが＄1億で買収)
問合せ：アルカトラズ島から逃げた囚人の数は？
Google：関連するページを表示。
答えはページを読まないと分からない
Googleはページ検索エンジン
Powersetは関連するページ内の文章を
ハイライト→文章検索エンジン。
QAシステムといえる。
ただし、Web全体を検索するのではなく、
Wikipediaのみを検索対象。軽いオントロジー
を使って、同義語、類義語を判断している様子。
正当：0回。
計14回あった脱獄計画に36人の囚人
が関わり、全員脱獄に失敗した。
新しい事柄に関するQAは、
Googleの方が上になるケースがあり、
開放性が低い、データ規模が小さい、意味処
理技術が不十分？により、この3年間、成果発
表はない。でも、急に発表があるかも？
2011年 QA Challenge ! (3) IBM Watson
・IBM Deep Question Answering Project
(ジョパディで，ワトソンがチャンピオンに挑戦して勝利）
Open-Domain Question Answering
PIQUANTから時代が進み，技術が成熟、マシンパワーが拡大
IBM Watsonの概要
★大規模知識の獲得（100万冊，2億ページ）
百科事典、辞書、シソーラス、ニュース記事、著作物などを情報源。
自動的にコーパスを拡大。
★徹底した質問文解析：LAT(Lexical Answer Type)と重要語抽出
★突出した一つのAI技術ではなく，言語理解，情報検索，不確実性推論，仮説生成，
仮説統合とランキング、機械学習，知識表現(オントロジー），構造化データなど，
100以上の従来AI技術（20年前の技術もある）の集大成
★精度、確信度、速度を考慮したAIインテグレーション
★計算力：並列計算による計算パワー
★汎用性：Jeopardy Challengeに特化していない。TREC QAにも適用して成功。
★展開性：医療、金融、行政、マーケティングにも適用可能

Download Report