オントロジーを用いたTV番組グラフ 作成システム

オントロジーを用いたTV番組グラフ
作成システム
株式会社東芝 研究開発センター 溝口祐美子
yumiko.mizoguchi@toshiba.co.jp
Copyright 2006, Toshiba Corporation.
発表内容
•
•
•
•
•
•
•
•
研究の背景
番組グラフを用いた番組検索インターフェース
番組間の関連度計算アルゴリズム
番組のタグ付け
ネットワークを介したタグ付けの共有
速度評価
まとめ
今後の課題
2
1
研究の背景:TV番組表からTV番組グラフへ
• テレビ番組数の増加
– 多チャンネル化(地上波、BSデジタル、ケーブルTV)
– インターネットによる動画配信
• リアルタイム視聴から録画視聴へ
– デジタルレコーダなどの普及
• 番組表(時間x局)では一覧性に限界
• 時間軸はそれほど重要な切り口ではない
番組間の関連によるグラフ表示すること
で控えめな番組推薦
東芝情報システム株式会社と共同研究
3
TV番組グラフを用いた番組検索インターフェース
4
2
録画済み番組
5
パラメータ調整インターフェース
6
3
TV番組グラフのシステム構成
インターネット
距離をノード数または線の太さで表す
番組アイコン付き
放送予定番組
ユーザタグ
HDD録画済番組
番組情報
DB
タグ付け機能
番組
オントロジー
TouchGraph
描画機能
2番組情報
番組間距離
関連度計算機能
7
オントロジー
EPG属性
番組オントロジー
放送局オントロジー
1.
放送局
2.
放送時間帯
3.
曜日
4.
タイトル
映画作品オントロジー
5.
ジャンル
番組ジャンルオントロジー
6.
人名
人物オントロジー
出演者,監督,脚本,声優など
7.
内容・あらすじ
16クラス,14インスタンス
時間オントロジー
18クラス,12インスタンス
2154クラス,212751インスタンス
5837クラス, 192042インスタンス
地名オントロジー
9937クラス, 239676インスタンス
8
4
オントロジー例
放送局オントロジー
時間オントロジー
映画作品オントロジー
Station
時間
Public Station
祝日
NHK総合
映画
Commercial Station
ウイークデー
月
番組ジャンルオントロジー
コメディ
夜
マルチ
タレント
刑事
ゴールデン
地名オントロジー
人物オントロジー
水野裕子ト
ニュース報道
朝
ミステリー
歴史
日本の地理
タレント
ドラマ全般 ドキュメンタリー教養全般
アドベンチャー
ロマンス
火
ジャンル
スポーツ全般
時間帯
日本テレビ TBSテレビ
日本の岬
お笑い
落語家
宗谷岬
吉本
日本の山
日本の登山基地
日本百名山
ドキュメンタリ・教養
林家三平 林家いっ平
笑福亭仁鶴
島田紳助
新穂高温泉
上高地
富士山
9
TV番組間の関連度
n
R( p1, p 2) = ∑ (∂iDi ( p1, p 2))
i =1
(1) 基本は,オントロジ毎
に計算した距離の合算
(2) オントロジ毎に重み付け
を変える.ヒューリスティック
なルールを導入して重みを
決定.
(3) オントロジ毎に距離
を計算する(1つ前のス
ライド).包摂関係にあ
る場合は,重み付けす
る.
10
5
番組の距離
各番組のEPG情報から所定のキーワードを抽出
08/05 12:15-12:45 @ NHK総合
バラエティ生活笑百科
[出]林家いっ平 [司]笑福亭仁鶴
距離2 (落語家つながりで,距離が近いと判定)
08/06 17:15-17:20 @テレビ東京
バンセン核家族
[出]林家三平 [出]爆笑王
距離計算の種
(例:録画予約済み番組,
ユーザが興味を持った番組)
距離4
08/09 22:00-22:54 @TBS
世界バリバリバリュー
[司]島田紳助 [司]水野裕子
11
オントロジーと番組
movie ontology
Movie & drama
comedy
adventure
mystery
Grey’s Anatomy
romance
crime
history
Sleepless in Seattle
Apollo 13
performer ontology
CSI Crime Scene
Investigation
location ontology
United States
Star
Seattle
Tom hanks Gary Sinise
Sleepless in Seattle
Apollo 13
CSI New York
CSI New York
Las Vegas
NY
Sleepless in Seattle
Grey’s Anatomy
CSI Crime Scene
Investigation
CSI New York
12
6
オントロジー毎の番組間の距離
作品 オントロジー
“CSI Crime Scene
出演者オントロジー
地名オントロジー
1
6
3
“CSI New York” と
”Apollo 13”の距離
5
2
6
“Sleepless in Seattle” と
”Grey’s Anatomy”の距離
3
6
1
Investigation” と
“ CSI New York” の距離
出演者オントロジーの観点
では最も近い
作品オントロジーの観点で
は最も近い
地名オントロジーの観点で
は最も近い
13
重み付けによる関連度の変化
均等
作品
1
出演者 1
地名
1
作品オントロジー 出演者オントロジ 地名オントロジー
重視
ー重視
重視
作品
2
出演者 1
地名
1
作品
1
出演者 2
地名
1
作品
1
出演者 1
地名
2
“CSI Crime Scene
Investigation” と
“ CSI New York” の距離
10
11
16
13
“CSI New York” と
”Apollo 13”の距離
13
18
15
19
“Sleepless in Seattle” と
”Grey’s Anatomy”の距離
10
13
16
11
重視する観点によって関連度は異なる!
重み変更機能で好みの観点をカスタマイズ!
14
7
距離計算の高速化
リアルタイムにグラフの関連を変更するためには、オントロジ
ーの大きさに左右されない高速な再計算が必要。
c1
c2
パスP1
映画
c3
邦画
c4
ホラー
c5
ヒューマン
ドラマ
c1
映画作品オントロジー
c2
洋画
c6
SF
c7
c3
邦画
c4
サスペンス
パスP2
映画
ホラー
c5
ヒューマン
ドラマ
洋画
c6
SF
c7
サスペンス
映画B
c8
c9
XX監督
YY監督
映画A
c10
ZZ主演
共通部分
深さ1
c9
XX監督
YY監督
c10
ZZ主演
残り
深さ2
ルートからc9へのパスP1: c1→c3→c6→c9
ルートからc7へのパスP2: c1→c3→c7
この部分は事前に計算しておく
c8
両者を合算した値3が
c9とc7の距離
(1回の集合演算で求まる)
残り
深さ1
15
タギング機能
感動
泣ける
泣ける
笑える
スリリング
08/05 12:15-12:45 @ テレビ朝日
Applo13
[出]Tom Hanks, Gary Sinise
設定
笑える
出演者
08/09 22:00-22:54 @テレビ東京
Sleepless in Seattle
[出]Tom Hanks
出演者
スリリング
08/06 17:15-17:20 @テレビ東京
CSI New York
[出] Gary Sinise
emotion
tragic
sorrow
tears Heart-warming funny
16
8
タグの作成と共有
タグを追加
Movie & drama
番組にタグ
付け
comedy adventuremystery horror
romance
history
4
3
crime
1
2
インターネット
Movie & drama
comedy adventuremystery
Movie & drama
romance
4
5
history
3
crime
1
comedy adventuremystery
2
romance
4
history
3
crime
1
2
17
タグ付けの共有による恩恵
•
•
•
•
•
一人ひとりの少ない労力で大量番組の分類を実現。
追加されたタグから新しい分類の切り口を発見。
賛同できる分類を取捨選択。
視聴者間のコミュニケーション。
タグどうしの関係付けを共有することで、オントロジーのメンテナ
ンスを支援。
18
9
速度評価
オントロジーのクラス数と距離計算時間
time by ontology size
time(msec)
5000
4000
3000
2000
time(msec)
1000
0
16
18
24
2154
5837
ontology size
番組数と距離計算時間
time by EPG size
time(msec)
100000
80000
60000
40000
time(msec)
20000
0
100
200
300
400
500
EPG size
19
まとめ
• 録画番組などのユーザが興味のある番組に関連する番組をグ
ラフ表示することによって番組をひかえめに推薦。
• Light weightなオントロジーを組み合わせ、総合的な関連度を
計算するアルゴリズムを開発。
• ユーザが組み合わせるオントロジーや重要視するオントロジー
をカスタマイズすることで自分の嗜好に合うよう関連度を調整。
• 関連度計算の高速化手法によってオントロジーの大きさに因ら
ない高速な計算を実現。
• 番組にタグ付けすることによってユーザの観点で分類。
• ネットワークを介して番組へのタグ付けを共有し、ユーザ同士の
番組推薦を実現。
20
10
今後の課題
• 大量の番組数から必要な情報を絞り込む方法の検討
• 重み調整によるユーザの嗜好の反映の精度の評価
• オントロジーの作成支援
21
デモ展示中です。
奮ってお越し下さい。
22
11