大規模音声コーパスを用いた日英・英日同時通訳

JAIS
論文
大 規 模 音 声 コーパスを用 いた日 英 ・英 日 同 時 通 訳 における訳 出 遅 延 の比 較 分 析
小野 貴博
1
遠山 仁美
(1 名古屋大学大学院情報科学研究科 S
T
2
2
松原 茂樹
2
名古屋大学情報連携基盤センター)
his paper discusses comparative analysis of word-level time delay between
Japanese-English and English-Japanese simultaneous interpretations. For
this investigation we used the Simultaneous Interpretation Database of Nagoya
University in order to conduct quantitative analysis that requires a large scale
corpus. Since temporal information was provided only to each utterance in this
database, the effective use of it by providing word-level temporal information on
the introduction of speech recognition techniques enabled us to observe a large
amount of interpreted words with time delay. We analyzed 4,468 pairs of
interpreted words retrieved from Japanese- English (J-E) interpretation data and
2,629 pairs of those from English- Japanese (E-J) interpretation data. As a result,
it became clear that time delay in E-J interpretation was shorter than that in J-E
interpretation and that part-of-speech and grammatical function of words of the
source
language
made
distinguished
distribution
of
time-delay
in
the
interpretation.
1. は じ め に
同 時 通 訳 と は 、話 者 の 発 話 を 聴 き な が ら 訳 す と い う 高 度 な 言 語 行 為 で あ る 。
「訳
す 」と い う 行 為 は 、
「 聴 く 」と い う 行 為 を 遂 行 す る こ と が 前 提 で あ り 、通 訳 者 の 発
話は話者の発話に遅れて出現する。話者の発話内容をより確実に捉えてから訳出
しようとすると、話者発話からの訳出の遅れは大きくなるが、一方で、遅れが大
きくなるほど通訳者の記憶にかかる負荷が高くなるため、通訳者はある一定の訳
質を確保できる程度の遅れで話者の発話に追従する必要がある。このように、話
者発話に対する訳出遅延は、通訳者の訳出プロセスを解明する上で本質的な現象
ONO, T., TOHYAMA, H., MATSUBARA, S. "A comparative analysis of word-level time delay
between Japanese-English and English-Japanese simultaneous interpretations."
Interpretation Studies, No. 7, December 2007, Pages 51-64.
(c) 2007 by the Japan Association for Interpretation Studies
『通訳研究』第 7 号 (2007)
であり、例えば、英語、フランス語、ドイツ語の間の同時通訳を対象とした訳出
遅 延 の 調 査 (Goldman-Eisler 1972) な ど 、 こ れ ま で に も い く つ か の 研 究 が 行 わ れ 、
関心を集めてきた。
しかしながら、これらの研究の多くは欧米語間を対象としており、日本語との
間の通訳については十分な研究がなされているとは言い難い。日英通訳における
訳 出 の 遅 れ と 訳 出 ス ト ラ テ ジ と の 関 連 に つ い て 調 査 し た 研 究 が あ る も の の (遠
山 ・ 松 原 2006)、 分 析 に は 発 話 の 開 始 時 間 の 遅 延 (ear-voice span; EVS) が 用 い ら
れている。また、日本語ではないものの、関連する研究として、英韓通訳におけ
る 通 訳 者 発 話 の 遅 延 を 定 量 的 に 分 析 し た 研 究 が あ る が (Lee 2002)、同 様 に EVS が
使用されている。日英、英日通訳では、言語間の構造的な違いが大きく、語順、
特に動詞の出現位置の違いが単語の訳出遅延の程度に影響を与えると考えられる
た め (水 野 1995)、訳 出 遅 延 の 特 徴 を 正 確 に 捉 え る に は EVS を 観 察 す る だ け で は
不十分であり、単語など、より多くの時点の訳出遅延を観察する必要がある。
一方、同時通訳者による訳出遅延の程度を明らかにすることは、自動通訳の観
点 か ら も 意 義 が あ る 。機 械 翻 訳 の 分 野 で は 、音 声・言 語 処 理 技 術 の 進 展 を 背 景 に 、
音声翻訳機に関する研究が進んでおり、今後は、同時通訳機能を備えたシステム
の 開 発 へ と 興 味 の 対 象 が 遷 移 す る こ と が 予 想 さ れ る (例 え ば 、Ryu et al. 2006)。こ
の こ と は 、品 質 の 高 い 訳 文 を 生 成 す る こ と (how-to-say) に 加 え 、適 切 な タ イ ミ ン
グ で 訳 文 を 出 力 す る こ と (when-to-say) も 研 究 課 題 と な る こ と を 意 味 し て い る 。
通訳機として許容可能な訳出遅延の程度を検討する上で、同時通訳者の振舞いは
1 つの目安となるため、分析結果は通訳機を設計するときの指標として利用する
ことができる。
本論文では、日英、および英日同時通訳における訳出遅延の定量的分析につい
て述べる。分析は、話者の発話に出現した単語に対して、その対訳語がどの程度
遅れて出現するのかを大規模に調査することにより実施した。本研究との関連と
し て 、船 山 ら は 、英 日 通 訳 デ ー タ (6 分 55 秒 ) を 用 い て 単 語 の 発 声 時 間 を 測 定 し 、
名詞と述語、ならびに、目的語とそれ以外の名詞との間で訳出遅延時間の比較を
与 え て い る (船 山 他 2004)。 本 研 究 で は 、 よ り 大 規 模 に 分 析 す る た め に 、 名 古 屋
大 学 同 時 通 訳 デ ー タ ベ ー ス (松 原 他 2001) に 収 録 さ れ て い る 、約 8 時 間 の 日 英 通
訳 デ ー タ か ら 4,468 組 の 対 訳 語 を 、 約 3 時 間 の 英 日 通 訳 デ ー タ か ら 2,629 組 の 対
訳語を抽出し、使用した。ただし、遅延を測定するために単語の発声時間に関す
る情報が必要となるものの、本データベースにおいて時間情報が与えられている
のは、発話単位に対してのみである。一方で、上述の規模を有するデータに単語
の 発 声 時 間 情 報 を 人 手 で 付 与 す る こ と は 現 実 的 で な い 。そこで本研究では、音声認
識技術を導入し、音声データと文字化データとの間の単語レベルでの対応付けを自動化
することにより、単語の発声開始時間、および終了時間を推定した。
52
大規模音声コーパスを用いた日英・英日同時通訳における訳出遅延の比較分析
本論文の構成は以下の通りである。次の第 2 章で、同時通訳における訳出遅延
について述べる。第 3 章では、分析に使用したデータについて概説し、第 4 章で
単語の訳出遅延を定量的に分析した結果を報告する。
2. 同 時 通 訳 に お け る 訳 出 遅 延 時 間
通常、話者の発声が開始されしばらく経過した後に通訳者の発声が始まる。大
域 的 に み れ ば 、通 訳 者 は い く ら か の 遅 延 を 保 ち な が ら 話 者 の 発 話 に 追 従 し て お り 、
訳出遅延の程度はほぼ一定の時間で推移しているといえる。しかし、局所的に見
れば、起点言語と目標言語との語順の違いなどが影響するため、遅延の程度は一
定ではない。例えば、日本語では文の構造に重要な役割を担う主動詞が文末に位
置しているため、日英通訳では、主動詞の聴取が遅い段階で行われ、結果として
訳文全体の出力が遅れる可能性がある。そのような例として、対訳関係にある日
本 語 発 話 と そ の 日 英 通 訳 発 話 お よ び そ の 発 声 タ イ ミ ン グ を 図 1 に 示 す 。こ の 場 合 、
日本語の動詞「始めて」が出現する前に、目的語「援助」を訳出することは難し
く 、「 援 助 」 の 訳 出 遅 延 は 「 始 め て 」 よ り も 大 き く な る 可 能 性 が 高 い 。
このように単語の訳出遅延の程度は、品詞や文法役割、文中の生起位置など、
さまざまな要因によって異なることが予想される。そこで本研究では、対訳関係
にある単語間の訳出遅延を測定し、諸要因との関連について分析する。話者によ
る単語を聞き終えた瞬間にその訳語を発声するという理想的な状況を遅延ゼロと
みなし、単語の発声終了時刻と対訳語の発声開始時刻との差を 訳出遅延時間 と
定 義 す る 。図 1 に「 援 助 」と そ の 対 訳 語 “aid” と の 間 の 訳 出 遅 延 時 間 の 計 算 例 を
示 す 。「 援 助 」 の 発 声 が 終 了 し て か ら “aid” の 発 声 が 開 始 さ れ る ま で に 要 し た 時
間 3.164 秒 が 、「 援 助 」 の 訳 出 遅 延 時 間 と な る 。
話者
わが国は発展途上国に対する援助を始めております。
通訳者
Japan had started official government aid to developing countries.
[秒]
635.908
図 1
訳出遅延時間(3.164秒)
639.072
訳出遅延時間
3. 分 析 に 用 い た デ ー タ
日英通訳、および英日通訳における訳出遅延を大規模に分析するために、名古
屋 大 学 同 時 通 訳 デ ー タ ベ ー ス (松 原 他 2001) を 使 用 し た 。 こ の デ ー タ ベ ー ス は 、
独話ならびに対話の同時通訳音声データとその文字化データを収録しており、い
くつかの研究機関に配布され利用されている
1)
。日英通訳、英日通訳とも日本語
を母語とする第一線の通訳者を起用しており、通訳者は、話者をガラス越しに観
53
『通訳研究』第 7 号 (2007)
察できる専用ブースに入り、ヘッドホンから聴こえる話者音声を通訳している。
分 析 は、独 話 データを対 象 に実 施 した。日 英 通 訳 では 17 名 の同 時 通 訳 者 による計
492 分 12 秒 の通 訳 音 声 を、英 日 通 訳 では 9 名 の同 時 通 訳 者 による計 186 分 25 秒 の通
訳 音 声 を使 用した。表 1、表 2 に、日本語講演と日英通訳、英語講演と英日通訳の基礎統計
をそれぞれ示す。
名 古 屋 大 学 同 時 通 訳 デー タ ベ ースでは 、2 0 0 ms 以 上 の ポー ズ ( 無 音 声 区 間 ) で
分 割 された単 位 を発 話 単 位 と定 めており、全 ての発 話 単 位 に対 して開 始 時 刻 と終 了
時 刻 を 人 手 で 付 与 し て い る 。 文 字 化 デ ー タ は 、 「 日 本 語 話 し 言 葉 コ ー パ ス (C S J ) 」
( 前 川 他 2 000) の 書 き 起 こ し 基 準 に 準 拠 し て お り 、 話 し 言 葉 に 特 徴 的 に 現 れ る フ ィ
ラーや言 い直 し、言 い誤 りといった言 語 現 象 に対 して談 話 タグを付 与 している。また、
話 者 発 話 と通 訳 者 発 話 との対 訳 対 応 の分 析 を人 手 で行 っており、発 話 単 位 を最 小
単 位 と した 対 訳 デ ータ を利 用 す る こと がで きる ( 高 木 他 2 0 0 2 ) 。
本 分 析 では、対 訳 語 の訳 出 遅 延 を観 察 するため、発 声 時 刻 と対 訳 対 応 に関 する
データが単 語 レベルで必 要 となるものの、大 量 のデータに対 して人 手 でこれらの情 報
を付 与 することは現 実 的 ではない。そこで本 研 究 では、単 語 の発 声 時 刻 、および対
訳 対 応 関 係 を 、 以 下 に 述 べ る 方 法 に よ り 自 動 的 に 付 与 した 。
3.1
単語発声時刻の推定
発 話 単 位 の音 声 と書 き起 こしテキストを単 語 レベルで対 応 付 けることにより、各 単
語 の発 声 開 始 時 刻 、および発 声 終 了 時 刻 を推 定 した。単 語 発 声 時 刻 の推 定 手 順
を 以 下 に 述 べる( 図 2) 。た だ し 、 本 研 究 では 日 英 、 英 日 通 訳 を 対 象 と して お り 、 以 下
では 日 本 語 お よび 英 語 の 場 合 につ いて 説 明 す る。
(1 ) 発 話 単 位 の 単 語 への 分 割 、 なら びに 、 各 単 語 への 読 み の 付 与
•
日 本 語 : 形 態 素 解 析 器 茶 筌 ( 松 本 他 2 0 0 3 ) を 用 い て 形 態 素 に 分 割 した 。
茶 筌 が出 力 するカタカナの読 みを音 素 の列 に変 換 し、単 語 の読 みとした。音
声 認 識 エ ン ジン Ju liu s (Juliu s 200 5) に 付 属 の 読 み 付 与 ツ ール キ ッ ト の 規 則
を修 正 した ものを 変 換 規 則 と して 用 いた 。
54
大規模音声コーパスを用いた日英・英日同時通訳における訳出遅延の比較分析
•
英 語 : 空 白 文 字 により発 話 単 位 を単 語 に分 割 し、辞 書 を用 いて読 みを付 与
し た 。 辞 書 と し て 、 TIMIT Acou stic -Phoneti c Cont inuo us Sp eech Co rpu s
(Garofolo et al. 1993) 付 属 の辞 書 、ならびに CMU Pronouncing Dictionary
(CM U 1998 ) を 使 用 し た。
(2 ) 音 素 の 列 と 音 声 の 対 応 付 け
音 響 モデルを用 いて、各 単 語 の読 みに含 まれる音 素 を音 声 と対 応 付 ける。対 応
付 けに は、 音 声 認 識 エ ンジン Juliu s (Juliu s 20 05) を 用 い た。 日 本 語 の 音 響 モ デ
ルには 、J u l i u s 付 属 の 不 特 定 話 者 PTM トラ イフォ ンモ デ ルを 用 いた 。 英 語 の 音 響
モデル のた めに 、TIM I T Acou st ic -Phone tic Continuou s Speech Co rp us か ら 2 混
合 モノ フォ ンモ デルを HT K ( Young et al. 2006) を 用 いて 構 築 した 。 音 響 モデル を
構 築 する と きの 音 響 分 析 条 件 を 表 3 に 示 す 。
(3 ) 単 語 の 発 声 開 始 時 刻 、 発 声 終 了 時 刻 の 決 定
各 単 語 ごと に、読 みに 含 まれる 音 素 と 対 応 付 けられた音 声 をまとめ上 げ、 音 声 の開
始 時 刻 、および終 了 時 刻 を、それぞれ単 語 の発 声 開 始 時 刻 、終 了 時 刻 とする。
音声
書き起こしテキスト
(F え)第一点はこれまでの日本と
(1) 単語に分割,読みの付与
(F え)
第一点
は
これまで
の
日本
と
e
daiiqteN
wa
koremade
no
nihoN
to
(2) 対応付け
(F え)
e
0
第一点
d a
i
i
q
は
t e N w
0.270
1.010
これまで
a
k
の
o r e ma d e n
1.320
日本
o
1.880
n
と
i h o N t
2.130
o
2.580 2.830 [秒]
(3) 発声時刻の決定
単語
(F え)
第一点
は
これまで
の
日本
と
開始時刻 [秒]
0.000
0.270
1.010
1.320
1.880
2.130
2.580
終了時刻 [秒]
0.270
1.010
1.320
1.880
2.130
2.580
2.830
図 2
単語の発声時刻の推定手順
55
『通訳研究』第 7 号 (2007)
表 3
音響モデル構築時の音響分析条件
16,000Hz
サンプリング周 波 数
0.97
プリエンファシス
H a m mi n g 窓
分析窓
分析窓長
2 5 ms
窓間隔
1 0 ms
特 徴 パラメータ
MF C C( 1 2 次 ) + ∆ MF C C+ ∆P o w ( 計 2 5 次 )
周波数分析
等 メル間 隔 フィルタバンク
24 チャネル
フィルタバンク
C MS
発 声 単 位 で実 行
上 記 の手 法 によって、日 英 、英 日 同 時 通 訳 データに対 して単 語 発 声 の開 始 、およ
び 終 了 時 刻 を 付 与 し た と こ ろ 、 日 本 語 で は 98.7% (17 5 ,528/177,870) 、 英 語 で は
89.4% (12 2 ,809/137,354) の 単 語 に 時 刻 を 付 与 す る こ と が で き た 。 時 刻 付 与 に 失 敗
した 主 な 原 因 とし て 、 辞 書 の 問 題 や 入 力 音 声 の 不 明 瞭 な 発 音 が 挙 げ られ る。 表 4 に 、
人 手 による作 業 結 果 を基 準 としたときの自 動 推 定 結 果 の誤 差 を示 す。日 本 語 は無
作 為 に 選 ん だ 1 0 発 話 単 位 の 、 英 語 は 7 発 話 単 位 の 結 果 で ある 。 一 方 、 人 手 に よ る
作 業 の 揺 れ は平 均 0 .0 14 秒 、 最 大 0.0 75 秒 で あり 、 自 動 推 定 に より 作 成 した 時 刻 デ
ー タの 利 用 可 能 性 を 確 認 した 。
表 4 単語発声時刻推定の精度
3.2
日本語
英語
平 均 誤 差 [秒 ]
0.031
0.028
最 大 誤 差 [秒 ]
0.098
0.144
語の対訳対応付け
対 訳 語 辞 書 を用 いて話 者 発 話 と通 訳 者 発 話 の中 から対 訳 語 を抽 出 した。抽 出 には、
話 者 発 話 と通 訳 者 発 話 の文 レベルでの対 訳 対 応 付 けデータを用 いた。文 に含 まれる全
ての単 語 の組 のうち、対 訳 辞 書 を用 いて対 訳 関 係 にあると判 定 でき、かつ、以 下 の条 件 を
満 たす組 を対 訳 語 として抽 出 した。
•
1 対 1 に対 応 する対 訳 関 係 にある。
•
単 語 は内 容 語 である。
56
大規模音声コーパスを用いた日英・英日同時通訳における訳出遅延の比較分析
•
3.1 節 の方 法 により発 声 時 刻 が推 定 されている。
•
通 訳 者 発 話 の単 語 が話 者 発 話 の単 語 に遅 れて発 声 が開 始 されている。
対 訳 辞 書 には、英 辞 郎 (英 辞 郎 2001) から抽 出 した約 20 万 エントリを用 いた。
本 手 法 により、名 古 屋 大 学 同 時 通 訳 データベースの日 英 同 時 通 訳 から 4,468 組 、英 日
同 時 通 訳 から 2,629 組 の対 訳 語 を抽 出 した。図 3 に日 英 同 時 通 訳 から抽 出 した対 訳 語 の
例 を示 す。異 なる 2 つの同 時 通 訳 事 例 から抽 出 した対 訳 語 が実 際 に正 しく対 訳 関 係 にあ
ることを、ランダムサンプリングにより人 手 で検 証 したところ、正 解 率 は 94.2% (181/192) と
高 いスコアを得 ており、自 動 的 に作 成 した対 訳 語 データの利 用 可 能 性 を確 認 した。
図 3 日英同時通訳から抽出した対訳表現
4
訳出遅延時間の分析
作 成 した対 訳 語 データを用 いて単 語 レベルの訳 出 遅 延 について比 較 分 析 した。訳 出
遅 延 の程 度 に関 する傾 向 を明 らかにするために、分 析 では、通 訳 の方 向 (4.1 節 )、なら
びに、訳 出 対 象 となる単 語 の種 類 (4.2 節 ) に着 目 した。
4.1
日英通訳と英日通訳の比較
通 訳 の方 向 と訳 出 遅 延 の大 きさとの関 係 を明 らかにするために、日 英 通 訳 の対 訳 語 と
英 日 通 訳 の対 訳 語 との間 で訳 出 遅 延 時 間 を比 較 した。分 析 には、日 英 対 訳 4,468 語 、
英 日 対 訳 2,629 語 を使 用 し、対 訳 語 ごとにその遅 延 時 間 を算 出 した。遅 延 時 間 の分 布 と
して、日 英 通 訳 、英 日 通 訳 それぞれにおける訳 出 遅 延 時 間 の累 積 割 合 を図 4 に示 す。
図 4 より、英 日 通 訳 に比 べ、日 英 通 訳 では単 語 の訳 出 が遅 れることがわかった。実 際 、訳
出の遅延が 2 秒以内である対訳語が、英日通訳では全体の 6 割以上を占めるのに
57
『通訳研究』第 7 号 (2007)
対して、日英通訳では 2 割程度に留まっており、遅延時間の差は著しい。対訳語の
平均遅延時間は、英日通訳で 2.271 秒だったのに対して、日英通訳では 4.687 秒であった。
第 2 章 で論 じたように、日 本 語 では一 般 に主 動 詞 が文 末 に出 現 するため、日 英 通 訳 で
は文 全 体 の構 造 の把 握 が遅 れ、結 果 的 に訳 出 が遅 くなることがしばしば指 摘 されている
(例 えば、八 島 1985)。また、Goldman-Eisler は、起 点 言 語 が英 語 やフランス語 の場 合 よ
りも、ドイツ語 を起 点 とする場 合 の方 が訳 出 遅 延 時 間 が長 くなるという結 果 をもとに、SVO
構 造 の言 語 よりも、SOV 構 造 の言 語 を起 点 とする場 合 に訳 出 遅 延 が大 きくなると論 じて
いる (Goldman-Eisler 1972)。本 分 析 データでは、同 様 に SOV 構 造 である日 本 語 にお
いてもそれを起 点 とする場 合 に訳 出 遅 延 が大 きくなることを示 しており、上 述 の見 方 を裏
付 ける結 果 となった。
[%]
100
90
80
70
60
50
40
30
20
10
0
日英
0
1
2
3
4
5
6
7
英日
8
9
10
遅延時間 [秒]
図 4 日英および英日通訳の訳出遅延時間
4.2 単 語 の 種 類 と 訳 出 遅 延 時 間 の 関 係
4.2.1
単語の品詞と訳出遅延の関係
日 英 通 訳 と英 日 通 訳 の間 で訳 出 遅 延 に差 が生 じる要 因 の1つとして、日 本 語 と英 語 と
の間 の語 順 の違 いが挙 げられる。第 2 章 でも論 じたように、特 に動 詞 の生 起 順 序 の違 いが
顕 著 であることを考 えると、動 詞 と名 詞 とでは訳 出 遅 延 の様 相 が異 なる可 能 性 がある。そこ
で、日 英 通 訳 、英 日 通 訳 それぞれにおいて、起 点 言 語 の単 語 の品 詞 (動 詞 または名 詞 )
とその訳 出 遅 延 時 間 との関 係 を調 べた。単 語 の品 詞 の判 定 は、日 本 語 は形 態 素 解 析 器
茶 筌( 松 本 他 2003)の出 力 結 果 に、英 語 は nlparser (Charniak 2000) の出 力 結 果 に従
った。日 英 通 訳 では名 詞 2,679 語 ならびに動 詞 405 語 を、英 日 通 訳 では名 詞 1,522 語 な
らびに動 詞 376 語 を使 用 した。
日 英 通 訳 、ならびに英 日 通 訳 における名 詞 と動 詞 の訳 出 遅 延 時 間 の累 積 割 合 をそれ
ぞれ図 5、図 6 に示 す。日 英 通 訳 では、動 詞 よりも名 詞 の遅 延 時 間 の方 が長 いもののその
間 に大 きな差 は見 られなかった。一 方 、英 日 通 訳 では、動 詞 の訳 出 遅 延 時 間 が名 詞 を大
幅 に上 回 るという結 果 になった。この理 由 として、英 語 では動 詞 が比 較 的 早 い段 階 で出 現
するのに対 して日 本 語 では文 の最 後 に現 れることが挙 げられる。
58
大規模音声コーパスを用いた日英・英日同時通訳における訳出遅延の比較分析
図 5 と図 6 を比 較 すると、動 詞 の訳 出 遅 延 時 間 の分 布 は両 図 の間 でそれほど違 いはな
いことがわかる。実 際 、日 英 通 訳 における動 詞 の訳 出 遅 延 時 間 の平 均 は 4.474 秒 、英 日
通 訳 では 3.967 秒 と、その差 は 0.5 秒 程 度 に過 ぎない。一 方 で、名 詞 の差 は大 きく、日 英
通 訳 の平 均 で 4.701 秒 、英 日 通 訳 で 1.981 秒 であり、日 英 通 訳 では、名 詞 は英 日 通 訳 の
倍 以 上 の遅 延 時 間 を要 している。これに対 しては、英 語 と日 本 語 との間 の語 の生 起 順 序
の違 いに加 え、言 語 の形 態 論 的 な性 質 の違 いが理 由 として考 えられる。すなわち、英 語 で
は名 詞 の文 法 役 割 の多 くを語 の出 現 位 置 によって表 現 するのに対 し、膠 着 語 に分 類 され
る日 本 語 の場 合 、付 着 させる助 詞 の種 類 によって名 詞 の文 法 役 割 が表 現 される。このた
め、英 日 通 訳 では語 の生 起 順 序 に関 する影 響 をそれほど受 けることなく、小 さな遅 延 で名
詞 を訳 出 できる可 能 性 がある。
[%]
100
90
80
70
60
50
40
30
20
10
0
名詞
0
1
2
3
4
5
6
7
動詞
8
9
10
遅延時間 [秒]
図 5 日英通訳における名詞および動詞の訳出遅延時間
[%]
100
90
80
70
60
50
40
30
20
10
0
名詞
0
1
2
3
4
5
6
7
動詞
8
9
10
遅延時間 [秒]
図 6 英日通訳における名詞および動詞の訳出遅延時間
対訳語の訳出遅延に関するこのような事実は、文レベルでの訳出遅延の様相に
も影響を及ぼしていると考えられる。名古屋大学同時通訳データベースに付与さ
59
『通訳研究』第 7 号 (2007)
れている文対応データならびに発声時刻データを用いて、発話の開始および終了
の遅延時間を算出した。発話開始遅延時間は対訳関係にある話者発話と通訳者発
話 の 開 始 時 刻 の 差 、 発 話 終 了 遅 延 時 間 は話 者 発 話 と通 訳 者 発 話 の終 了 時 刻 の差 とし
た。データとしては、日 英 通 訳 で 1,761 対 応 、英 日 通 訳 で 1,044 対 応 を使 用 した。図 7 に
日 英 通 訳 における発 話 開 始 および終 了 遅 延 時 間 、図 8 に英 日 通 訳 における発 話 開 始 お
よび終 了 遅 延 時 間 の累 積 割 合 を示 す。グラフから、日 英 通 訳 では発 話 開 始 と終 了 の間 で
遅 延 時 間 にほとんど違 いがないのに比 べ、英 日 通 訳 では終 了 遅 延 時 間 よりも開 始 遅 延
時 間 が短 いことがわかる。これは、英 日 通 訳 では、名 詞 が小 さな遅 延 で訳 出 できるため開
始 遅 延 が小 さくなりやすいこと、また、あらゆる文 要 素 が訳 出 された後 に主 動 詞 が訳 出 され
るため終 了 遅 延 は小 さくなりにくいことに起 因 していると考 えられる。
[%]
100
90
80
70
60
50
40
30
20
10
0
開始遅延時間
終了遅延時間
0
1
2
3
4
5
6
7
8
9
10
遅延時間 [秒]
図 7 日英通訳における文レベルの訳出遅延時間
[%]
100
90
80
70
60
50
40
30
20
10
0
開始遅延時間
終了遅延時間
0
1
2
3
4
5
6
7
8
9
10
遅延時間 [秒]
図 8 英日通訳における文レベルの訳出遅延時間
4.2.2
単 語 の文 法 役 割 と訳 出 遅 延 の関 係
英 語 では、名 詞 のもつ文 法 役 割 によってその出 現 位 置 が異 なるため、日 英 通 訳 では名
詞 の文 法 役 割 によって遅 延 の程 度 が異 なることが予 想 される。そこで日 英 通 訳 データを対
60
大規模音声コーパスを用いた日英・英日同時通訳における訳出遅延の比較分析
象 に、日 本 語 での名 詞 の文 法 役 割 が訳 出 遅 延 に与 える影 響 について調 査 した。名 詞 の
文 法 役 割 を自 動 推 定 するには深 い自 然 言 語 解 析 が必 要 となるが、現 状 の技 術 では十 分
な解 析 精 度 は期 待 できないため、本 研 究 では近 似 的 な推 定 として、後 続 する助 詞 の種 類
に応 じて分 類 することにより名 詞 の文 法 役 割 を定 めた。助 詞 の種 類 ごとの名 詞 の平 均 遅
延 時 間 を表 7 に示 す。
表 7
付着する助詞の種類ごとの名詞の訳出遅延時間
助詞
と
が
は
で
に
を
も
の
頻度
112
265
193
109
211
295
53
354
平 均 遅 延 時 間 [秒 ]
3.964
4.181
4.364
4.733
4.867
4.890
4.930
5.319
一 般 に、助 詞 「は」「が」が接 続 する名 詞 は、英 語 では主 語 として出 現 しやすく、目 的 語
として現 れる名 詞 には「を」「に」が接 続 することが多 い。表 7 から、「は」「が」と共 起 する名
詞 よりも、「を」「に」と共 起 する名 詞 のほうが遅 延 時 間 が大 きいことがわかる。これについて
も、主 語 が文 の冒 頭 に出 現 しやすいという英 語 の語 順 との関 連 が考 えられる。
一 方 、日 本 語 では、目 的 語 に相 当 する名 詞 は一 般 に主 動 詞 の直 前 に位 置 することが
多 く、これが英 日 通 訳 における訳 出 の遅 延 に影 響 を与 えることが予 想 される。そこで、英
語 の名 詞 のうち目 的 語 に焦 点 をあて、その訳 出 遅 延 を調 査 した。英 文 における目 的 語 の
判 定 は、構 文 解 析 システムが出 力 した構 文 木 を使 用 した。文 法 カテゴリの構 文 木 上 の出
現 位 置 により目 的 語 に相 当 する名 詞 を決 定 することができる。構 文 解 析 システムとして
nlparser (Chiarniak 2000) を使 用 した。151 語 を目 的 語 として特 定 することができ、その平
均 訳 出 遅 延 時 間 は 2.195 秒 であった。目 的 語 以 外 の名 詞 の遅 延 時 間 は 1.957 秒 であり、
大 きな差 は見 られないものの、目 的 語 の訳 出 遅 延 が大 きくなることがわかった。この理 由 と
して、目 的 語 の出 現 位 置 における両 言 語 間 の違 いが影 響 していることが考 えられる。
4.2.3
数 詞 の遅 延 時 間
4.2.1 節 の分 析 により、日 英 通 訳 における名 詞 の訳 出 遅 延 が大 きくなる傾 向 が明 らかに
なったが、訳 出 が遅 れるほど通 訳 者 の記 憶 にかかる負 荷 が高 くなる。特 に、年 号 や面 積 、
人 数 などの数 字 の列 を含 む表 現 を記 憶 し続 けることは容 易 ではなく、他 の名 詞 とは異 なる
分 布 を示 す可 能 性 がある。そこで、抽 出 した対 訳 語 のうち数 詞 の訳 出 遅 延 時 間 を調 べた。
数 詞 の判 定 は、名 古 屋 大 学 同 時 通 訳 データベースに付 与 されているタグに従 った。
図 9 に日 英 通 訳 における数 詞 の訳 出 遅 延 時 間 の分 布 を示 す。通 常 の名 詞 の遅 延 時
間 が平 均 4.701 秒 であったのに対 し、数 詞 は 3.367 秒 であり、グラフからもわかるように、数
詞 の訳 出 遅 延 が小 さくなる傾 向 が示 された。一 方 、図 10 は英 日 通 訳 における数 詞 の訳
61
『通訳研究』第 7 号 (2007)
出 遅 延 時 間 の分 布 である。英 日 通 訳 ではもともと名 詞 の訳 出 遅 延 は小 さく、数 詞 の訳 出
においてもほとんど違 いは見 られなかった。
[%]
100
90
80
70
60
50
40
30
20
10
0
数詞
0
1
2
3
4
5
6
7
名詞
8
9
10
遅延時間 [秒]
図 9 日英通訳における数詞の訳出遅延時間
[%]
100
90
80
70
60
50
40
30
20
10
0
数詞
0
1
2
3
4
5
6
7
名詞
8
9
10
遅延時間 [秒]
図 10 英 日 通 訳 に お け る 数 詞 の 訳 出 遅 延 時 間
5.
まとめ
本 論 文 では、同 時 通 訳 コーパスを用 いて対 訳 語 の訳 出 遅 延 時 間 を大 量 に観 察 するこ
とにより、日 英 通 訳 と英 日 通 訳 における訳 出 遅 延 を比 較 分 析 した。分 析 には、名 古 屋 大
学 同 時 通 訳 データベースを用 い、日 英 通 訳 では 4,468 組 、英 日 通 訳 では 2,629 組 の対
訳 語 を対 象 とした。定 量 的 分 析 の結 果 、訳 出 遅 延 に関 する特 徴 が以 下 の通 り明 らかに
なった。
y
訳 出 遅 延 時 間 は 、日 英 通 訳 で 4.687 秒 、英 日 通 訳 2.271 秒 で あ り 、通 訳 の 方 向
に よ る 差 は 大 き い 。2 秒 以 内 の 遅 延 で 訳 出 が 開 始 さ れ る 単 語 は 、日 英 通 訳 で 2
割程度であるのに対して、英日通訳では 6 割を超える。
62
大規模音声コーパスを用いた日英・英日同時通訳における訳出遅延の比較分析
y
日 英 通 訳 と英 日 通 訳 との間 で動 詞 の訳 出 遅 延 時 間 にそれほど違 いはないが、名 詞
の訳 出 遅 延 時 間 の平 均 は、日 英 通 訳 で 4.701 秒 、英 日 通 訳 で 1.981 秒 であり、その
差 は大 きい。ただし、日 英 通 訳 における数 詞 の訳 出 遅 延 時 間 は 3.367 秒 であり一 般
的 な名 詞 と比 べ、若 干 小 さくなる。
y
日 英 通 訳 では、主 語 に相 当 する名 詞 に比 べ、目 的 語 に相 当 する名 詞 の方 が遅 延 時
間 は大 きい。英 日 通 訳 では、目 的 語 の遅 延 時 間 は 2.195 秒 であり、目 的 語 以 外 の名
詞 の遅 延 時 間 1.957 秒 よりも大 きい。
同 時 通 訳 における訳 出 遅 延 には、言 語 間 の語 順 の違 いのほかにも様 々な要 因 が存 在
する。今 後 は、通 訳 者 の言 い淀 みや訳 出 遅 延 の累 積 など、語 順 以 外 の要 因 が訳 出 遅 延
に与 える影 響 、ならびに、通 訳 者 ごとの訳 出 遅 延 の傾 向 の違 いについて分 析 することによ
り、同 時 通 訳 において訳 出 遅 延 が生 じる仕 組 みの解 明 を目 指 す。
著者紹介:
小 野 貴 博 (ONO Takahiro)
名古屋大学大学院情報科学研究科博士前期課程在学中。
自 然 言 語 処 理 に 関 す る 研 究 に 従 事 。 連 絡 先 : 〒 464-8601 名 古 屋 市 千 種 区 不 老 町
(Email: ono@el.itc.nagoya-u.ac.jp)
遠 山 仁 美 (TOHYAMA Hitomi) 名 古 屋 大 学 大 学 院 情 報 科 学 研 究 科 博 士 後 期 課 程 修 了 。
博 士 (情 報 科 学 )。現 在 、名 古 屋 大 学 情 報 連 携 基 盤 センター研 究 員 。大 規 模 コーパスを
用 いた同 時 通 訳 理 論 の構 築 、ならびに言 語 資 源 データベースの構 築 に関 する研 究 ・開 発
に従 事 。
松 原 茂 樹 (MATSUBARA Shigeki) 名 古 屋 大 学 大 学 院 工 学 研 究 科 博 士 後 期 課 程 修 了 。
博 士 (工 学 )。現 在 、名 古 屋 大 学 情 報 連 携 基 盤 センター准 教 授 、独 立 行 政 法 人 情 報 通 信
研 究 機 構 専 攻 研 究 員 。自 然 言 語 処 理 、音 声 言 語 処 理 、情 報 検 索 、デジタル図 書 館 の研
究 に従 事 。
【註 】
1) 名 古 屋 大 学 同 時 通 訳 データベースの配 布 については、以 下 の URL を参 照 。
h t tp :/ / s lp . e l . i t c . n a g o y a - u . a c . j p / s id b / (Aug. 1, 2007).
【参 考 文 献 】
Charniak, E. (2000) A Maximum-Entropy-Inspired Parser, Proc. of the NAACL-2000, pp.
132-139.
63
『通訳研究』第 7 号 (2007)
CMU (1998) CMU Pronouncing Dictionary [online] http://www.speech.cs.cmu.edu/cgi-bin/
cmudict (Aug. 1, 2007).
Garofolo, J. S., Lamel, L. F., Fisher, W. M., Fiscus, J. G., Pallett, D. S., Dahlgren, N. L.
(1993) DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus CD-ROM.
Goldman-Eisler, F. (1972) Segmentation of Input in Simultaneous Translation, Journal of
Psycholinguistic Research, Vol. 1, No. 2, pp. 127-140.
Lee, T.-H. (2002) Ear Voice Span in English into Korean Simultaneous Interpretation,
META, Vol. 47, No. 4, pp. 596-606.
Ryu, K., Matsubara, S., Inagaki, Y. (2006) Simultaneous English-Japanese Spoken
Language Translation Based on Incremental Dependency Parsing and Transfer,
Proceedings of the COLING/ACL-2006, pp. 683-690.
Young, S., Evermann, G., Gales, M., Hain, T., Kershaw, D., Liu, X., Moore, G., Odell, J.,
Ollason, D., Povey, D., Valtchev, V., Woodland, P. (2006) The HTK Book (for HTK Version
3.4) [online] http://htk.eng.cam.ac.uk/ (Aug. 1, 2007).
英 辞 郎 (2001) [online] http://www.eijiro.jp/ (Aug. 1, 2007).
大 語 彙 連 続 音 声 認 識 システム Julius (2005) [online] http://julius.sourceforge.jp/ (Aug. 1,
2007).
高 木 亮 ・ 松 原 茂 樹 ・ 稲 垣 康 善 (2002) 「 同 時 通 訳 コー パ スの 対 訳 ア ライ メ ン ト 手 法 とそ の 評
価 」『情 報 処 理 学 会 第 64 回 全 国 大 会 講 演 論 文 集 』 Vol.2, pp. 87-88, Mar. (2002).
松 原 茂 樹 ・相 澤 靖 之 ・河 口 信 夫 ・外 山 勝 彦 ・稲 垣 康 善 (2001) 「同 時 通 訳 コーパスの設 計 と
構 築 」 『通 訳 研 究 』 第 1 号 , pp. 85-110.
遠 山 仁 美 ・松 原 茂 樹 (2006) 「訳 出 遅 延 時 間 と訳 出 開 始 タイミングに着 目 した同 時 通 訳 者 の
原 発 話 追 従 ストラテジーに関 する分 析 」 『通 訳 研 究 』 第 6 号 ,pp. 113-128.
船 山 仲 他 ・笠 原 多 恵 子 ・西 村 友 美 (2004) 「同 時 通 訳 における訳 出 遅 延 のメカニズム」 平
成 12-13 年 度 科 学 研 究 補 助 金 (基 盤 研 究 (c)(2))研 究 成 果 報 告 書 『同 時 通 訳 における対
訳 遅 延 の認 知 言 語 学 的 研 究 』,pp. 3-24.
前 川 喜 久 男 ・籠 宮 隆 之 ・小 磯 花 絵 ・小 椋 秀 樹 ・菊 池 英 明 (2000) 「日 本 語 話 し言 葉 コーパス
の設 計 」 『音 声 研 究 』 第 4 巻 , 第 2 号 ,pp. 51-61.
松 本 裕 治 ・山 内 啓 ・山 下 達 雄 ・平 野 善 隆 ・松 田 寛 ・高 岡 一 馬 ・浅 原 正 幸 (2003) 「形 態 素 解
析 システム『茶 筌 』 version 2.3.3 使 用 説 明 書 」 奈 良 先 端 科 学 技 術 大 学 院 大 学 松 本 研
究 室 [online] http://chasen.naist.jp/hiki/ChaSen/ (Aug. 1, 2007).
水 野 的 (1995) 「日 英 同 時 通 訳 研 究 ノート」 『通 訳 理 論 研 究 』 第 9 号,第 5 巻 2 号,pp.
4-21.
八 島 智 子 (1985) 「通 訳 術 の分 析 」 (河 野 守 夫 ・沢 村 文 雄 ・編 『Listening & Speaking ―
新 しい考 え方 』) 山 口 書 店 ,pp. 176-193.
64