専 門 日本語 教 育 研 究 第3号2001 寄稿 機 械 翻 訳 か ら見 た 日本 語 小原 京子 (慶應義塾大学理工学部) 1.は じめ に 昨今で は、パ ソコン上 で動 く翻訳 ソフ トが多数市販 日本 語 は英語 な どのイ ン ド・ヨー ロ ッパ 言語 と異 な り 語 と語 の間がスペー スで区切 られてはい ない。従 って、 され、 また ウェブ上で公 開 され た 「 お試 し版」翻訳 ソフ 翻訳 システ ムは システ ム内部の形態 素解析辞書 を参照 トを起動 して文書や ホームペー ジを翻 訳す るこ とも可 しなが ら単語切 りを してい く。た とえば、(1)の よ う 能に なった。 しか し、翻 訳 ソフ トの内部の仕組 みはい なす べて平 仮名 で書 かれ た フ レー ズが入力 され た とす わばブ ラ ックボ ックスで通常ユー ザーには知 る術 もな る。 い。 自然言語処理 や人工知能 の分野 では翻 訳 ソフ トの こ (1)く るま で ま つ わ とを機械翻訳 システ ムあ るい は単 に機 械翻訳 とい う。 筆者 は、かつて コン ピュー タ ・ メーカー で 日本 語か ら英 日本 語言 諸 が この フ レー ズ を聞い た場 合 には、韻律や 語 へ の機械 翻訳 システ ム(日英 翻訳 システ ム)の研究 に 文脈 に よ り「(あ なたが)来るまで待 つわ」と言 ってい る 携 わ った経験 が ある。現在 で は言語 学 を専 門 とす る者 のか 「 車 の 中で待 つわ」と言 ってい るのか推測 がつ く。 と して 、また理工系大学 生 に英語 を教 える者 として、 ところが 、現 在の翻訳 システ ムはまだ文脈 を考 慮 に入 機 械翻訳 に とって翻訳 困難 な文 は英 語学習者 に とって れ て解 析す るには至 ってお らず、二 つの解析結 果の う も習得 困難 な ことが多 い と感 じてい る。本稿 では、ま ち どち らがそ の文脈 にふ さわ しいか決定で きない。 ず 日英翻訳 システ ムを例 に取 りなが ら、そ の内部処理 の流れ を紹介 しつつ各局 面で 問題 とな る 日本語 の特徴 盆.2構 文解析 について見 る。 次 に、英 語か ら日本 語への翻訳 システ ここでは形態素解 析の結果 を内部表現 に変換 し、文 ム(英日翻 訳 システ ム)のア ウ トプ ッ トと翻 訳家 に よる の係 り受 けを決定す る。 これは機 械翻 訳 に とって最 も 日本 語訳 とを比べてみ て、機械翻 訳 にとって は「 お手上 困難 なプ ロセスで ある。 日本 語言 諸 は、い かに文が長 げ」な のに もかかわ らず翻 訳家 が こなれた訳 に仕上 げ くて も、各 々の語句 の意 味 と文脈 か らたい ていの場 合 てい る例 を分析 し、 日本 語の特徴 をい くつか挙 げてみ 瞬時 に係 り受 け関係 を決 定 して文 の意 味 を理解 す る こ る。 とがで きる。 しか しなが ら、機 械翻訳 で は文 が長 くな れ ば急 速 に誤 り率が増大す る。文 ではな く名詞 句 だけ 2.日 英機械翻訳 における 日本語解析の 問題 点 機 械翻訳 システム は処理 の各段階 でル ール と辞書 を を とってみ て も、 日本 語の名 詞句 では、形容 詞や 形容 参 照す る。以 下では トランス ファー方 式 と呼 ばれ る翻 動詞 さ らに 「 名詞+『 の』」の形 の修飾 語句 が連 なって 一つ の名 詞 に先行 してい る ことは多 々ある 。 次 の(2) 訳 方式に よる 日英機械翻訳 の処理 の流れ を見 てい く注1。 では、いずれ も「 形容 詞+名 詞+『 の』+名 詞 」の順 に 品詞 が並 んでい る。 2.1形 態素解析 ここで はまず入力 文 を形 態素(意 味 を持つ 最小 の言 語単位)に分 け、それ ら各 々 に品詞付 けをす る。 日本 語 の形 態素解析 で厄 介 なのは、 この 「 単語切 り」で ある。 (2)a.鋭 い 目の 子 供 b.優 しい 女 の 子 通 常(2a)で は、形容 詞 「 鋭 い」が最 初 の名 詞 「目」に か ま た 、訳 語 決 定 に 関 して は 、た とえ ば 日本 語 動 詞 「 焼 か る と考 え るの が最 も 自然 で あ ろ う。 これ に対 し、 同 く」を例 に取 る と、対 応 す る英 語 の 動 詞 を決 定 す る際 に じ品 詞 が 同 じ順 に 並 ん で い る(2b)で は形 容 詞 「 優 しい 」 は 、 対 象 物 が何 で あ るか 、何 を使 っ て ど うい う状 態 で は「 名 詞+『 と考 え る の が 妥 当 で あ る。 日本 語 話 者 は この よ うに 同 焼 くの か等 に よ っ て"bake,""toast,"“roast,""broil," "burn ,""grill,""sizzle,""fry"な ど と訳 し分 け る必 要 が じ品 詞 列 で もそ れ ぞ れ の 語 句 の 意 味 や 文 脈 か ら最 も意 あ る。 機 械 翻 訳 で は 意 味 辞 書 を用 い て こ の よ うな訳 し 味 的 にふ さわ しい 係 り受 け を決 定 す る こ とが で き る。 分 け を 行 う。 筆 者 所 有 の 日英翻 訳 ソ フ トは 「 パ ンを焼 機 械 翻 訳 で は ど うで あ ろ うか。 筆 者 の所 有 す るパ ソ コ く」 を"bread ン用 の 日英 翻 訳 ソ フ トは(2a)を"the is toasted"を 出 力 した。 の 』+名 詞 」で あ る 「 女 の 子 」全 体 に か か る eye"、(2b)を"a child of a sharp is baked"と 訳 し、次 候 補 と して"bread giflkind t0''と訳 した の で係 り受 け は 正 し く決 定 で き た よ うで あ る注2。しか し、文 レベ ル に な る と 日本 語 に は重 文 や 複 文が 多 い こ と もあ り、 機 械 翻 訳 は 係 り受 け決 定 に 失 敗 す る こ とが多 くな っ て く る。 2.4英 文生成 この よ うに 日英機 賊翻訳 システムで は 目本語 の形 態 素解析 、構文解 析、そ して変換 のプ ロセ ス を経 ては じ めて英 文生成 の段 階に到達 するが、各 々の段階 で様 々 2.3変 換 なハ ー ドルが ある ことがお わか りになったか と思 う。 トランスフ ァー方 式で は、 こ こで 日本語入 力文 の内 部構造 を英 語の 内部構造 に変換 しさ らに訳語 を決定す 英文生成 では、冠詞な どの決定詞 を生成 し、性 ・ 数 の一 致 に考慮 して最 終的に英 語文 を出力す る。 る。 構造変換 で 問題 にな るのは、 日本語 と英 語の構造 が一対一 に対応 しないケー スであ る。 また、訳語決定 で厄 介 なのは、 日本 語には ない 区別 が英語 に存 在す る 場 合であ る。 3.英 語 らしさ、 日本語 らしさと英 日機械翻訳 システム 筆者 は、英 語で書かれた小説 と翻訳家 に よるそれ らの 日本語訳 との比較 対照を行ってい る。主 に登場人物 の移 まず、構造変換 に関 して、(3)を 見てほ しい。 動 に関す る表 現を比較 し、同 じ状況 を表現す る際 に、英 語 と 日本語 に とって最 も自然 な表現 とはそれぞれ どの よ (3)a.私 うな ものか、 さらに両者 は どの よ うな点 で異 な るか、 に は 雨 に 降 られ た 。 ついて調べ ている。 そ うす ることによ り、英 語 らしさ日 b.Itrainedonme. 本 語 らしさとは何 か、 とい うことを知 る手 がか りになる 目本 語文(3a)は 下線部 「られ 」 が 用 い られ て い る こ とか らわ か る よ うに 、い わ ゆ る受 身 構 文 の一 例 で あ る。 と考 えた か らである。 さ らに、 同 じ状況 を描 写す る際の英語 と 日本語 に とっ とこ ろ が これ に対 す る英 語 訳 と して最 も適 切 な(3b) てそれぞれ最 も 自然 な表 現のパ ター ンの対 を抽 出す るこ で は受 動 態 は 用 い られ て い な い。(3a)が 受 身構 文 で は とに よ り、それ らを機 械翻訳 システ ムの変換ル ール とし あ っ て も意 味 的 に は 特 殊 な 「 迷 惑 の 受 身 」とい われ る構 て使 うこ とができるのではないか、そ うすれ ば 目的言語 文 の一 例 で あ る こ と、 ま た 、 英 語 動 詞"raih"は 自動 詞 にお ける 自然 な表現(い わゆ る 「 こなれ た」訳)を 機械 で あ り受 動 態 に で き ない 動 詞 で あ る こ とか ら、通 常 の 翻訳 が生成 できるこ とにな り機 械翻訳 の翻 訳の質 の向上 受 動 態 で は な く"onme"を に役 立つ のではないか、 とも考 えてい る。 使 っ て(3a)の よ うな訳 を生 小説 とそ の翻訳 における英 日比較対照研 究で明 らか に 「 に 」 格 の前 の名 詞 「 雨 」 が通 常 なった両言語 の違 いは、二つあ る。一つ は文構 造に 関す 表 現 す る。 機 械 翻 訳 シ ス テ ムで(3b)の 成 す る に は(3a)の 意 味 を英 語 で の 受 身 文 の 「に」 格 の 前 に 現 れ る名 詞 とは 異 な り 「 動 「 降 る」 が 自動 詞 で あ る こ そ して、 このよ うな英 日の違い を既存 の翻 訳 ソフ トが 「 迷 惑 の受 身 」 で あ る こ と、 を解 どの程 度 扱えるこ とができ るのか を見極 めるため に、英 作 主 」 で は な い こ と、 動 詞 と、 従 っ て(3a)は る違 い、 も う一つ は レ トリックに関す る違 いであ る。 析 しな くて は な らな い 。 語小説 か ら抜 き出 した登場 人物の移動 に関す る文 を翻訳 ソフ トで翻訳 し翻 訳家 の 日本語訳 と比べてみた。その結 上 に存在す る建物や その一部 を記述 して移動 が起 こった 果 の一部 を以下に簡単 に紹介す る。 こ とを暗示 的に描 写す ることが多い。 その結果 、英語 で は動 的な表現 となるが、 日本語で は動詞 が使 われ ないた 3.1文 め静的 な表現 となる。 構造 英 語 で は 、移 動 の 経 路 を表 わす の に"over,""up," "down ,""through"な どの前 置 詞 や動 詞 に 後 続 す る不 変 化 (5) a英 語 の原文 詞(verb particle)を 用 い る こ とが多 い。 これ に 対 し、 こ Finally れ らを 日本 語 に 翻 訳 す る 際 に は動 詞 を使 わ ざ る を得 な い having thumpedvigorously upon the pavement, こ とが しば しば あ る。 he went up to the door. he returned to the pawnbroker's, and, (Sir Arthur Conan Doyle. The adventures (4)a.英 of Sherlock Holmes ) 語 の原 文 Here was Matthew Cuthbert placidly driving b.翻 over the hollow and up the hill. そ して 最 後 に、質 屋 の 前 の敷 石 を とん とん と強 く叩い て か ら、ドア を 叩 い た。 (Lucy MaudMontgomery.Anne of (延原 謙 訳 『シ ャー ロ ッ ク ・ホ ー ム ズ の 冒 険』) Green Gables) b.翻 訳 家 の 日本 語訳 訳 家 の 日本 語訳 c.英 日翻 訳 ソフ ト マ シ ュー ・ク スバ ー トは悠 々 と窪 地 を抜 け て 丘 最後 に、 彼 は質 屋 に戻 りま した 、ま た 、舗 道 で 活 を上 って 行 くの で あ る。 発 に強 打 して 、彼 は ドア ま で 行 きま した。 (村岡花 子 訳 『赤 毛 の ア ン』) c.英 日翻 訳 ソフ ト (5a)で は 、 下 線 部 で 示 した よ うに"returned"と こ こ に 、 マ シ ュー ・クス バ ー トが 、平 穏 に穴 に "went"の 二 つ の移 動 動詞 が 使 わ れ て い る 。 関 して 、お よび 丘 を 上へ 運 転 して い き ま した。 訳 家 の 日本 語 訳(5b)で と こ ろが 、 翻 は移 動 動 詞 は一 つ も出 現 しない 。 「 質 屋 」 と 「ドア 」 の二 つ の場 所 表 現 が シ ャ ー ロ ッ ク ・ホ (4)で は下 線 で 示 した よ うに(4a)の"over"と"up" は それ ぞれ 翻 訳 家 に よ り(4b)で ー ム ズ が これ らの 場 所 に移 動 した こ と を暗 示 的 に 示 唆 し 「 抜けて」、 「 上 って 」 て い るだ け で あ る。 一 文 ず つ 入 力 文 を直 訳 す る こ とが 中 と動 詞 を使 っ て 日本 語 に訳 され て い る。 そ の 結 果 、 英 語 心 め既 存 の 翻 訳 ソ フ トに は こ の よ うな 翻 訳 家 の離 れ技 は の原 文 は 単 文 だ が 、 翻 訳 家 に よ る 日本 語 訳 の 文 構 造 は接 無 理 の よ うで あ る。 翻 訳 ソフ トの 出 力(5c)で 続 助詞 「 て 」 に よ る重 文 とな っ て い る。 この よ うに、 英 は、原文 (5a)の 下線 部 の動 詞 を 日本 語 動 詞 に 「 直 訳 」 して い る。 語 で は前 置詞 そ の 他 の不 変 化 詞 を 用 い た 単 文 構 造 で 表 現 され る もの が 、 対 応 す る 日本 語訳 で は 「 て」接続 による 4.お わ りに 以上、機械翻訳 か ら見 た 日本語 の特 徴 を、 日英機 械 重 文構 造 とな る こ と が非 常 に 多 い 。 と こ ろが 、(4c)の 下 線 部 か らわ か る よ うに 、既 存 の英 日翻 訳 ソ フ トで は こ 翻訳 の処理 の流 れか ら、 また英 日翻訳 システ ムの ア ウ の よ うな英 日の 違 い は ま だ あ ま り考 慮 に 入 れ られ て い な トプ ッ トを翻訳 家 による 日本語訳 と比較 しなが ら、い い よ うで あ る。 くつか挙 げてみた。本稿 で指摘 した英 日両言 語の相違 点 を反映 させ ることによ り、機械翻 訳の質 が さ らに向 3.2レ トリック 上 す るこ とを願 ってい る。 さらに機 械翻 訳 システ ムに とっては困難 と思 われ るの が、英 日の レ トリックの違 いであ る。英語で は人物 の移 動 を移動動詞 を使 って明示 的に表現す るの に対 し、 日本 注 語 では移動動詞 をあま り用 いず代 わ りに人物 の移動経路 1)ト ランスフ ァー方式 の他 に、 中間言 語方式 と呼ばれ る方 式 も あ る。 著者紹介 2)本 小原京子:慶 応義塾大学理工二 学部専 任講師 稿 の例 で は 英 日/日;英翻 訳 ソフ ト 「The翻訳 プ ロ フ ェ ッ シ ョナ ルV6.0」(株 ク社)を 式 会 社東 芝 デ ジ タル メデ ィ アネ ッ トワ ー 主 に使 用 した 。 「 経歴 」東京大学 教養 学部教養 学科卒業 、 同大学新 聞 研 究所修了 、 目本 アイ ・ビー ・エ ム株 式会 社勤 務 を経 て 、 カ リフ ォル ニ ア 大 学 バ ー ク レー 校 言 語 学 博 士 参考文献 Ohara, K H (1999). `Cognitive and structural constraints on motion descripitions: Observations from Japanese and English.' Proceedings of the 2' International Conference on Cognitive Science and the 16' Annual Meeting of the Japanese Cognitive Science Society Joint Conference 994997. Tokyo, Japan. 池 原悟(1998).「 機 械翻訳」 『 岩波講 座言語の科学』第9巻 岩 波 書店. (Ph.D.)「 専 門」認知 言語学
© Copyright 2025 Paperzz