利用者:McYata/機械翻訳を使わないで

ここでは、記事や重要な文書を機械翻訳で作成するのがいかに危険か紹介します。原文の文意を読み取るために個人的に使う場合は想定していません。自己責任でご自由にお使いください。

致命的な誤訳・読み飛ばし[編集]

2016年、機械翻訳はニューラル機械翻訳と呼ばれる新たな武器を手に入れました。ディープラーニングを用いて自己学習を重ねる仕組みは、従来の統計的機械翻訳より圧倒的に読みやすく、正確で、手軽な翻訳文出力を可能としました。しかし、逐語訳から脱した機械翻訳は、同時に、「正確な訳」よりも「自然に見える訳」を目指す側面が出始めました。つまり、訳すのが難しそうな、あるいは正確に訳すと一見不自然に見えるような文に出会った時、機械翻訳ツールはその部分を「愚直に正確に訳す」のではなく「存在しなかったことにする」ことがあるのです。その結果、訳文を見るとそれらしく見えるが、原文と照らし合わせると致命的な誤訳だらけという事態が頻発するようになりました。

Google翻訳[編集]

DeepL翻訳[編集]

DeepL翻訳は、現在広く知られている中では出力文が特に「正確」「読みやすい」とされているフリー機械翻訳です。しかし現時点でDeepL翻訳を使い(あるいは参考にして)Wikipedia上で翻訳記事を作るという試みは、悪夢しかもたらしません。

長々説明するより、実物を見てもらった方が良いでしょう。英語版に"en:Bread"という記事があります。もちろん日本語版における「パン」のことです。以下に、英語版の記事から冒頭一段落を引用します。

Bread is a staple food prepared from a dough of flour (usually wheat) and water, usually by baking. Throughout recorded history and around the world, it has been an important part of many cultures' diet. It is one of the oldest human-made foods, having been of significance since the dawn of agriculture, and plays an essential role in both religious rituals and secular culture.

en:Bread (2022年6月16日 (木) 22:15‎ UTC)よりコピー

さて読者の皆さん、何も考えずにこの引用文を丸ごとコピーし、DeepL翻訳に投げ込んでみてください。そしてまずは、日本語文を読んでみましょう。どこか「直すべき」と思える場所は見当たりましたか?もしあれば、そこを自分で修正して(ポストエディット)、自分なりに「機械翻訳を活用して作った訳文」を完成させてみてください。まあおそらくほとんどの人は「何も手を付けなくて良さそう」と思うでしょうが・・・。





では次に、翻訳元の英文をじっくり読んでみてください。自身が無い方は、下に拙訳(人力翻訳)を載せたので、そちらをどうぞ。

内容をさらに見る
パンは、穀物紛(たいていは小麦)と水を材料とし、たいていは焼いて作られる主食物である。有史以来、世界中の多くの食文化において重要な役割を果たしてきた。人間が作った食べ物の中でも特に古いものの一つで、農業の黎明期から重要な意義を持ち、宗教儀式でも世俗文化でも不可欠な役割を果たしている。








お気づきでしょうか?DeepL翻訳文は"It is one of the oldest human-made foods, having been of significance since the dawn of agriculture,"にあたる訳文が存在しないことに。そしてライ麦パン米粉パンなどがパンではないかのような記述にすり替わっていることに。

"having been of significance"という部分は人間でも訳し方に悩むところで、私も少し意訳せざるを得ませんでした。しかしDeepL機械翻訳は、「訳すと訳文が不自然になってしまうから」と思ったからかどうか知りませんが存在自体を無視、抹消するのです。しかもその前の部分も巻き込んで。

また"flour (usually wheat)"という部分はどうでしょうか。たしかに、一般的にはflour(フラワー)は「小麦粉」、"wheat"(ウィート)は「小麦」を意味します。だからDeepL翻訳は「重言になってるけど、要するに小麦のことを言いたいんでしょ?」と勝手に気を利かせて"flour (usually wheat)"を「小麦」と訳してしまうのです。しかしまともに考えれば、このような馬鹿な話はありません。例えflourとwheatどちらも「小麦」という訳しか知らない人が読んだとしても、「じゃあなぜわざわざ括弧書きで書き分けているんだ?」と疑問を持ち、調べるくらいのことはするでしょう。種明かしをすると、flourはライ麦粉や米粉などを含む「穀物紛」全体を意味する単語なのです。たまたま小麦を指すことが多いから実質「小麦」と同義とされる場合が多いというだけのこと。ですから"flour (usually wheat)"は書いてある通り「穀物紛(たいていは小麦)」と書くのが適切なのです。

ちなみにGoogle翻訳に聞いてみると「小麦粉(通常は小麦)」という文を出力します。一目でおかしいと気づける訳語ですが、この場合はむしろ「おかしいと気づける文」を出力する方が重要です。後から人間がおかしい部分に気づき、修正できるからです。しかしDeepL翻訳はどうでしょうか。先ほど日本語文だけを読んだとき、「文が省略されている!」と気づけた方はいましたか?おそらく不可能でしょう。DeepL翻訳は訳せた部分だけ集めて取り繕い、自然な文章を創作してしまうのですから。


このように、DeepL翻訳を記事翻訳に使えるようになってしまえば、もはやポストエディットしても役に立ちません。もしこれを許容してしまえば、数クリックで作り上げられた膨大な数の「読みやすい誤訳記事」があふれかえり、Wikipediaの信頼は地に落ちるでしょう。