翻訳メモリー時代の終わりは来るか?

共有

翻訳メモリー(TM)が翻訳業界で広く使われ始めたのが1990年代後半という話(PDF)なので、すでに四半世紀くらいは経っている。私が翻訳者になったのは2002年だが、ITマニュアルなどではすでにTMを使った翻訳が一般的だった。

TMは当初、訳文を再利用して品質を安定させたり、作業を効率化してコストを削減したりといった点が目的だった。しかし統計的機械翻訳システム以降(もちろんニューラル機械翻訳も)は、トレーニング用のデータとしても重要となった。


TMが翻訳業界で広がったのは、やはりコスト削減などビジネス上のメリットが大きかったからだ。しかし、いち翻訳者が使うツールとして考えてみると、必ずしも理想的とは言えない。訳文を「再利用」するので、それに適した単位、つまり基本的には1文ずつの対訳セットで管理する。原文と訳文が1文ずつで対応するケースはもちろん多いが、再利用を優先すると無理やり1文ずつ対応付けなければならず、訳文だけで見た場合におかしな表現になってしまうことがある。「再利用性」と「表現」を天秤にかけて前者を優先する形である。

だが、このTMを土台にして翻訳ビジネスは成長して回るようになった。例えばTMとの「マッチ率」で割引し、顧客を獲得できるようになった。さらに、再利用が楽になるように用語ベースやスタイルチェッカーといったツールがTMと一緒に提供された。また、TMを補完する形で機械翻訳システムも接続されるようになった。ここ四半世紀の間に翻訳業界が成長した大きな要因の1つはTMであることに間違いはない。


しかし、果たして今後もTMが同等の重要性を持つのかと疑問を感じる出来事もある。生成AIに用いられる大規模言語モデル(LLM)の登場である。

GPT-4登場直後の記事にも少し書いたが、翻訳の質としてはニューラル機械翻訳のDeepLやGoogle翻訳と印象的に大きな違いはない。しかし、GPT-4は(恐らく)対訳データで翻訳のトレーニングをしているわけではない。要するに、対訳の形式でデータがなくても機械翻訳の機能は実現できるのである。

先ほど、TMはトレーニング用のデータとしても重要になったと書いた。もし今後、機械翻訳の実現で対訳データの必要性が低くなるならば、TMに対訳を蓄積しようとする動機が弱くなるかもしれない。そうなると翻訳ビジネスでTMの利用が減ることも考えられる。もちろんすぐになくなることはないだろうが、「TMが大前提」という状況自体は変わる。

ここ四半世紀は、TMが翻訳ビジネスで中心的な役割を果たしてきた。TMのおかげで業界は顧客を獲得して成長できたし、逆にTMの「基本的に1文で管理」という制約によって、翻訳者は創造的な仕事ができない場面もあった。TMが前提でなくなるならば、まさに昔TMが登場してきたように、新しいツールが登場して翻訳の仕事は変わるかもしれない。


ただ結局のところ、人間がする仕事は何であるかといった根本的な問い直しは常にし続けなければならない。とりわけAIがどのように進化するか想像できないので、10年先まで安泰と思っていた仕事が突如消失する可能性はある。例えば最近はテキストに加えて画像や映像などを処理できるマルチモーダルAIも普及してきており、翻訳でも使われるだろう。一例を挙げると、アプリ画面に「Language:」といったUIラベルが見えれば、「Japanese」は「日本人」ではなく「日本語」と訳すのが適切だ。単にテキストだけで訳すと「日本人」としてもおかしくない。従来は人がテキスト外部の文脈を目で見て確認する必要があったが、今後少なくとも一部はマルチモーダルAIで対応できる。

そういった大きな変化が目の前で起こっていることは間違いなく、面白くもあるが目まぐるしくて疲れそうだ。


共有