本事件の総括をこちらのページに掲載しています(2022-09-27)
以前書いた記事の続編となる。簡単にまとめると、AAMT(アジア太平洋機械翻訳協会)が2022年9月1日に「MTユーザーガイド」を公開したが、第2章に「JTF翻訳品質評価ガイドライン」から丸写ししたと思われる部分がいくつかあり、著作権侵害またはライセンス違反を私が指摘したという流れになる。今回はそこからの続きである。
予め断っておくと、私はAAMTに悪感情はない。関係者に知り合いも多いし、2016年には招待講演にも呼んでもらった。だが、さすがに対応がひどすぎるので続編を書くことにした。
目次
しれっとファイルを差し替え
9月15日付で、MTユーザーガイドのバージョン1.1が公開されていた(PDFファイル)。
私が見つけたのは9月16日の朝である。ウェブページ上でPDFファイルのURLを見たら「…v1-1.pdf」に変わっており、それで新バージョンが公開されていることに気づいた。AAMTのウェブサイト上やTwitterアカウント上で通知があったわけではない。
要するに、何のアナウンスもせず、しれっとファイルを差し替えたのだ。
AAMTの甘い認識と対応
以前の記事でした私の指摘は、AAMT側にはすぐに伝わっていたようである。つまり9月2日くらいにはすでに著作権侵害の事実を認識していたはずである。ところが、少なくとも9月15日朝には、問題のあるバージョン1.0はAAMTウェブサイト上に残っていた。著作権侵害を認識しながら、約2週間も放置して公開していたことになる。ウェブ上のファイルを非公開にするだけならほとんどコストはかからないのにである。
さらに上記の通り、差し替えたことに関する公式アナウンスもない。バージョン1.0が公開されたときはしっかり宣伝していたため、1.0を持っている人は多いし、今後も保持し続ける人はいるだろう。
著作権侵害を認識しながら、こんな対応でよいのだろうか? 著作権侵害はたびたびニュースになっている。ここ1週間くらいに限っても、例えばこんなニュースがあった。
テレビ局は、著作権侵害の恐れを認識した時点で放送や配信を取りやめている。また大学は、論文を盗用した教員を懲戒処分(本人は退職)したことを公表している。
この辺りが世間で一般的な対応ではないだろうか。著作権侵害があると認識したら即座に公開を停止すべきであるし、その事実はきちんと説明すべきである。著作権侵害を知りながら公開し続けた後、しれっとファイルを差し替えて「なかったこと」にする対応はちょっと考えられない。誤字脱字の指摘を受けて修正するのとは訳が違う。著作権侵害に対するAAMTの認識と対応の甘さには驚かざるを得ない。
(今回対応が甘いのは、JTF会長がAAMT副会長であり、AAMT会長がJTF理事でもある背景もあるのではないか。組織間の馴れ合いを感じてしまう)
また、ファイル内には改訂履歴も記載されているが、何を変更したのかの記載はない(下記写真)。
完全コピーに変わっていた
ここまで著作権侵害へのAAMT側の対応について書いた。
では、バージョン1.1で著作権侵害やライセンス違反がなくなったのだろうか? 以前私の記事で指摘した3点はクリアされ、CC BY 4.0ライセンスに準拠するようになった。そのため、著作権侵害についての問題は解消された。しかし、今度はまた別の種類の疑問点が発生していた。
前回の記事では、主に例(サンプル)に丸写しがあると指摘した。指摘を受けたならば、執筆者が頑張って例を考案するものと思っていた。仮にもこの分野の専門家であるならば、自力で作れるはずだ。
修正内容を見て、またもや驚愕した。なんと第2章で、定義や例がJTF翻訳品質評価ガイドラインの完全コピーに変わっていたのである。自分で考えて書くのではなく、ライセンス条件を満たした上で完全コピーしたのだ。
どの程度をコピーが占めるのか確認するために、コピー部分を黄色でハイライトした画像にまとめてみた。バージョン1.1の第2章の11〜14ページである。
大まかに半分程度は完全コピーである。ただし付け加えておくが、上記の通りライセンス的には全く問題ない。CC BY 4.0では丸写しもOKである。
疑問を覚えるのはこの点ではなく、著作権上問題なかった部分すら削除し、お手軽にコピーで済ませる姿勢だ。完全コピーで置き換えられるなら、バージョン1.0にあった記述はいったい何だったのか? 確かに一部に丸写しはあったものの、オリジナルで書かれた部分は多かった。それを丸々コピーに置き換えるとは、何と言うか、信念みたいなものはないのか!
実はコピーも中途半端
だがそのコピーも、実のところ中途半端である。
以前の記事で、MTユーザーガイドのエラー項目は4つであるのに対し、JTF翻訳品質評価ガイドラインのエラー項目は7つである点にも触れた。ところが、上記のようにバージョン1.1でJTF翻訳品質評価ガイドラインを完全コピーしているにもかかわらず、エラー項目数は4つのままなのだ。
JTF翻訳品質評価ガイドラインで7つ設けているのは、利用が広まっている「MQM」という評価フレームワークを踏襲しているからだ。MQMの意義については別の記事に詳しく書いたが、将来ISO 5060のエラー項目になると考えられている。つまり7つの項目は国際規格になるはずであり、もし翻訳品質評価を紹介するのであれば、7つをしっかりと取り上げることが望ましいと私は考える。JTF翻訳品質評価ガイドラインをコピーするなら、自分に都合の良いところだけを切り貼りするのではなく、しっかりとその意図や意味についても考えてほしかった。
そもそもMTユーザーガイド委員長の山田氏はISOの会議に出ているのだから、動向は知っているはずである。知っているにもかかわらず、なぜ国際規格となりそうな7つではなく4つだけに絞るのか? 確かに、機械翻訳分野では「正確さ」と「流暢さ」の2つが使われてはきた。だがそれに「用語」と「スタイル」の2つだけを追加する根拠は何なのか? 「国際規格に則る」以上の合理性やメリットがあるのなら、”なんとなく4つ”ではなく、はっきり根拠を示すべきだろう。それが専門家としての責務だと思う。
(なお、私は6月のJTF理事退任とともにISO関連からは一切手を引いた。今後私からISO関連の最新情報は出ない)
ユーザーに対する誠意もない
AAMTはこのまま対応を終わらせるつもりなのだろうか?
上記の通り、著作権侵害を認識していながら2週間も公開し続け、結局黙ってファイルを差し替えた。バージョン更新について何もアナウンスもせず、改訂履歴にも説明がない。アナウンスがなければ、著作権侵害のあるバージョン1.0を入手したユーザーはずっと使い続けるだろう。また、どのような理由でどこが変わったか分からなければ、1.1を入手したユーザーも困惑するだけである。完全コピーの結果、第2章は1.0から大幅に変わっているからだ。要するに、ユーザーに対する誠意も見られないのだ。
AAMTは著作権侵害があったことを公式に認めてアナウンスした上で、第2章を撤回してゼロベースで書き直したらどうか。その場しのぎの対応を重ねていては、業界内外からの信頼を失うだけだと感じる。