RAG時代のテクニカルライティング

共有

2023年前半、ChatGPTを中心に生成AI関連のニュースが連日取り上げられた。しかし、あたかも本当であるかのように嘘を言う(ハルシーネーション)のが欠点だとも知られた。最近は当時ほどはニュースになっていないため、今も「生成AI=嘘つき」という認識を持っている人は多いかもしれない。しかしハルシーネーションの悪影響を軽減する努力は続いている。

代表的なのが「RAG」で、検索(Retrieval)で拡張(Augmented)された生成(Generation)のことだ。生成AIがすでに学習した情報だけでなく、外部情報を検索し、それに基づいて生成する仕組みである。例えば、社内規則や手続きのファイルを事実が書かれた外部情報として用意しておく。社員が社内ルールについて尋ねたらそれを調べて事実に基づき回答するため、虚偽を教える危険性を減らせる。

生成AIの弱点は嘘をつく点であるが、ある意味、しゃべるのは上手な「口達者」とも捉えられる。事実をしっかり教えることができれば、口達者というのは強みになる。ユーザーとの会話自体はスムーズに進む。


例えばソフトウェア企業がRAGをどこかで活用できないかと考えたとき、すぐに思い浮かぶのがヘルプやマニュアルのQ&Aシステムだろう。ユーザーが何かの操作手順を知りたいとマニュアルを見ても、記事の分量が多いとなかなか求めている情報にたどり着けない。そこでマニュアル記事を外部情報として用意しておき、ユーザーがチャットボット(中身は生成AI)に質問したら、外部情報を検索して事実に基づき回答するようにしておく。ユーザーからすると、自分で読んで必要な情報を見つけ出す負担は軽くなる。

今後、ヘルプやマニュアルを補完(場合によっては代替)する、こうしたQ&Aチャットボットの活用は広まると思われる。


従来からマニュアルを書くのは「テクニカルライター」の仕事だった。実は私も昔、英文テクニカルライターという肩書きでハードウェアやソフトウェアのマニュアルを書いていたことがある。そのとき、テクニカルライティングでは「3C」や「6C」などの「C」が重要だと学んだ。3CだとClear(明快)、Concise(簡潔)、Correct(正確)あたりがよく挙げられるが、他にもConsistent(一貫)、Complete(完全)、Coordinated(調和)などが挙げられることもある。このようにテクニカルライティングでは「C」が重要なのだが、今後RAGの時代が来るとしたらCの重要性に変化はあるのだろうか?

制作するドキュメントがRAGの検索対象になるのであれば、ドキュメントは“事実の源泉”となる。AIが生成に使う根拠となるため、まず情報の中身が「正確」である点は一層重要になる。また、RAGによるQ&Aチャットボットの場合、ユーザーが最終的に読むのはAIによる生成テキストである。そう考えると、ライティングする時点ではそれほど「簡潔」でなくてもよいかもしれない。むしろ情報をしっかり盛り込むくらいの方がAIとしては生成時に助かる可能性はある。

従来、テクニカルライターが書いたものは、直接そのまま読者(ユーザー)が読んでいた。しかしRAGによる生成結果が読まれるなら、ライターにとってユーザーは「二次読者」である。これからは二次読者を想定しつつ、“事実の源泉”となるドキュメントを書くのも仕事の一部になるのかもしれない。


共有