「Generative AI for Everyone」とタスク分析

共有

今度生成AIについて人に説明する機会があり、技術面や社会面も含めてバランスよく全体像を把握できる資料はないかと探していた。ウェブだとニュースや単発記事が大部分だし、日本語書籍だと技術解説やプロンプト紹介のような内容が多い印象だ。MOOCにないかと探したら、著名なAndrew Ng氏が解説している「Generative AI for Everyone」が求めているものに近かった。

実際に聴講したところ非常に良かったため、シラバスに沿って講義要点をまとめた上で、重要だと感じた「タスク分析」について考えたい。

本記事を読んで面白そうだと思われたら受講もお勧めする。ビデオ視聴自体は無料(修了証が必要なら有料)である。動画は合計で2〜3時間程度で、自動翻訳だが日本語の字幕を表示できる。


目次


講義要点

第1週:生成AI入門

レッスン1:生成AIとは?

  • 生成AIとは、テキスト、画像、音声のようなコンテンツを生成できるAIシステムのこと
    • すでにさまざまな場面で使われている。例えばウェブ検索、カードの不正利用検知、レコメンドシステムなど
  • 生成AIに用いられるLLM(Large Language Model)は、教師あり学習を使い、次に出現する単語を繰り返し予測するよう構築。例:
    • 1. My favorite food is a → 次に「bagel」を予想
    • 2. My favorite food is a bagel → 次に「with」を予想
    • 3. My favorite food is a bagel with → 次に「cream」を予測
    • 4. My favorite food is a bagel with cream → 次に「cheese」を予測

レッスン2:生成AIの適用場面

  • AIは汎用技術で、LLMはさまざまなタスクをこなせる。例:
    • ライティング
      • 製品名の候補を挙げる/プレスリリースを書く/翻訳
    • リーディング
      • 校正/記事を要約/コールセンターのやり取りを要約/顧客からのメールを分析
    • チャットボット
      • 顧客サービスに使う場合、いくつか種類が考えられる:
        • 人間のみ/チャットボットが人間をサポート(human-in-the-loop)/チャットボットが依頼を振り分け(トリアージ)/チャットボットのみ
      • チャットボットを提供する際のアドバイス
        • まずは社内向けで始め、human-in-the-loopでミスがないか確認。十分に安全だと思われるようになったら、顧客と直接会話させる
  • LLMの弱点
    • LLMが持つ知識はトレーニング時点のもの
    • ハルシーネーション(でっち上げ)を起こす
    • 入出力の長さ(コンテキスト長)に上限
    • 構造化データ(表など)をうまく扱えない
    • バイアスや有害情報生成
  • プロンプトのコツ
    • 詳細かつ具体的に。コンテキスト情報もやらせたいタスクも
    • 回答を生成するまでの思考ステップを指示
    • 「プロンプト↔回答」の試行錯誤を繰り返す

第2週:生成AIのプロジェクト

レッスン1:ソフトウェア

  • 教師あり学習を使ったアプリの構築には時間がかかるが、プロンプトベースのAIなら短時間でデプロイ可
  • 生成AIプロジェクトのライフサイクル:
    • 1. プロジェクトのスコープを決める
    • 2. システムを構築/改善
    • 3. 組織内で評価
    • 4. 手順2〜3を繰り返し、デプロイして監視。その後も2〜4を繰り返す
  • パフォーマンスを改善するツール:
    • プロンプト
      • 「アイデア→プロンプト→LLMの応答→アイデア…」の繰り返し
    • RAG:LLMに外部データにアクセスさせる仕組み
    • ファインチューニング:自分のタスクに合わせたLLM
    • プリトレーニング:一からLLMを作成

レッスン2:プロンプトを超えた高度な技術

  • RAG(Retrieval Augmented Generation)
    • ウェブサイトや社内資料などを検索させてコンテキスト情報とし、それに基づいてLLMに回答させる
  • ファインチューニング
    • プリトレーニングに比べ、少数のサンプル →コストが安い
    • 目的:
      • プロンプトで与える情報だけでは難しいタスクを実行できるようにする
      • LLMに特定分野の知識を与える
  • プリトレーニング
    • かなりのコストがかかるので、最後の手段
  • エージェント
    • LLMを使い、複雑な流れのアクションを実行するアプリ。現在のAI研究の最前線

第3週:仕事と生活における生成AI

レッスン1:生成AIとビジネス

  • 用途の例
    • リライトなどライティング支援
      • マーケティング担当者、採用担当者、プログラマー
  • ★仕事におけるタスク分析が必要
    • 自動化できる部分を特定する
      • AIが自動化するのは仕事ではなく、タスクである
      • ほとんどの仕事は多数のタスクで構成される
    • 分析例:顧客サービス担当(※矢印は生成AIによる対応可能程度)
      • 顧客からの電話に出る → 低
      • チャットでの問い合わせに回答 → 高
      • 顧客注文のステータスを確認 → 中
      • 顧客とのやり取りを記録 → 高
      • 苦情の正確さを評価 → 低
      • ※講座内ではプログラマーや法律家なども分析
    • 拡張(augmentation)と自動化(automation)の違い
      • 拡張:人のタスクを支援
      • 自動化:タスクを自動で実行
    • AI利用の見込みを評価
      • 拡張と自動化の見込みは、技術的実施可能性とビジネス価値で判断
        • 技術的実施可能性:AIにそれができるか?
        • ビジネス価値:タスクを拡張または自動化するのにどのくらい価値があるか?
    • ある仕事に含まれるタスクを調べるにはO*NETが使える
    • 生成AIを使った場合と使わない場合のワークフローを比較して検討する
  • 生成AIソフトウェアを開発するチームのメンバー役割
    • 共通:ソフトウェア・エンジニア、機械学習エンジニア、プロダクト・マネージャー、プロンプト・エンジニア(?)
    • 追加:データ・エンジニア、データ・サイエンティスト、プロジェクト・マネージャー、機械学習リサーチャー
  • 生成AIの影響を受ける可能性がある分野
    • 高給の仕事により多くの影響がある
    • 職能:ソフトウェア・エンジニア、顧客対応など
    • 産業:教育、専門職(ビジネスや法律、理工)など

レッスン2:生成AIと社会

  • 生成AIの懸念点
    • 偏見などを増大させる
      • インターネット上のテキストで学習しているため
      • ただし人間からのフィードバックで改善する努力をしている
    • 仕事を奪う
      • かつてレントゲン技士はAIで仕事がなくなると言われたが、そうならなかった。タスク分析をすると、実際にAIが使えそうなのは一部タスク(レントゲン写真の解釈など)だけだった
      • 「AIはレントゲン技士に取って代わることはない。ただしAIを使わない技士は使う技士に換えられるだろう」(スタンフォード大Langlotz氏の言葉)
    • 人類滅亡(?)
      • 自動運転の事故、株価急落、裁判での不公正な判決…
      • 完全な制御を実現しなくても、安全性も価値も提供できる
        • 例:飛行機
        • むしろ気候変動やパンデミックなど真の危機にAIを活用できる
  • AGI(汎用人工知能)
    • 人間ができる知的タスクをすべてできるAIのこと
  • 責任あるAI(Responsible AI)
    • フェアである
      • バイアスを広めない
    • 透明である
      • AIやその判断が理解可能な形になっている
    • プライバシーを守る
      • ユーザーデータと機密を保護する
    • セキュリティーが高い
      • 攻撃からAIシステムを守る
    • 倫理的な利用ができる
      • 有益な用途にAIを使う

タスク分析

どれも有用な情報だったが、とりわけ第3週レッスン1のタスク分析(★の部分)が重要だと感じた。生成AIを活用するに当たっては、まずタスクの分析をすべきという点だ。ある仕事がどのようなタスク(下位項目)で構成されるかを分析し、具体的にどのタスクに生成AIを活用できそうかを見極める必要がある。

翻訳のタスク分析

そこで、自分がサイボウズ社内で「翻訳」という名前の下にやっているタスク項目をいくつか挙げ、その生成AIによる対応可能程度も簡単に見積もってみる。

  • 訳出作業
    • 低〜中
    • 単に言語間でテキストを書き換えているだけだと思われがちだが、実はかなり複雑なことをしている。例えば、文章内における文脈を見たり、UIなら表示位置を考慮したり、適切な用語やスタイルを選んだり、分野で常識的な表記を採用したり
  • 用語やスタイルのチェック
    • 中〜高
    • 用語集やスタイルガイドに掲載されているかのチェックなら得意そう
  • ウェブや書籍などの資料を使った事実調査
    • 低〜高
    • 電子化され手元にある資料なら検索対象にできるが、紙資料は不可
  • 原文ライターやデザイナーへ表現や意図の確認
  • 開発者へ技術内容の確認

生成AIが役立つとしたら、用語やスタイルのチェック、電子資料を対象にした調査あたりだろうか。訳出は(少なくとも自分が扱っているドキュメントでは)厳しいし、ライターや開発者に確認を取るといったことはまず不可能である。

上記は「翻訳」のタスクだが、この周辺作業を担当することもある。用語やスタイルの方針決め、ガイドライン作成、翻訳メモリーの維持管理などである。少し考えただけでも、完全に生成AIには任せられるタスクはない。せいぜいガイドライン作成に当たってテンプレートを提案してもらうような補助的な使い方くらいだ。

このように自分のタスク分析をしてみると、生成AIを活用できる場面(あるいは代替されるタスク)は限定的だ。

AIに代替される?

第3週のレッスン2に、レントゲン技士はAIで仕事がなくなると言われたが、実際にはならなかった話が出てきた。実は翻訳者も以前からそう言われていた。2016年にGoogleがニューラルMTを採用したときもそうだし、2023年のChatGPTが登場したときもそうだった。

しかし上記のタスク分析を見てわかるように、AIによる全面的な代替は難しそうだ。それにもかかわらず“もうすぐ代替される”のような話が出てくるのは、結局のところ「翻訳」という仕事の中身がよく理解されていないということではないだろうか。“仕事がAIに代替される”ような話を聞いたときは、簡単にでもタスク分析くらいはしてみたい。


共有