■生成AI(ChatGPT)はどのように会話しているのか その2
前回のメルマガでは、生成AIの回答が適切でない場合がある2つのケースについて紹介しました。
1つ目は会話の文脈が共有されていない場合(生成AIの利用できるトークン数が少ないため会話履歴を渡せないケース)です。
この仕組みについて前回は解説しました。
2つ目は、質問者が求める回答を得られない場合です。
特に人間 なら暗黙のうちに理解できる「ローカルな情報」を含む質問に対して、
生成AIが適切な回答を出せないことがあります。
今回は、この仕組みについて解説します。
例えば「有給休暇を取得する手続き」を生成AIに質問したとします。
生成AIはWeb検索などから一般的な情報を提供できますが、あなたの会社特有のルールについては答えられません。
これは会社のルールが社内ドキュメントに記載されており、AIがアクセスできないためです。
そのためWeb検索のように情報を直接取得して利用することができないのです。
「それならば、事前に学習させればよいのでは?」と思うかもしれません。
しかし、これは容易ではありません。既存のAIモデル(GPT-4など)に新しいデータを追加し、
再調整することを「ファインチューニング」と いいます。
これはAI自体を再学習させる方法ですが、以下のような問題があります。
• コストがかかる
• 思い通りに学習させるのが難しく、試行錯誤が必要
• 従来の知識を維持しながら新しい情報を学習させることが難しく、誤った回答(ハルシネーション)を引き起こす可能性がある
そのため企業向けの生成AIシステムでは、ファインチューニングはほとんど行われません。
「企業の情報を学習させている」と説明されることがありますが、実際には別の方法を採用しています。
企業向けAIシステムがローカルな情報を扱える理由
企業向けのAIシステムがローカルな情報を活用できる理由として、
「RAG(Retrieval-Augmented Generation)」という仕組みがよく使われています。
RAGでは事前に参照用のドキュメントを検索システムに
登録しておきます。そして、生成AIへの質問があった際に、その検索システムを使って関連する情報を探します。
見つかった情報は生成AIへのAPIコール時に一緒に送信され、この内容をもとに回答が生成されます。
RAGの仕組みを本格的に構築することもできますが、
最近では「アシスタント」と呼ばれる機能が簡易的なRAGを内蔵しており、手軽に活用できるようになっています。
ここで紹介したのはRAGの基本的な仕組みですが、実際にはさまざまな技術が組み合わせられています。
生成AIの活用方法は日々進化しています。
我々のような ソリューション提供者は、目的に応じて最適な方法を選び、
コストを抑えながら性能を最大限に引き出す技術を常に追い続けることが求められています。
☎ 052-688-0521 株式会社マイクロリンク 営業部