• テクノロジー
  • 技術解説
  • 技術検証

人事担当が社内チャットボットの構築を手伝ってみた【トゥモローネット 技術ブログ】

はじめに

日々業務をしていると、社員から様々な問い合わせや連絡がきます。
社内マニュアルは整備しているものの、知りたい内容がどこに載っているか分からない・活用されていないという課題がありました。
「人事でもAI導入はできるのか?」
今回はそんな思い付きから、技術担当者と協力して“社内マニュアル専用のチャットボット”をDify(※)で構築してみました。

AIを活用したいけど何から始めればいいかわからない方や、非エンジニア視点のDX事例を探している方の参考になれば幸いです。

※Difyとは
チャットボットを簡単に作れるオープンソースのツール。
専用の管理画面からマニュアルを登録したり、AIにどんな回答をさせたいかを細かく調整したりできる。
ノーコードで設定できる部分も多く、エンジニアでなくても使いやすいのが特徴。

プロジェクト概要

今回のプロジェクトでは、Difyを使って社内専用のチャットボットを構築しました。
社内規程・マニュアルは外部に公開されないよう、完全にクローズドな環境を前提としています。
技術的な部分は専門職の社員、実用的な部分は人事がメインで担当しました。

社員が入力した質問に対して、正確な回答が返ってくれば、今回のプロジェクトは成功です。

チャットボットの仕組み

どのような仕組みでチャットボットが回答を返してくれるの?というところを簡単に説明します。

  1. チャットボットに質問を入力
  2. 質問の内容を認識して、関連する社内文書を検索
  3. 検索結果をもとに、AIが最適な回答を作成して返信
チャットボットイメージ図

環境の準備

まずは、インターネット上に社内文書が公開されない環境を整えるところからスタートします。
サーバーはオンプレミス(※)で使用します。サーバーの基盤構築、コンテナ作成、Difyの接続設定は技術担当者にお任せしました。
詳細はこちらをご確認ください。

※オンプレミスとは
自社でサーバーやネットワーク機器などのITインフラを所有・運用する形態のこと。
クラウドサービスはインターネット上にデータを管理することになるため、情報漏洩のリスクがゼロではない。

マニュアルの選定

ここでようやく人事の担当が回ってきました。
Difyにマニュアルを登録するのですが、何でもかんでも登録してしまうと、回答の基となる情報が過多になり、誤回答に繋がる可能性があります。
そのため、社内ツールの操作方法などの問い合わせが多い内容を中心に必要なマニュアルを厳選しました。

ここで問題発生です。
社員向けに公開している規程・マニュアルはPDF形式ですが、文章がテキストとして認識されません。何が問題なのか…。

調べてみると、チャットボットの仕組み2の『質問の内容を認識して、関連する社内文書を検索』がうまくいっていないようで、ここで社内文書を検索する際に、PDFなどのそもそも文字として登録されていないものは検索対象外になっていました。


これを解決するため、文字として認識される形でPDF化します。

  • 原本のファイルを開く→[ファイル]→[名前を付けて保存]→PDF形式を選択
  • [オプション]→「フォントの埋め込みが不可能な場合は、テキストをビットマップに変換する」にチェック→保存

こうして登録すると、無事に文字が認識されました。

AIモデルとプロンプト調整

この段階で質問を送ると、チャットボットがインターネット上に載っている一般的な情報を勝手に補って回答してしまうという課題がありました。
そこで社内マニュアルだけを参照し、不要な情報は回答に含めないよう指示するプロンプト(※)を設定しました。

AIモデルはサーバーの制約から、10b以下で比較的日本語に強い「qwen2.5:7b」を選択しています。

※プロンプトとは
AIモデルにどんな役割・返答をしてほしいかを指示する文章

テスト

想定される質問と期待する回答、29個を仕様書にまとめ、精度を検証しました。

  • 「時間外労働の申請方法を教えてください」
  • 「銀行口座を変更したいです」
  • 「出張に該当するケースを知りたいです」

その結果、正しい回答は全体の約15個、正しいものの情報が不足している回答は約6個、誤回答や一般的な回答は8個でした。
現時点では実用化は難しいことが判明しましたが、改善点も明らかになりました。

最適な設定を提案

正答率が低い理由は大きく2点が考えられます。

①AIモデル

「qwen2.5:7b」は軽量モデルである分、回答精度に限界があります。
参考までに、下図はパラメーター数の比較です。

パラメーター数≒賢さ(回答精度の高さ)とされていますが、
少ないパラメーター数でも日本語に特化しているものもあれば、特定の分野に特化して精度を上げるモデルもあります。

②マニュアルの構造

画像主体で文字情報の少ないマニュアルが多くありました。
画像は認識されないため、回答の基データが少なくなっていることが考えられます。

また、マニュアルのページ送りが最適ではなく、思うようにチャンク(※)の取得ができていないものもありました。
残念ながら、AIモデルはすぐに解決できる問題ではありませんが、少しでも回答率を上げるために、チャンクの設定を工夫してみることにしました。
チャンクの設定を親子、インデックス方法を高品質で登録します。

「チャンク」に親子の関係を持たせることができます。
親チャンク:マニュアルや文書そのもの
子チャンク:親チャンクを、数行〜数百文字の短い文章に小分けにしたもの
子チャンクを対象にキーワード検索が行われ、該当する単語が少しでも含まれていれば、その子チャンクが属する親チャンク(=マニュアルの全文)を丸ごと参照対象として渡す仕組みです。
この設定により、検索のヒット率を上げつつ、文脈のつながった情報をAIに渡すことができます。

チャンクの設定により、誤回答から正しい回答を返してくれるようになったものもありました。

※チャンクとは
AIが扱いやすいように文章を数百文字ずつに分割する処理

まとめ

今回のチャットボット構築は、ブログの執筆時点では実用化に至っていないものの、社内マニュアルの改善が必要であることや、AI活用の可能性が明確になったことなど成果も多くありました。
非エンジニアの立場からでも、チームで協力すればここまでできるという実感が得られたのは、大きな学びでした。

トゥモロー・ネットでは、今回紹介した社内チャットボットの構築にも活用したAI基盤や、GPUサーバーの導入支援も行っています。
ご興味がある方は、ぜひお問い合わせください。

お問合せ先

関連ページ

失敗しないAI基盤構築|オンプレミス vs クラウド?最適なアーキテクチャ設計と実践ステップ
生成AIはどんなサービスに活用されている?代表的な事例を紹介
ローカルLLMとRAGを構築してみた【ローカルAI基盤】

この記事を書いた人

株式会社トゥモロー・ネット

トゥモロー・ネットは「ITをもとに楽しい未来へつなごう」という経営理念のもと、感動や喜びのある、より良い社会へと導く企業を目指し、最先端のテクノロジーとサステナブルなインフラを提供しています。設立以来培ってきたハードウェア・ソフトウェア製造・販売、運用、保守などインフラに関わる豊富な実績と近年注力するAIサービスのコンサルティング、開発、運用、サポートにより、国内システムインテグレーション市場においてユニークなポジションを確立しています。
インフラからAIサービスまで包括的に提供することで、システム全体の柔軟性、ユーザビリティ、コストの最適化、パフォーマンス向上など、お客様の細かなニーズに沿った提案を行っています。

製品に関するお問い合わせはこちら