自治体窓口を変えるAIチャットボット導入プロジェクトの舞台裏

イントロダクション:住民サービスの現場に潜むボトルネック
市民課や税務課などの窓口には、毎日「書類の書き方を教えてほしい」「手続きの進捗を確認したい」といった定型的な質問が押し寄せます。人口10万人規模の市役所でさえ、問い合わせ件数は月5万件を超え、繁忙期は電話も窓口もパンク寸前です。慢性的な人員不足を埋めるために派遣職員を追加すると年間数千万円のコストが発生し、しかも経験知が蓄積されにくいため応対品質がばらつきます。
そこで注目を浴びているのが、24時間稼働かつ学習可能な「AIチャットボット」です。本稿では、実際に県内中核市が採用したチャットボットシステムの開発プロジェクトをケーススタディに、要件定義から運用までのプロセスを解説します。システム開発会社へ外部発注する際の相見積もりポイントや費用相場も併せて紹介するので、発注担当者の方はぜひ参考にしてください。
ユースケース概要:FAQ窓口をAIが肩代わりする業務フロー
導入対象となったのは「各種証明書の発行手続き」「ごみ分別ルール」「子育て支援制度」など、問い合わせが多い12業務です。チャネルは3系統──公式Webサイト上のチャットUI、LINE公式アカウント、庁舎内に設置したタッチパネル端末。市民は自然言語で質問を入力し、チャットボットがFAQを提示。解決しない場合のみオペレータにエスカレーションする二段構えになっています。
ユースケースを整理する際、担当課ごとに「年間問い合わせ件数」「回答テンプレートの有無」「条例改訂頻度」をスプレッドシートで可視化しました。件数が多くテンプレが存在し、法改正が少ない領域から順に自動化することで、初期コストを抑えつつ効果を最大化しています。また、市民のITリテラシー格差に配慮し、キーワード候補をボタン表示するUIを採用。これにより入力負荷を下げ、高齢者でも完了率を95%まで押し上げることに成功しました。
技術アーキテクチャ:クラウドとオンプレをつなぐハイブリッド構成
システムは大きく「チャネル連携API」「NLUエンジン」「FAQナレッジベース」「庁内業務システム連携」の4層に分かれます。チャットUIはVue.js、LINEチャネルはMessaging APIを利用し、いずれもAPI Gateway経由でNLUエンジンへリクエストを送信。
NLUエンジンにはBERTベースの日本語モデルを採用し、FAQナレッジはElasticsearchでインデックス化。推論レイテンシを抑えるため、NLUと検索処理はAWS LambdaではなくFargate常駐コンテナとしてデプロイしました。オンプレ側に残る住民情報システムとの連携は、庁内VPNを介したRESTプロキシを実装し、個人情報をクラウドに置かないセキュリティポリシーを遵守。
スケーリングは問い合わせ件数の季節変動を考慮し、Fargateのオートスケールを「CPU30%・リクエスト数200/分」の閾値で設定。夜間はミニマム1タスクで稼働しコストを抑制しています。
データ収集とモデルトレーニング:住民の声を学習資源に変える
チャットログはCloudWatch Logsに保存し、PIIマスキング処理後にS3へ転送。週次でAmazon SageMaker Processingジョブを走らせ、意図分類器と質問応答検索の再学習を実施しています。新しい語彙や表記揺れが学習データに反映されることで、回答精度はローンチ直後の78%から6か月後には91%へ向上しました。
学習パイプライン設計で要となるのは「教師ラベルの確保」です。本プロジェクトでは、オペレータが手動対応したチャット履歴を自動でクラスタリングし、類似度が高いグループをFAQ候補として提案するツールを開発。各課担当者が5分のブラッシュアップを行えばナレッジベースに追加される仕組みを整備し、現場の負担を最小限に抑えました。
UI/UX検証:A/Bテストで高齢者の完了率を可視化
リリース前に最も神経を使ったのは、79歳の高齢者でも迷わず操作できるかというUI/UX検証でした。プロトタイプ段階で実施したゴリラテストでは、「検索窓に単語を入れるより、まず選択肢を眺めたい」という声が多数を占めました。そこで正式版では、トップ画面に「証明書を取りたい」「引越し手続き」「ごみカレンダー」といったカードUIを配置し、タップした後に自然文入力へ誘導する二段階導線へ変更。
A/BテストはGoogle OptimizeとMatomoを併用し、カードサイズ・色調・フォントサイズを3パターンで比較。高齢者を含むターゲット層1,200人のテスト結果では、完了率が パターンA:84% → パターンC:93% と大幅に向上しました。また、チャットボットの回答信頼性を高めるために、回答末尾へ根拠ページのURLと「くわしい手続きはこちら」という文言を自動付与。行政ドキュメントへ遷移したユーザーの再問い合わせ率が22%から8%まで減少したことから、回答納得度が定量的に裏付けられました。
品質保証とアクセシビリティ対応:JIS X 8341-3準拠の落とし穴
公共機関サイトはJIS X 8341-3:2016で示されるアクセシビリティ基準への適合が必須です。チャットUIの入力欄にもARIAラベルを付与し、スクリーンリーダーが「質問内容を入力してください」と読めるように配慮。さらに、時間制限操作が苦手なユーザー向けに セッションタイムアウトを15分→60分 に延長し、テキストを自動保存するローカルストレージ機能を実装しました。
品質保証工程では、WCAG 2.1 AA相当を担保するために自動・手動テストを実施。axe DevToolsによる自動チェックで187件のコントラストエラーを検出し、濃色テーマを追加。同時に常用漢字外の用語を可能な限り言い換え、読上げ難易度を下げる工夫を行いました。
運用開始後も住民からのフィードバック窓口をChatbot内に設置し、 「ルビをふってほしい」「英数字の読み上げが不自然」 といった声を週次で反映。結果、ローンチ3か月時点でBing Accessibility Insightsのスコアは94→100に到達しています。
費用試算と開発会社選定:SaaSライセンス vs. カスタム開発
AIチャットボット導入費用は、SaaS型かフルスクラッチ型かで大きく変動します。下記は本案件で実際に比較した各社見積の抜粋です(税別・概算)。
提案タイプ | 初期費用 | 年額保守 | 機能制限 | 備考 |
---|---|---|---|---|
SaaSパッケージA | 580万円 | 120万円 | NLU拡張不可 | マルチチャネル対応済 |
SaaSパッケージB | 430万円 | 180万円 | API連携制限 | CRM連携オプション別途 |
カスタム開発(本採択) | 1,120万円 | 160万円 | なし | FAQ自動生成ツール込み |
費用シミュレーションでは、5年間の総コストと労務削減効果を比較。窓口補助員3名分の人件費(年間1,350万円)を2年で回収できると試算できたことが決め手となり、カスタム開発案を採択しました。
発注プロセスでは「処理性能を実データで検証できるPoCを無償で実施」「ソースコードの著作権譲渡」などを必須要件とし、6社から4社へ絞り込んで入札。質疑応答のレスポンスタイムと提案書のドキュメント品質を評価軸に加えることで、最終的にUI/UXデザイン力が高いシステム開発会社を選定できました。
プロジェクト管理:スクラム×ガントのハイブリッド運営
行政案件ではガバナンス上、成果物納品日が厳格に決まっています。その一方でAIモデル開発は反復的なチューニングが不可欠──そこで本プロジェクトでは スクラム開発(2週間スプリント) と ウォーターフォールのマイルストーン を併用しました。
-
スプリント0:ペルソナ策定/PoC準備
-
スプリント1〜6:UI/UX・NLU・FAQ検索の並行実装
-
マイルストーン1(第3スプリント終了):β版納品・受入試験
-
マイルストーン2(第6スプリント終了):正式版納品・本番環境デプロイ
タスク管理にはBacklog、リスク管理にはRedmineを採用し、「市担当者の承認待ちボトルネックを可視化」するカンバンを設定。承認遅延が警告閾値(48h)を超えると自動でSlack連絡が飛ぶ仕組みを構築したことで、平均承認リードタイムが72h→18hに短縮しました。
KPIとROI:定量指標で見る導入効果
運用開始から8か月、以下の成果が得られています。
指標 | 導入前 | 導入後 | 改善率 |
---|---|---|---|
月間問い合わせ件数 | 51,400 | 57,900 | +12.6%*注1 |
オペレータ対応率 | 100% | 28% | -72% |
一次回答満足度(★4以上) | 68% | 90% | +22pt |
年間人件費 | 4,050万円 | 2,700万円 | -33% |
*注1:問い合わせ件数が増加したのは、24時間チャネル解放により潜在需要が顕在化したため。オペレータ負荷は大幅に低減しており、シフト2名を他業務へ転換できました。
投資回収シミュレーションでは、純労務削減効果のみで3.2年で黒字化。さらに窓口待ち時間短縮による市民満足度向上は、別途アンケートで92%が「以前より便利になった」と回答しており、定性的効果も大きいと言えます。
障害対応とセキュリティ:予算内でのBCP設計
ローンチ直後、チャットサーバのENI設定ミスによりVPN経路が輻輳し、夜間帯で応答遅延2,500ms が発生しました。仮想ルータへQoS設定を施し、庁内業務システム連携APIの優先度を上げることで解決。
セキュリティ面では、IP制限とWAFに加え、BERTモデル推論時に機微情報を推論レスポンスに含めない サニタイズ処理をLambda@Edgeで実装。JPCERT/CCの脆弱性カレンダーをCronでクロールし、依存ライブラリのCVSSスコアが7.0以上の場合は自動でIssueを生成するジョブを走らせています。
将来展望:マルチモーダルAIとRAG統合
今後のロードマップでは、音声入力とOCRを統合したマルチモーダルAI を検証中です。具体的には、窓口に来庁した高齢者が申請書をスマホ撮影→OCR→RAG(Retrieval-Augmented Generation)で不足項目を対話形式で案内する構想。これにより「書類のどこを書けば良いかわからない」という課題を解消し、来庁回数の削減を目指します。
また、自治体間でFAQナレッジを共有するリージョナルAIプラットフォーム計画も進行中。同県内4市と共同でAPIスキーマを統一し、FAQの相互流通を可能にすることで、学習データのボリュームと多様性を飛躍的に向上させる狙いです。
まとめ:行政DXの本質は「住民体験の総コスト最適化」
AIチャットボットは単なる問い合わせ自動化ツールではなく、住民体験向上とコスト最適化を同時に実現する行政DXの切り札です。本ケーススタディが示す通り、技術選定・アクセシビリティ・費用対効果を総合的に設計すれば、人口規模や予算の限界を乗り越えて大きな成果を生み出せます。
これから発注を検討する担当者は、相見積もり時に「PoCの実施可否」「FAQ更新ワークフロー」「学習パイプライン自動化」の3点を明確に要求すると同時に、実利用データでの性能検証を契約に盛り込むことを強く推奨します。行政サービスの未来は、あなたの発注書から始まります。