2025.8.7技術トレンド／展望

AIエージェントで業務プロセス全体を効率化! Smart AI Agentのコア技術を解説

現在、人口減少による労働力不足やIT人材の不足が課題となっており、これらの解決策として生成AIの活用が期待されている。具体的な活用例としては、チャットボットによるカスタマーサポートやコンテンツ生成によるマーケティングの効率化が挙げられる。さらに、最近では特定のタスクを自動的に実行するAIエージェントも注目を集めている。
NTT DATAの生成AI活用コンセプト「Smart AI Agent™」は、複数のAIエージェントが連携して自律的にタスクを実行し、単一の業務に留まらず、複雑な業務プロセス全体を代替するというものだ。本稿では、Smart AI Agent™の概要と、それを実現するコア技術について説明する。

目次

生成AI活用コンセプト「Smart AI Agent™」とは
Smart AI Agentを実現するコア技術
1. Multi Agent（マルチエージェント）
2. UITL（User-In-The-Loop）
3. Task Planning（タスクプランニング）
おわりに

生成AI活用コンセプト「Smart AI Agent™」とは

生成AIのユースケースとしては、生成AIと情報検索技術を組み合わせて信頼性を担保するRAG（※1）を用いるのが主流です。自然言語によるナレッジ検索、文書生成および要約、顧客の問い合わせ対応など、多くの企業がRAGを活用して一部の業務を代替してきました。しかし、生産性をより向上させるためには、部分的な業務にとどまらず、業務プロセス全体で成果を創出していく必要があります。
業務プロセスを改善することで生産性向上や付加価値業務へのシフトを実現するために、NTT DATAは生成AI活用コンセプト「Smart AI Agent」を提案しています。
Smart AI Agentは、利用者の指示に応じて自律的にタスクを組み立てる「パーソナルエージェント」が、複数の専門性を持ったAIエージェントである「特化エージェント」と連携し、対象業務のタスクを抽出・整理・実行することで、これまで人が行っていた業務を支援または代替するものです。これを活用することで、システム開発支援や営業活動支援、市場調査、BPO全般業務など、単一業務では完結しない複雑なプロセスも実行できるようになります。

図1：Smart AI Agentの全体像

（※1）RAG（Retrieval-Augmented Generation）

外部データベースや知識ベースから情報を取得し、その情報をもとにテキスト生成を行うAI活用の手法

Smart AI Agentを実現するコア技術

NTT DATAでは、AIエージェントを「推論・計画・実行の機能を保有し、役割に応じてユーザの意図を理解し、ユーザの代わりにタスクを実行する知的なシステム」と定義しています。具体的には、下記の4要素を満たすものをSmart AI Agentと呼んでいます。

（1）プロフィール：エージェントの機能やタスク遂行の前提となる、役割やスキル（能力）を定義・付与する
（2）計画：ユーザやシステム、環境からの入力を認識・解釈し、計画する
（3）推論：目的や状況（文脈）に応じて情報を記憶・推論し、意思決定を行う
（4）実行：意思決定をもとにアクションを行う

当社では、上記を実現するためのAIエージェント構築技術をはじめ、パブリッククラウドやプライベートクラウド／オンプレミスといったインフラ、AIモデル、業務アプリケーションの導入から運用までをフルスタックで提供しています。（図2）

図2：Smart AI Agentを構成するサービス群

次章以降では、AIエージェント構築技術のうち、下記3つの技術について説明します。

1．Multi Agent：複数のAIエージェントに対してプロフィール（役割・スキル）を定義し、相互に協調してアクションを実行する
2．UITL（User-In-The-Loop）：ユーザからの入力を認識・解釈して、エージェントが自律的に改善する
3．Task Planning：ユーザからの指示をもとに、自律的にタスクを組み立てて実行する

1．Multi Agent（マルチエージェント）

従来、LLM単体利用では、複雑な業務への適用は難しいという課題がありました。例えば、営業資料作成や審査のような業務では、複数の領域での専門知識を要する作業が必要であり、単体のLLMでは対応が困難です。こうした課題に対応するのが、「Multi Agent」です。Multi Agentでは、特定の役割に特化した複数のエージェントを構築し、統括するエージェントに指揮させることで、単体のLLMでは困難な業務を遂行できます。
例えば、顧客向けの提案書を作成するエージェントの構成例を図3に示します。

図3：提案書作成エージェントの構成例

Multi Agent では、それぞれのエージェントにシステムプロンプトおよび参照させるデータの種類を変更することによって役割を与えます。異なるプロンプトやデータを持った複数のエージェントが協調して作業を行うことで、相互にチェックとフィードバックが行われ、成果物の品質が向上します。例えば、

「提案書作成エージェント」には、「提案書の作成・修正」を指示するシステムプロンプトを設定し、参照データとして「企業情報・商材情報・提案書の構成」を与えることで、商材や提案に関する専門知識を参照できるようにします。
「顧客理解エージェント」には、「顧客目線での提案書への指摘」を指示するシステムプロンプトを設定し、参照データとして「会社名・企業情報」を与えることで、顧客の立場でのフィードバックを与えられるようにします。
提案書作成エージェントが作成した成果物に対し、顧客理解エージェントが繰り返しフィードバックすることで、提案書の品質を向上させることが可能です。

2．UITL（User-In-The-Loop）

エージェントの出力を評価し、改善点を見つけてフィードバックすることを「Reflection」と呼びます。（※2）
フィードバックの与え方によって、「Human-Reflection」「Cross-Reflection」「Self-Reflection」の大きく3通りのアプローチがあります（図4）。
UITLは、これらのReflectionのアプローチの中でも、人間が評価やフィードバックを提供する「Human-Reflection」に注目したアプローチです。エージェントだけでは難しい、人間の判断を必要とするユースケースに適した手法となっています。

図4：Reflectionの種類

UITLを自動車事故の損害割合判定業務に適用した例を説明します。（図5）
このユースケースでは、定型的な業務フローをAIと人が協働して進めることで、業務全体の効率化を目指しています。AI適用の対象となるのは、例えば以下の業務です：

過去の資料や事故データ、対話記録をもとにドキュメントを作成する
事実関係を分析し、過失割合などを判断する

UITLを適用した業務フローでは、まずAIが初期案を提示し、それに対して人がフィードバックや修正を行います。内容に応じて、AIに再生成を促すことでユーザの意図や期待に沿ったアウトプットへと調整していきます。
さらに、このプロセスで得られるユーザのフィードバックや修正内容は、将来的なアウトプット改善にも活用可能です。具体的には、ユーザからの指摘や修正履歴を元に過去の出力内容を分析し、誤りの原因をAIが自律的に特定。それにより、システム全体の出力品質を継続的に向上させることができます。

図5：UITLのユースケース例

（※2）Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents を参考に作成

https://arxiv.org/abs/2405.10467

3．Task Planning（タスクプランニング）

事務作業などの定型的な業務にAIエージェントを適用したい場合、ワークフローを事前定義し、その手順通りに実行することで、業務を代替することが可能です。一方で、設計書作成や顧客対応など、複雑な業務の場合、ワークフローを事前に定義することが困難です。このような業務に対応するために、ユーザの要望や状況に応じて、必要なタスクを自律的に計画して実行する能力がTask Planningです。

Task Planningを実行する代表的なフレームワークとして、Metaが発表した「LLM Compiler」があります。LLM Compilerは、LLMによる関数呼び出しを並列で実行できるフレームワークです。（図6）従来の逐次的な関数呼び出しの方式と比べて、複雑な依存関係をもつタスクであっても効率的に実行することが可能です。

図6：LLM Compilerフレームワークの全体像

LLM CompilerによるTask Planningは、次の3ステップで実行されます。

（1）タスク計画：ユーザの自然言語による指示を解釈して、実行すべき一連のタスクとそれらの依存関係を整理します。
（2）タスクフェッチ：計画したタスクに基づいて、並列実行の準備が整い次第、順次実行の指示を出します。
（3）タスク実行：指示されたタスクを非同期で実行します。このとき、検索やAPI呼び出しのような簡単な関数や、特定のタスクに対応したLLMエージェントを実行することも可能です。

当社では、この3ステップの中でも、「タスク実行」の高度化に向けた取り組みを進めています。
従来手法では、タスク計画を立案する前に、候補タスク（タスクを実行するためのツールやLLMのプロンプト）を事前に定義する必要があります。しかし実際には、事前に網羅的に候補タスクを定義することは難しく、不足しているタスクを何らかの方法で補完することが求められます。
当社では、この課題に対し、自然言語によって記述されたゴールと「タスク定義」を入力し、ゴールに対して不足しているタスクについて、LLMによってプロンプトを生成する手法を取っています。