9 AI Agent とエージェントシステム

AI Agent システムメインビジュアル

第 8 章では、モデルが文書に基づいて答えられるようにしました。第 9 章では、システムが目標に向かって行動するようにします。次の手を計画し、ツールを呼び、観察を読み、方針を調整し、安全に止まり、人がレビューできる trace を残します。

多 Agent フレームワークから始める必要はありません。まず、すべてのステップを見せられる小さな Agent を作ります。

まず Agent 実行ループを見る

Agent 実行ループ

Agent は「ツール付きチャットボット」ではなく、制御された実行ループです。

部分	やさしい意味	必ず制御すること
Goal	Agent が達成したいこと	範囲、成功基準、停止条件
State	今分かっていること	現在の入力、過去の観察、残り手順
Plan	次に試すこと	最大ステップ、代替経路、人への引き継ぎ
Tool	検索、ファイル読み取り、API 呼び出し、コード実行など	schema、検証、ホワイトリスト、リスクレベル
Observation	ツールが返した結果	エラー処理、再試行ルール、信頼境界
Memory	ステップ間・実行間で残す情報	短期状態と長期好みの境界
Trace	実行を再生できる記録	goal、action、arguments、observation、cost、final result

学習順序とタスク表

多 Agent の前に、単一 Agent を追跡可能にします。

手順	読む内容	手を動かすこと	残す証拠
9.1	Agent 基礎と構造	goal、state、plan、tool、observation、memory を説明する	構成スケッチ
9.2	推論と計画	同じタスクで ReAct と Plan-and-Execute を比べる	ステップ trace
9.3	ツール呼び出し	パラメータとエラーを持つツールを1～2個定義する	`tools_schema.md`
9.4	記憶	現在状態と長期記憶を分ける	memory 境界メモ
9.5	MCP	MCP をツールとデータソース接続の標準方式として理解する	接続メモ
9.6-9.7	フレームワークと多 Agent	単一 Agent ループが安定してから学ぶ	フレームワーク選択メモ
9.8-9.10	評価、安全、配置、プロジェクト	9.10.5 実践：追跡可能な単一 Agent アシスタントを作るを動かす	trace ログ、安全ブロック、評価ケース

最初に動かすループ：trace を表示する

このオフラインスクリプトは LLM に依存しません。学ぶのは工程習慣です。すべての action は再生可能であるべきです。あとで固定 plan をモデル生成の計画に置き換えても、trace 形式は残します。

ch09_agent_trace.py を作成し、Python 3.10 以降で実行してください。

import json


def search_docs(tool_input: dict) -> str:
    return "Found notes about RAGOps, AgentOps, evaluation sets, and trace logs."


def make_todo(tool_input: dict) -> str:
    topic = tool_input["topic"]
    return f"1) Review {topic} notes; 2) add one eval case; 3) write failure notes."


TOOLS = {
    "search_docs": {"fn": search_docs, "risk": "read_only"},
    "make_todo": {"fn": make_todo, "risk": "draft_only"},
}

goal = "Prepare a short RAG review plan."
plan = [
    {
        "thought": "Find relevant course materials before making a plan.",
        "action": "search_docs",
        "input": {"query": "RAGOps AgentOps evaluation trace"},
    },
    {
        "thought": "Turn the materials into a small review checklist.",
        "action": "make_todo",
        "input": {"topic": "RAG evaluation"},
    },
]

trace = []
for step_number, step in enumerate(plan, start=1):
    tool = TOOLS.get(step["action"])
    if tool is None:
        observation = "Blocked: tool is not whitelisted."
        risk = "blocked"
    else:
        observation = tool["fn"](step["input"])
        risk = tool["risk"]

    trace.append(
        {
            "step": step_number,
            "goal": goal,
            "thought": step["thought"],
            "action": step["action"],
            "input": step["input"],
            "risk": risk,
            "observation": observation,
        }
    )

for item in trace:
    print(json.dumps(item, ensure_ascii=False))

期待される出力の先頭:

{"step": 1, "goal": "Prepare a short RAG review plan.", "thought": "Find relevant course materials before making a plan.", "action": "search_docs", ...
{"step": 2, "goal": "Prepare a short RAG review plan.", "thought": "Turn the materials into a small review checklist.", "action": "make_todo", ...

操作メモ: make_todo をホワイトリスト外の send_email などに変えてください。スクリプトはそれをブロックするはずです。これが安全境界の最小版です。

Agent、ワークフロー、RAG、Function Calling の選び方

Agent 境界選択図

Agent は強力ですが、常に最初の選択肢ではありません。

問題	まず使うもの	Agent を使う目安
手順が固定で既知	ワークフロー	観察のたびに経路が変わる
私有情報や新情報が必要	RAG	検索が大きな目標の一部にすぎない
1回の構造化 action で十分	Function Calling	複数のツール呼び出しと状態更新が必要
リスクが高い	人間確認付きワークフロー	Agent は下書きし、高リスク action は人が確認
探索に計画、ツール、記憶、回復が必要	Agent	すべてのステップを記録し、安全に止められる

よくある失敗

単一 Agent が安定する前に多 Agent を作る。
schema、検証、有用なエラーメッセージなしでツールを呼ぶ。
停止条件がなく、ループとコスト増加を招く。
高リスクツールを人間確認なしで動かす。
成功 Demo だけ見せ、失敗 trace を残さない。
memory を置き場にしてしまい、現在状態、長期好み、タスク履歴を分けない。

クリア確認

この章を出る前に、次をできるようにしてください。

goal、state、plan、tool、observation、memory、trace、guardrail を説明できる。
trace スクリプトを動かし、ホワイトリスト外ツールをブロックできる。
agent_traces.jsonl、tools_schema.md、safety_boundary.md、failure_cases.md を保存できる。
タスクにワークフロー、RAG、Function Calling、Agent のどれが合うか判断できる。
第 9 章フルワークショップを動かし、評価タスク1つと安全ブロック例1つを追加できる。

印刷用チェックリストは 9.0 学習チェックリストを使ってください。プロジェクトから始めたい場合は 9.10.5 実践：追跡可能な単一 Agent アシスタントを作るへ進みます。

まず Agent 実行ループを見る​

学習順序とタスク表​

最初に動かすループ：trace を表示する​

Agent、ワークフロー、RAG、Function Calling の選び方​

よくある失敗​

クリア確認​