Thanks to visit codestin.com
Credit goes to openai.github.io

コンテンツにスキップ

エージェント

エージェントは OpenAI Agents SDK の主要な構成要素です。Agent は、次の設定を備えた Large Language Model (LLM) です。

  • Instructions – モデルに「自分は誰で」「どのように応答すべきか」を伝える system prompt
  • Model – 呼び出す OpenAI モデルと、任意のモデル調整パラメーター
  • Tools – タスク達成のために LLM が呼び出せる関数や API の一覧
基本的なエージェント定義
import { Agent } from '@openai/agents';
const agent = new Agent({
name: 'Haiku Agent',
instructions: 'Always respond in haiku form.',
model: 'gpt-5-nano', // optional – falls back to the default model
});

このページの残りの部分では、あらゆるエージェント機能を詳しく解説します。


Agent コンストラクターは単一の設定オブジェクトを受け取ります。よく使われるプロパティは以下のとおりです。

PropertyRequiredDescription
nameyes短い人間が読める識別子
instructionsyesSystem prompt(文字列 または 関数 – Dynamic instructions を参照)
modelnoモデル名 または カスタムの Model 実装
modelSettingsno調整パラメーター(temperature、top_p など)。トップレベルにないプロパティが必要な場合は、providerData 配下に含められます
toolsnoモデルが呼び出せる Tool インスタンスの配列
ツール付きエージェント
import { Agent, tool } from '@openai/agents';
import { z } from 'zod';
const getWeather = tool({
name: 'get_weather',
description: 'Return the weather for a given city.',
parameters: z.object({ city: z.string() }),
async execute({ city }) {
return `The weather in ${city} is sunny.`;
},
});
const agent = new Agent({
name: 'Weather bot',
instructions: 'You are a helpful weather bot.',
model: 'gpt-4.1',
tools: [getWeather],
});

エージェントはそのコンテキスト型に対して ジェネリック です(例: Agent<TContext, TOutput>)。コンテキストは、あなたが作成して Runner.run() に渡す依存性注入オブジェクトです。これはあらゆるツール、ガードレール、ハンドオフなどに転送され、状態の保持や共有サービス(データベース接続、ユーザー メタデータ、フラグ管理など)を提供するのに便利です。

コンテキスト付きエージェント
import { Agent } from '@openai/agents';
interface Purchase {
id: string;
uid: string;
deliveryStatus: string;
}
interface UserContext {
uid: string;
isProUser: boolean;
// this function can be used within tools
fetchPurchases(): Promise<Purchase[]>;
}
const agent = new Agent<UserContext>({
name: 'Personal shopper',
instructions: 'Recommend products the user will love.',
});
// Later
import { run } from '@openai/agents';
const result = await run(agent, 'Find me a new pair of running shoes', {
context: { uid: 'abc', isProUser: true, fetchPurchases: async () => [] },
});

デフォルトでは、エージェントは プレーンテキストstring)を返します。モデルに構造化オブジェクトを返させたい場合は、outputType プロパティを指定します。SDK は次を受け付けます。

  1. Zod スキーマ(z.object({...})
  2. JSON‑schema 互換の任意のオブジェクト
Zod を用いた構造化出力
import { Agent } from '@openai/agents';
import { z } from 'zod';
const CalendarEvent = z.object({
name: z.string(),
date: z.string(),
participants: z.array(z.string()),
});
const extractor = new Agent({
name: 'Calendar extractor',
instructions: 'Extract calendar events from the supplied text.',
outputType: CalendarEvent,
});

outputType が指定されると、SDK はプレーンテキストの代わりに自動的に structured outputs を使用します。


マルチエージェントのシステム設計パターン

Section titled “マルチエージェントのシステム設計パターン”

エージェントを組み合わせる方法は多数あります。プロダクションアプリでよく見られるパターンは次の 2 つです。

  1. マネージャー(エージェントをツールとして) – 中央のエージェントが会話を所有し、ツールとして公開された専門エージェントを呼び出す
  2. ハンドオフ – 最初のエージェントがユーザーのリクエストを特定したら、以降の会話全体を専門家に委譲する

これらのアプローチは相補的です。マネージャー方式はガードレールやレート制限を一元的に適用でき、ハンドオフは各エージェントが会話の制御を保持せず単一タスクに集中できます。

マネージャー(エージェントをツールとして)

Section titled “マネージャー(エージェントをツールとして)”

このパターンではマネージャーは制御を渡しません。LLM がツールを使い、マネージャーが最終回答を要約します。詳しくは ツール ガイドを参照してください。

ツールとしてのエージェント
import { Agent } from '@openai/agents';
const bookingAgent = new Agent({
name: 'Booking expert',
instructions: 'Answer booking questions and modify reservations.',
});
const refundAgent = new Agent({
name: 'Refund expert',
instructions: 'Help customers process refunds and credits.',
});
const customerFacingAgent = new Agent({
name: 'Customer-facing agent',
instructions:
'Talk to the user directly. When they need booking or refund help, call the matching tool.',
tools: [
bookingAgent.asTool({
toolName: 'booking_expert',
toolDescription: 'Handles booking questions and requests.',
}),
refundAgent.asTool({
toolName: 'refund_expert',
toolDescription: 'Handles refund questions and requests.',
}),
],
});

ハンドオフではトリアージ用エージェントがリクエストを振り分けますが、ハンドオフ後は専門エージェントが最終出力を生成するまで会話を所有します。これによりプロンプトを短く保ち、各エージェントを独立に考察できます。詳しくは ハンドオフ ガイドをご覧ください。

ハンドオフ対応エージェント
import { Agent } from '@openai/agents';
const bookingAgent = new Agent({
name: 'Booking Agent',
instructions: 'Help users with booking requests.',
});
const refundAgent = new Agent({
name: 'Refund Agent',
instructions: 'Process refund requests politely and efficiently.',
});
// Use Agent.create method to ensure the finalOutput type considers handoffs
const triageAgent = Agent.create({
name: 'Triage Agent',
instructions: `Help the user with their questions.
If the user asks about booking, hand off to the booking agent.
If the user asks about refunds, hand off to the refund agent.`.trimStart(),
handoffs: [bookingAgent, refundAgent],
});

instructions は文字列の代わりに 関数 にできます。この関数は現在の RunContext と Agent インスタンスを受け取り、文字列 または Promise<string> を返せます。

動的 instructions を使うエージェント
import { Agent, RunContext } from '@openai/agents';
interface UserContext {
name: string;
}
function buildInstructions(runContext: RunContext<UserContext>) {
return `The user's name is ${runContext.context.name}. Be extra friendly!`;
}
const agent = new Agent<UserContext>({
name: 'Personalized helper',
instructions: buildInstructions,
});

同期関数と async 関数の両方がサポートされています。


高度なユースケースでは、イベントをリッスンしてエージェントのライフサイクルを観測できます。利用可能なものについては、こちら に記載のエージェントフックのイベント名を参照してください。

ライフサイクルフック付きエージェント
import { Agent } from '@openai/agents';
const agent = new Agent({
name: 'Verbose agent',
instructions: 'Explain things thoroughly.',
});
agent.on('agent_start', (ctx, agent) => {
console.log(`[${agent.name}] started`);
});
agent.on('agent_end', (ctx, output) => {
console.log(`[agent] produced:`, output);
});

ガードレールにより、ユーザー入力やエージェント出力の検証や変換が可能です。inputGuardrails および outputGuardrails 配列で設定します。詳細は ガードレール ガイドをご覧ください。


エージェントのクローン/コピー

Section titled “エージェントのクローン/コピー”

既存エージェントを少しだけ変更した版が必要ですか?clone() メソッドを使うと、まったく新しい Agent インスタンスが返されます。

エージェントのクローン作成
import { Agent } from '@openai/agents';
const pirateAgent = new Agent({
name: 'Pirate',
instructions: 'Respond like a pirate – lots of “Arrr!”',
model: 'gpt-5-mini',
});
const robotAgent = pirateAgent.clone({
name: 'Robot',
instructions: 'Respond like a robot – be precise and factual.',
});

ツールを提供しても、LLM が必ず呼び出すとは限りません。modelSettings.tool_choice を使ってツール使用を 強制 できます。

  1. 'auto'(デフォルト)– ツールを使うかどうかを LLM が判断
  2. 'required' – LLM はツールを 必ず 呼び出す(どれを使うかは選べる)
  3. 'none' – LLM はツールを呼び出しては ならない
  4. 特定のツール名(例: 'calculator')– そのツールを必ず呼び出す
ツール使用の強制
import { Agent, tool } from '@openai/agents';
import { z } from 'zod';
const calculatorTool = tool({
name: 'Calculator',
description: 'Use this tool to answer questions about math problems.',
parameters: z.object({ question: z.string() }),
execute: async (input) => {
throw new Error('TODO: implement this');
},
});
const agent = new Agent({
name: 'Strict tool user',
instructions: 'Always answer using the calculator tool.',
tools: [calculatorTool],
modelSettings: { toolChoice: 'auto' },
});

ツール呼び出しの後、SDK は自動的に tool_choice'auto' にリセットします。これにより、モデルがツール呼び出しを繰り返す無限ループへの突入を防ぎます。この動作は resetToolChoice フラグ、または toolUseBehavior の設定で上書きできます。

  • 'run_llm_again'(デフォルト)– ツール結果を使って LLM を再度実行
  • 'stop_on_first_tool' – 最初のツール結果を最終回答として扱う
  • { stopAtToolNames: ['my_tool'] } – 指定ツールのいずれかが呼ばれた時点で停止
  • (context, toolResults) => ... – 実行を終了すべきかを返すカスタム関数
const agent = new Agent({
...,
toolUseBehavior: 'stop_on_first_tool',
});