環境変数 - Shannon

概要

Shannonは、すべてのサービスで環境変数を使用して設定を行います。このページでは、100以上の設定オプションをタイプ、デフォルト、影響とともに文書化しています。

クイックリファレンス

カテゴリ	変数	サービス
Core Runtime	3	すべて
LLM Provider Keys	11	LLMサービス
Web Search	6	LLMサービス
Data Stores	17	すべて
Service Endpoints	8	すべて
Model Routing	13	Orchestrator, LLMサービス
Cache & Rate Limiting	8	すべて
Tool Execution	11	Orchestrator, Agent Core
Security	6	Gateway, Orchestrator
Observability	5	すべて
WASI Sandbox	4	Agent Core, LLMサービス
Integrations	13	LLMサービス
Advanced	20+	Orchestrator

合計: 100以上の設定変数

設定ファイル

.env.exampleを.envにコピーしてカスタマイズします：

cp .env.example .env
nano .env

変更後にサービスを再起動します：

docker compose restart

Core Runtime

ENVIRONMENT

タイプ: String
デフォルト: dev
有効な値: dev, staging, prod
サービス: すべて
ホットリロード: いいえ（再起動が必要）ログの詳細度とポリシーの適用を制御します。

ENVIRONMENT=prod

影響:

dev: 詳細なログ、緩和されたポリシー
staging: 中程度のログ、標準的なポリシー
prod: 最小限のログ、厳格なポリシー

DEBUG

タイプ: Boolean
デフォルト: false
有効な値: true, false
サービス: すべて
ホットリロード: いいえすべてのサービスでデバッグログを有効にします。

DEBUG=true

影響:

true: デバッグレベルのログ、スタックトレース
false: 情報レベルのログのみ

SERVICE_NAME

タイプ: String
デフォルト: shannon-llm-service
サービス: LLMサービス
ホットリロード: いいえログとテレメトリのためのサービス識別子。

SERVICE_NAME=shannon-llm-service

LLM Provider API Keys

OPENAI_API_KEY

タイプ: String
必須: 少なくとも1つのプロバイダーキー
サービス: LLMサービス
ホットリロード: はい GPTモデル用のOpenAI APIキー。

OPENAI_API_KEY=sk-...

有効なモデル: GPT-5, GPT-5-mini, GPT-5-nano

ANTHROPIC_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい Claudeモデル用のAnthropic APIキー。

ANTHROPIC_API_KEY=sk-ant-...

有効なモデル: Claude 4.5 Sonnet, Claude 4.1 Opus, Claude 4.5 Haiku

GOOGLE_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい Geminiモデル用のGoogle AI APIキー。

GOOGLE_API_KEY=...

有効なモデル: Gemini Pro, Gemini Flash

GROQ_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい高速推論用のGroq APIキー。

GROQ_API_KEY=...

有効なモデル: Llama 3, Mixtral

XAI_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい Grokモデル用のxAI APIキー。

XAI_API_KEY=...

DEEPSEEK_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい DeepSeek APIキー。

DEEPSEEK_API_KEY=...

QWEN_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい Alibaba Cloudモデル用のQwen APIキー。

QWEN_API_KEY=...

MISTRAL_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい Mistral APIキー。

MISTRAL_API_KEY=...

AWS_ACCESS_KEY_ID / AWS_SECRET_ACCESS_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい Bedrockモデル用のAWS認証情報。

AWS_ACCESS_KEY_ID=AKIA...
AWS_SECRET_ACCESS_KEY=...
AWS_REGION=us-east-1

有効なモデル: Claude (Bedrock), Llama (Bedrock), Titan

ZAI_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい ZAI APIキー。

ZAI_API_KEY=...

Web Search Providers

WEB_SEARCH_PROVIDER

タイプ: String デフォルト: google 有効な値: google, serper, serpapi, bing, exa, firecrawl サービス: LLMサービス ホットリロード: はいアクティブなウェブ検索プロバイダー。

WEB_SEARCH_PROVIDER=google

GOOGLE_SEARCH_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい Google Custom Search APIキー。

GOOGLE_SEARCH_API_KEY=...
GOOGLE_SEARCH_ENGINE_ID=...

取得先: https://console.cloud.google.com/apis/credentials

SERPER_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい Serper.dev APIキー（Google Search APIの代替）。

SERPER_API_KEY=...

取得先: https://serper.dev

BING_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい Microsoft Bing Search APIキー。

BING_API_KEY=...

EXA_API_KEY

タイプ: String
サービス: LLMサービス
ホットリロード: はい Exa AI検索APIキー。

EXA_API_KEY=...

FIRECRAWL_API_KEY

タイプ: 文字列
サービス: LLMサービス
ホットリロード: はい Webスクレイピング用のFirecrawl APIキー。

FIRECRAWL_API_KEY=...

データストア

PostgreSQL

POSTGRES_HOST

タイプ: 文字列
デフォルト: postgres
サービス: ゲートウェイ、オーケストレーター
ホットリロード: いいえ PostgreSQLのホスト名。

POSTGRES_HOST=postgres

POSTGRES_PORT

タイプ: 整数
デフォルト: 5432
範囲: 1-65535
サービス: ゲートウェイ、オーケストレーター
ホットリロード: いいえ PostgreSQLのポート。

POSTGRES_PORT=5432

POSTGRES_DB

タイプ: 文字列
デフォルト: shannon
サービス: ゲートウェイ、オーケストレーター
ホットリロード: いいえ PostgreSQLのデータベース名。

POSTGRES_DB=shannon

POSTGRES_USER

タイプ: 文字列
デフォルト: shannon
サービス: ゲートウェイ、オーケストレーター
ホットリロード: いいえ PostgreSQLのユーザー名。

POSTGRES_USER=shannon

POSTGRES_PASSWORD

タイプ: 文字列
デフォルト: shannon
サービス: ゲートウェイ、オーケストレーター
ホットリロード: いいえ PostgreSQLのパスワード。

POSTGRES_PASSWORD=secure-password

セキュリティ: 本番環境では変更してください！

POSTGRES_SSLMODE

タイプ: 文字列
デフォルト: disable
有効な値: disable, require, verify-ca, verify-full
サービス: ゲートウェイ、オーケストレーター
ホットリロード: いいえ PostgreSQL接続のSSLモード。

POSTGRES_SSLMODE=require

Redis

REDIS_HOST

タイプ: 文字列
デフォルト: redis
サービス: すべて
ホットリロード: いいえ Redisのホスト名。

REDIS_HOST=redis

REDIS_PORT

タイプ: 整数
デフォルト: 6379
サービス: すべて
ホットリロード: いいえ Redisのポート。

REDIS_PORT=6379

REDIS_PASSWORD

タイプ: 文字列
デフォルト: 空
サービス: すべて
ホットリロード: いいえ Redisのパスワード（認証が有効な場合）。

REDIS_PASSWORD=secure-password

REDIS_TTL_SECONDS

タイプ: 整数
デフォルト: 3600
範囲: 0-∞ (0 = 無期限)
サービス: すべて
ホットリロード: はい RedisキーのデフォルトTTL。

REDIS_TTL_SECONDS=3600

影響: セッション、イベント、レスポンスのキャッシュ期間

REDIS_URL

タイプ: 文字列
デフォルト: redis://redis:6379
サービス: すべて
ホットリロード: いいえ完全なRedis接続URL。

REDIS_URL=redis://redis:6379
# 認証あり:
REDIS_URL=redis://:password@redis:6379

LLM_REDIS_URL

タイプ: 文字列
デフォルト: 空（REDIS_URLを使用）
サービス: LLMサービス
ホットリロード: いいえ LLMレスポンスキャッシング用の専用Redisインスタンス。

LLM_REDIS_URL=redis://llm-redis:6379

ユースケース: スケーリングのためにLLMキャッシュをセッションデータから分離

Qdrant (ベクターストア)

QDRANT_URL

タイプ: 文字列
デフォルト: http://qdrant:6333
サービス: オーケストレーター、LLMサービス
ホットリロード: いいえ Qdrant接続URL。

QDRANT_URL=http://qdrant:6333

QDRANT_HOST / QDRANT_PORT

タイプ: 文字列 / 整数
デフォルト: qdrant / 6333
サービス: オーケストレーター、LLMサービス
ホットリロード: いいえ QDRANT_URLの代替（ホスト/ポートを別々に指定）。

QDRANT_HOST=qdrant
QDRANT_PORT=6333

サービスエンドポイント

TEMPORAL_HOST

タイプ: 文字列
デフォルト: temporal:7233
サービス: オーケストレーター
ホットリロード: いいえ Temporalサーバーのアドレス。

TEMPORAL_HOST=temporal:7233

LLM_SERVICE_URL

タイプ: 文字列
デフォルト: http://llm-service:8000
サービス: オーケストレーター、エージェントコア
ホットリロード: いいえ LLMサービスのエンドポイント。

LLM_SERVICE_URL=http://llm-service:8000

AGENT_CORE_ADDR

タイプ: 文字列
デフォルト: agent-core:50051
サービス: オーケストレーター
ホットリロード: いいえエージェントコアのgRPCアドレス。

AGENT_CORE_ADDR=agent-core:50051

ORCHESTRATOR_GRPC

タイプ: 文字列
デフォルト: orchestrator:50052
サービス: ゲートウェイ
ホットリロード: いいえオーケストレーターのgRPCエンドポイント。

ORCHESTRATOR_GRPC=orchestrator:50052

ADMIN_SERVER

タイプ: 文字列
デフォルト: http://orchestrator:8081
サービス: ゲートウェイ
ホットリロード: いいえイベントストリーミング用の管理/SSEサーバー。

ADMIN_SERVER=http://orchestrator:8081

CONFIG_PATH

タイプ: 文字列
デフォルト: ./config/features.yaml
サービス: オーケストレーター、エージェントコア
ホットリロード: はい（ファイルウォッチャー使用）フィーチャーフラグ設定のパス。

CONFIG_PATH=./config/features.yaml

MODELS_CONFIG_PATH

タイプ: 文字列
デフォルト: ./config/models.yaml
サービス: LLMサービス、オーケストレーター
ホットリロード: はい（ファイルウォッチャー使用）モデルと価格設定のパス。

MODELS_CONFIG_PATH=./config/models.yaml

EVENTS_INGEST_URL

タイプ: 文字列
デフォルト: http://orchestrator:8081/events
サービス: エージェントコア
ホットリロード: いいえイベント取り込みエンドポイント。

EVENTS_INGEST_URL=http://orchestrator:8081/events

モデルルーティングと予算

DEFAULT_MODEL_TIER

タイプ: 文字列
デフォルト: small
有効な値: small, medium, large
サービス: オーケストレーター
ホットリロード: はいタスクのデフォルトモデルティア。

DEFAULT_MODEL_TIER=small

ティア:

small: GPT-5-nano, Claude Haiku (~$0.15/1Mトークン)
medium: GPT-5-mini, Claude Sonnet (~$3-15/1Mトークン)
large: GPT-5.1, Claude Opus (~$15-75/1Mトークン)

COMPLEXITY_MODEL_ID

タイプ: 文字列
デフォルト: gpt-5
サービス: Orchestrator
ホットリロード: はい複雑性分析に使用されるモデルです。

COMPLEXITY_MODEL_ID=gpt-5

DECOMPOSITION_MODEL_ID

タイプ: 文字列
デフォルト: claude-sonnet-4-5-20250929
サービス: Orchestrator
ホットリロード: はいタスク分解に使用されるモデルです。

DECOMPOSITION_MODEL_ID=claude-sonnet-4-5-20250929

MAX_TOKENS

タイプ: 整数
デフォルト: 2000
範囲: 1-∞
サービス: LLM Service
ホットリロード: はい LLMコールごとの最大出力トークン数のデフォルトです。

MAX_TOKENS=2000

TEMPERATURE

タイプ: 浮動小数点数
デフォルト: 0.7
範囲: 0.0-2.0
サービス: LLM Service
ホットリロード: はい LLMサンプリングのデフォルト温度です。

TEMPERATURE=0.7

影響:

0.0: 決定論的、集中
0.7: バランスの取れた創造性
1.0+: よりランダムで創造的

MAX_TOKENS_PER_REQUEST

タイプ: 整数
デフォルト: 10000
範囲: 1-∞
サービス: Orchestrator
ホットリロード: はいタスクリクエストごとの最大トークン数です。

MAX_TOKENS_PER_REQUEST=10000

影響: ハードバジェット制限、超過時にタスクが失敗します。

MAX_COST_PER_REQUEST

タイプ: 浮動小数点数
デフォルト: 0.50
範囲: 0.0-∞
サービス: Orchestrator
ホットリロード: はいタスクリクエストごとの最大コスト（USD）です。

MAX_COST_PER_REQUEST=0.50

影響: コストがこの制限を超えるとタスクが失敗します。

LLM_DISABLE_BUDGETS

タイプ: 整数
デフォルト: 1
有効な値: 0, 1
サービス: Orchestrator, LLM Service
ホットリロード: はいバジェットの強制場所です。

LLM_DISABLE_BUDGETS=1

値:

1: Orchestratorがバジェットを管理（推奨）
0: LLMサービスがバジェットを強制

HISTORY_WINDOW_MESSAGES

タイプ: 整数
デフォルト: 50
範囲: 1-∞
サービス: Orchestrator
ホットリロード: はい会話履歴に含めるメッセージの数です。

HISTORY_WINDOW_MESSAGES=50

HISTORY_WINDOW_DEBUG_MESSAGES

タイプ: 整数
デフォルト: 75
サービス: Orchestrator
ホットリロード: はいデバッグモードの履歴ウィンドウサイズです。

HISTORY_WINDOW_DEBUG_MESSAGES=75

WORKFLOW_SYNTH_BYPASS_SINGLE

タイプ: ブール値
デフォルト: true
サービス: Orchestrator
ホットリロード: はい単一結果のワークフローの合成をスキップします。

WORKFLOW_SYNTH_BYPASS_SINGLE=true

影響:

true: 簡単なタスクに対して高速（合成ステップをスキップ）
false: 常に結果を合成

TOKEN_BUDGET_PER_AGENT

タイプ: 整数
デフォルト: 空（無制限）
サービス: Orchestrator
ホットリロード: はいエージェント実行ごとのトークン予算です。

TOKEN_BUDGET_PER_AGENT=5000

TOKEN_BUDGET_PER_TASK

タイプ: 整数
デフォルト: 空（無制限）
サービス: Orchestrator
ホットリロード: はい全タスクに対するトークン予算です。

TOKEN_BUDGET_PER_TASK=20000

キャッシュとレート制限

ENABLE_CACHE

タイプ: ブール値
デフォルト: true
サービス: LLM Service
ホットリロード: はい LLM応答のキャッシングを有効にします。

ENABLE_CACHE=true

影響:

true: Redisに応答をキャッシュし、高速かつ安価
false: 常にLLM APIにアクセス

CACHE_SIMILARITY_THRESHOLD

タイプ: 浮動小数点数
デフォルト: 0.95
範囲: 0.0-1.0
サービス: LLM Service
ホットリロード: はいキャッシュヒットのための意味的類似性の閾値です。

CACHE_SIMILARITY_THRESHOLD=0.95

影響:

1.0: 完全一致のみ
0.95: 非常に類似したクエリ
0.8: ゆるい一致（キャッシュヒットが増え、精度が低下）

RATE_LIMIT_REQUESTS

タイプ: 整数
デフォルト: 100
サービス: Gateway
ホットリロード: はい APIキーごとのウィンドウあたりのリクエスト数です。

RATE_LIMIT_REQUESTS=100

RATE_LIMIT_WINDOW

タイプ: 整数
デフォルト: 60
範囲: 1-∞（秒）
サービス: Gateway
ホットリロード: はいレート制限ウィンドウの期間です。

RATE_LIMIT_WINDOW=60

組み合わせ:

RATE_LIMIT_REQUESTS=100
RATE_LIMIT_WINDOW=60
# = 60秒あたり100リクエスト

WEB_SEARCH_RATE_LIMIT

タイプ: 整数
デフォルト: 120
サービス: LLM Service
ホットリロード: はい 1分あたりのウェブ検索リクエスト数です。

WEB_SEARCH_RATE_LIMIT=120

CALCULATOR_RATE_LIMIT

タイプ: 整数
デフォルト: 2000
サービス: LLM Service
ホットリロード: はい 1分あたりの計算ツールリクエスト数です。

CALCULATOR_RATE_LIMIT=2000

PYTHON_EXECUTOR_RATE_LIMIT

タイプ: 整数
デフォルト: 60
サービス: Agent Core
ホットリロード: はい 1分あたりのPythonコード実行リクエスト数です。

PYTHON_EXECUTOR_RATE_LIMIT=60

PARTIAL_CHUNK_CHARS

タイプ: 整数
デフォルト: 512
サービス: LLM Service
ホットリロード: はいストリーミングチャンクごとの文字数です。

PARTIAL_CHUNK_CHARS=512

ツール実行とワークフロー

TOOL_PARALLELISM

タイプ: 整数 デフォルト: 1 範囲: 1-∞（1 = 逐次） サービス: Orchestrator, Agent Core ホットリロード: はい同時ツール実行数です。

TOOL_PARALLELISM=1

影響:

1: 逐次実行（遅い、安全）
5: 5つのツールを並行して実行（速い、リソースを多く使用）
10+: 高い並行性（最速、最高のリソース使用）

ENABLE_TOOL_SELECTION

タイプ: 整数
デフォルト: 1
有効な値: 0, 1
サービス: Orchestrator
ホットリロード: はいプランナーによる自動ツール選択。

ENABLE_TOOL_SELECTION=1

値:

1: プランナーがツールを自動選択（推奨）
0: 手動でツールを指定のみ

PRIORITY_QUEUES

タイプ: 文字列
デフォルト: off
有効な値: on, off
サービス: Orchestrator
ホットリロード: はい優先度に基づくタスクキューの有効化。

PRIORITY_QUEUES=on

STREAMING_RING_CAPACITY

タイプ: 整数
デフォルト: 1000
サービス: Orchestrator
ホットリロード: いいえストリーミングイベントのリングバッファ容量。

STREAMING_RING_CAPACITY=1000

COMPRESSION_TRIGGER_RATIO

タイプ: 浮動小数点数
デフォルト: 0.75
範囲: 0.0-1.0
サービス: Orchestrator
ホットリロード: はいコンテキスト圧縮のトリガー閾値。

COMPRESSION_TRIGGER_RATIO=0.75

影響: トークン予算の75%使用時にコンテキストを圧縮

COMPRESSION_TARGET_RATIO

タイプ: 浮動小数点数
デフォルト: 0.375
範囲: 0.0-1.0
サービス: Orchestrator
ホットリロード: はい圧縮後のターゲットサイズ。

COMPRESSION_TARGET_RATIO=0.375

ENFORCE_TIMEOUT_SECONDS

タイプ: 整数 デフォルト: 90 サービス: Agent Core ホットリロード: はいツール実行のタイムアウト。

ENFORCE_TIMEOUT_SECONDS=90

ENFORCE_MAX_TOKENS

タイプ: 整数
デフォルト: 32768
サービス: Agent Core
ホットリロード: はいエージェント実行ごとの最大トークン数。

ENFORCE_MAX_TOKENS=32768

ENFORCE_RATE_RPS

タイプ: 整数
デフォルト: 20
サービス: Agent Core
ホットリロード: はいエージェント操作のレート制限（秒あたりのリクエスト数）。

ENFORCE_RATE_RPS=20

ENFORCE_CB_ERROR_THRESHOLD

タイプ: 浮動小数点数
デフォルト: 0.5
範囲: 0.0-1.0
サービス: Agent Core
ホットリロード: はいサーキットブレーカーのエラー率閾値。

ENFORCE_CB_ERROR_THRESHOLD=0.5

影響: リクエストの50%が失敗した場合にサーキットが開く

ENFORCE_CB_WINDOW_SECONDS

タイプ: 整数
デフォルト: 30
サービス: Agent Core
ホットリロード: はいサーキットブレーカーの測定ウィンドウ。

ENFORCE_CB_WINDOW_SECONDS=30

ENFORCE_CB_MIN_REQUESTS

タイプ: 整数
デフォルト: 20
サービス: Agent Core
ホットリロード: はいサーキットブレーカーがアクティブになる前の最小リクエスト数。

ENFORCE_CB_MIN_REQUESTS=20

承認とセキュリティ

APPROVAL_ENABLED

タイプ: ブール
デフォルト: false
サービス: Orchestrator
ホットリロード: はい人間による承認を有効化。

APPROVAL_ENABLED=true

APPROVAL_COMPLEXITY_THRESHOLD

タイプ: 浮動小数点数
デフォルト: 0.5
範囲: 0.0-1.0
サービス: Orchestrator
ホットリロード: はい承認が必要な複雑さの閾値。

APPROVAL_COMPLEXITY_THRESHOLD=0.5

APPROVAL_DANGEROUS_TOOLS

タイプ: 文字列（カンマ区切り）
デフォルト: file_system,code_execution
サービス: Orchestrator
ホットリロード: はい承認が必要なツール。

APPROVAL_DANGEROUS_TOOLS=file_system,code_execution,database_query

APPROVAL_TIMEOUT_SECONDS

タイプ: 整数
デフォルト: 1800 サービス: Orchestrator ホットリロード: はい承認リクエストのタイムアウト（30分）。

APPROVAL_TIMEOUT_SECONDS=1800

JWT_SECRET

タイプ: 文字列
デフォルト: development-only-secret-change-in-production
サービス: Gateway
ホットリロード: いいえ JWT署名の秘密。

JWT_SECRET=secure-random-256-bit-key

セキュリティ: 本番環境では必ず変更してください！

GATEWAY_SKIP_AUTH

タイプ: 整数
デフォルト: 1
有効な値: 0, 1
サービス: Gateway
ホットリロード: はい（再起動推奨）認証をスキップ（開発用のみ）。

GATEWAY_SKIP_AUTH=0  # 認証を有効にする

セキュリティ: 本番環境では必ず 0 に設定してください！

テンプレート

TEMPLATE_FALLBACK_ENABLED

タイプ: ブール
デフォルト: false
サービス: Orchestrator
ホットリロード: はいテンプレートが失敗した場合にAIにフォールバック。

TEMPLATE_FALLBACK_ENABLED=true

可観測性とテレメトリー

OTEL_SERVICE_NAME

タイプ: 文字列
デフォルト: shannon-llm-service
サービス: すべて
ホットリロード: いいえ OpenTelemetry用のサービス名。

OTEL_SERVICE_NAME=shannon-llm-service

OTEL_EXPORTER_OTLP_ENDPOINT

タイプ: 文字列
デフォルト: localhost:4317
サービス: すべて
ホットリロード: いいえ OTLPエクスポータのエンドポイント。

OTEL_EXPORTER_OTLP_ENDPOINT=localhost:4317

OTEL_ENABLED

タイプ: ブール
デフォルト: false
サービス: すべて
ホットリロード: いいえ OpenTelemetryトレーシングを有効化。

OTEL_ENABLED=true

LOG_FORMAT

タイプ: 文字列
デフォルト: plain
有効な値: plain, json
サービス: Agent Core (Rust)
ホットリロード: いいえログ出力フォーマット。

LOG_FORMAT=json

METRICS_PORT

タイプ: 整数
デフォルト: 2112
サービス: すべて
ホットリロード: いいえ Prometheusメトリクスポート。

METRICS_PORT=2112

Python WASI Sandbox

PYTHON_WASI_WASM_PATH

タイプ: 文字列
デフォルト: ./wasm-interpreters/python-3.11.4.wasm
サービス: Agent Core, LLM Service
ホットリロード: いいえ Python WASI インタープリタへのパス。

PYTHON_WASI_WASM_PATH=./wasm-interpreters/python-3.11.4.wasm

PYTHON_WASI_SESSION_TIMEOUT

タイプ: 整数
デフォルト: 3600
サービス: LLM Service
ホットリロード: はい Python セッションのタイムアウト（秒）。

PYTHON_WASI_SESSION_TIMEOUT=3600

WASI_MEMORY_LIMIT_MB

タイプ: 整数
デフォルト: 512
サービス: Agent Core
ホットリロード: はい WASI サンドボックスのメモリ制限（MB）。

WASI_MEMORY_LIMIT_MB=512

WASI_TIMEOUT_SECONDS

タイプ: 整数
デフォルト: 60
サービス: Agent Core
ホットリロード: はい WASI 実行のタイムアウト。

WASI_TIMEOUT_SECONDS=60

OpenAPI と MCP

OpenAPI 統合

OPENAPI_ALLOWED_DOMAINS

タイプ: 文字列
デフォルト: *
サービス: LLM Service
ホットリロード: はい OpenAPI スペック取得のための許可されたドメイン。

OPENAPI_ALLOWED_DOMAINS=*
# または特定のドメイン:
OPENAPI_ALLOWED_DOMAINS=api.example.com,api2.example.com

OPENAPI_MAX_SPEC_SIZE

タイプ: 整数
デフォルト: 5242880 (5 MB)
サービス: LLM Service
ホットリロード: はい最大 OpenAPI スペックファイルサイズ。

OPENAPI_MAX_SPEC_SIZE=5242880

OPENAPI_FETCH_TIMEOUT

タイプ: 整数
デフォルト: 30
サービス: LLM Service
ホットリロード: はい OpenAPI スペック取得のタイムアウト。

OPENAPI_FETCH_TIMEOUT=30

OPENAPI_RETRIES

タイプ: 整数
デフォルト: 3 サービス: LLM Service ホットリロード: はい OpenAPI 操作の再試行回数（スペック取得と API 呼び出し）。

OPENAPI_RETRIES=3

MCP 統合

MCP_ALLOWED_DOMAINS

タイプ: 文字列
デフォルト: *
サービス: LLM Service
ホットリロード: はい MCP サーバーのための許可されたドメイン。

MCP_ALLOWED_DOMAINS=*

MCP_MAX_RESPONSE_BYTES

タイプ: 整数
デフォルト: 10485760 (10 MB)
サービス: LLM Service
ホットリロード: はい最大 MCP 応答サイズ。

MCP_MAX_RESPONSE_BYTES=10485760

MCP_RETRIES

タイプ: 整数
デフォルト: 3
サービス: LLM Service
ホットリロード: はい MCP リクエストの再試行回数。

MCP_RETRIES=3

MCP_TIMEOUT_SECONDS

タイプ: 整数
デフォルト: 10
サービス: LLM Service
ホットリロード: はい MCP リクエストのタイムアウト。

MCP_TIMEOUT_SECONDS=10

MCP_REGISTER_TOKEN

タイプ: 文字列
デフォルト: 空
サービス: LLM Service
ホットリロード: はい MCP サーバー登録のための認証トークン。

MCP_REGISTER_TOKEN=secret-token

MCP_RATE_LIMIT_DEFAULT

タイプ: 整数
デフォルト: 60
サービス: LLM Service
ホットリロード: はい MCP ツールのデフォルトレート制限（リクエスト/分）。

MCP_RATE_LIMIT_DEFAULT=60

MCP_CB_FAILURES

タイプ: 整数
デフォルト: 5
サービス: LLM Service
ホットリロード: はい MCP のサーキットブレイカーの失敗閾値。

MCP_CB_FAILURES=5

MCP_CB_RECOVERY_SECONDS

タイプ: 整数
デフォルト: 60
サービス: LLM Service
ホットリロード: はいサーキットブレイカーの回復時間。

MCP_CB_RECOVERY_SECONDS=60

MCP_COST_TO_TOKENS

タイプ: 整数
デフォルト: 0
サービス: LLM Service
ホットリロード: はい MCP ツールのトークンコスト倍率。

MCP_COST_TO_TOKENS=100

高度なオーケストレーター制御

EVENTLOG_BATCH_SIZE

タイプ: 整数
デフォルト: 100
サービス: Orchestrator
ホットリロード: はいデータベース書き込みのバッチあたりのイベント数。

EVENTLOG_BATCH_SIZE=100

EVENTLOG_BATCH_INTERVAL_MS

タイプ: 整数
デフォルト: 100
サービス: Orchestrator
ホットリロード: はいバッチ間隔（ミリ秒）。

EVENTLOG_BATCH_INTERVAL_MS=100

RATE_LIMIT_INTERVAL_MS

タイプ: 整数
デフォルト: 60000
サービス: Orchestrator
ホットリロード: はいレート制限ウィンドウ（ミリ秒）。

RATE_LIMIT_INTERVAL_MS=60000

Worker Concurrency

優先度キューごとの Temporal ワーカーの同時実行数を設定します。

# デフォルトワーカー（すべての優先度）
WORKER_ACT=10
WORKER_WF=10

# クリティカル優先度
WORKER_ACT_CRITICAL=12
WORKER_WF_CRITICAL=12

# 高優先度
WORKER_ACT_HIGH=10
WORKER_WF_HIGH=10

# 通常優先度
WORKER_ACT_NORMAL=8
WORKER_WF_NORMAL=8

# 低優先度
WORKER_ACT_LOW=4
WORKER_WF_LOW=4

影響:

高い値 = より多くの同時実行、より多くのリソース使用
低い値 = より少ない同時実行、より少ないリソース使用

LLM_TIMEOUT_SECONDS

タイプ: 整数
デフォルト: 120
サービス: Orchestrator
ホットリロード: はい LLM API 呼び出しのタイムアウト。

LLM_TIMEOUT_SECONDS=120

その他

SHANNON_WORKSPACE

タイプ: 文字列
デフォルト: ./workspace
サービス: Agent Core
ホットリロード: いいえファイル操作のためのワークスペースディレクトリ。

SHANNON_WORKSPACE=./workspace

SEED_DATA

タイプ: ブール値
デフォルト: false
サービス: すべて
ホットリロード: いいえ起動時に Qdrant にサンプルデータをシードします。

SEED_DATA=true

AGENT_TIMEOUT_SECONDS

タイプ: 整数
デフォルト: 600
サービス: Agent Core
ホットリロード: はいエージェント実行ごとの最大ランタイム。

AGENT_TIMEOUT_SECONDS=600

設定例

開発

ENVIRONMENT=dev
DEBUG=true
GATEWAY_SKIP_AUTH=1
ENABLE_CACHE=true
DEFAULT_MODEL_TIER=small
MAX_COST_PER_REQUEST=0.10
TOOL_PARALLELISM=3

本番

ENVIRONMENT=prod
DEBUG=false
GATEWAY_SKIP_AUTH=0
JWT_SECRET=<secure-256-bit-key>
POSTGRES_PASSWORD=<secure-password>
REDIS_PASSWORD=<secure-password>
ENABLE_CACHE=true
DEFAULT_MODEL_TIER=medium
MAX_COST_PER_REQUEST=1.00
TOOL_PARALLELISM=5
OTEL_ENABLED=true
LOG_FORMAT=json

高パフォーマンス

TOOL_PARALLELISM=10
WORKER_ACT_CRITICAL=30
WORKER_WF_CRITICAL=15
ENABLE_CACHE=true
CACHE_SIMILARITY_THRESHOLD=0.90
STREAMING_RING_CAPACITY=2000

コスト最適化

DEFAULT_MODEL_TIER=small
MAX_COST_PER_REQUEST=0.25
MAX_TOKENS_PER_REQUEST=5000
ENABLE_CACHE=true
CACHE_SIMILARITY_THRESHOLD=0.95
WORKFLOW_SYNTH_BYPASS_SINGLE=true

トラブルシューティング

一般的な問題については、設定トラブルシューティングを参照してください。

Docker Compose

Dockerデプロイメントガイド

Kubernetes

Kubernetesデプロイメント

パフォーマンス調整

パフォーマンスの最適化

セキュリティ

セキュリティ強化

はじめに

クラウドプラットフォーム

運用

​概要

​クイックリファレンス

​設定ファイル

​Core Runtime

​ENVIRONMENT

​DEBUG

​SERVICE_NAME

​LLM Provider API Keys

​OPENAI_API_KEY

​ANTHROPIC_API_KEY

​GOOGLE_API_KEY

​GROQ_API_KEY

​XAI_API_KEY

​DEEPSEEK_API_KEY

​QWEN_API_KEY

​MISTRAL_API_KEY

​AWS_ACCESS_KEY_ID / AWS_SECRET_ACCESS_KEY

​ZAI_API_KEY

​Web Search Providers

​WEB_SEARCH_PROVIDER

​GOOGLE_SEARCH_API_KEY

​SERPER_API_KEY

​BING_API_KEY

​EXA_API_KEY

​FIRECRAWL_API_KEY

​データストア

​PostgreSQL

​POSTGRES_HOST

​POSTGRES_PORT

​POSTGRES_DB

​POSTGRES_USER

​POSTGRES_PASSWORD

​POSTGRES_SSLMODE

​Redis

​REDIS_HOST

​REDIS_PORT

​REDIS_PASSWORD

​REDIS_TTL_SECONDS

​REDIS_URL

​LLM_REDIS_URL

​Qdrant (ベクターストア)

​QDRANT_URL

​QDRANT_HOST / QDRANT_PORT

​サービスエンドポイント

​TEMPORAL_HOST

​LLM_SERVICE_URL

​AGENT_CORE_ADDR

​ORCHESTRATOR_GRPC

​ADMIN_SERVER

​CONFIG_PATH

​MODELS_CONFIG_PATH

​EVENTS_INGEST_URL

​モデルルーティングと予算

​DEFAULT_MODEL_TIER

​COMPLEXITY_MODEL_ID

​DECOMPOSITION_MODEL_ID

​MAX_TOKENS

​TEMPERATURE

​MAX_TOKENS_PER_REQUEST

​MAX_COST_PER_REQUEST

​LLM_DISABLE_BUDGETS

​HISTORY_WINDOW_MESSAGES

​HISTORY_WINDOW_DEBUG_MESSAGES

​WORKFLOW_SYNTH_BYPASS_SINGLE

​TOKEN_BUDGET_PER_AGENT

​TOKEN_BUDGET_PER_TASK

​キャッシュとレート制限

​ENABLE_CACHE

​CACHE_SIMILARITY_THRESHOLD

​RATE_LIMIT_REQUESTS

​RATE_LIMIT_WINDOW

​WEB_SEARCH_RATE_LIMIT

​CALCULATOR_RATE_LIMIT

​PYTHON_EXECUTOR_RATE_LIMIT

​PARTIAL_CHUNK_CHARS

​ツール実行とワークフロー

​TOOL_PARALLELISM

概要