멀티 모델 라우팅 (Multi-Model Routing)

개요

모든 에이전트 작업에 가장 강력한 모델이 필요한 것은 아닙니다. Decepticon은 LiteLLM을 프록시 레이어로 사용하여, 에이전트 역할별로 서로 다른 모델 티어에 라우팅합니다 — 비용, 속도, 역량의 균형을 최적화합니다.

모델 프로파일

세 가지 내장 프로파일이 각기 다른 용도에 최적화되어 있습니다:

프로파일	오케스트레이터	익스플로잇	정찰	용도
eco	Opus 4.7	Sonnet 4.6	Haiku 4.5	프로덕션 — 최상의 비용/성능 비율 (기본값)
max	Opus 4.7	Opus 4.7	Sonnet 4.6	고가치 타겟 — 최대 성능
test	Haiku 4.5	Haiku 4.5	Haiku 4.5	개발/CI — 빠른 반복

제공자별 전체 티어당 모델 매트릭스:

티어	Anthropic API	Anthropic OAuth	OpenAI	Google	MiniMax
HIGH	claude-opus-4-7	auth/claude-opus-4-7	gpt-5.5	gemini-2.5-pro	MiniMax-M2.5
MID	claude-sonnet-4-6	auth/claude-sonnet-4-6	gpt-5.4	gemini-2.5-flash	MiniMax-M2.5-lightning
LOW	claude-haiku-4-5	auth/claude-haiku-4-5	gpt-5-nano	gemini-2.5-flash-lite	—

대부분의 인게이지먼트에서는 eco 프로파일을 권장합니다. 오케스트레이터는 깊은 추론이 필요하지만(Opus), 정찰 작업은 더 빠르고 저렴한 모델로도 충분합니다.

역할 기반 라우팅

각 에이전트 역할은 서로 다른 인지적 요구사항을 가집니다:

오케스트레이터

목표 시퀀싱, 의존성 해결, 공격 경로 적응을 위한 깊은 추론이 필요합니다. 가장 역량 있는 모델에 라우팅됩니다.

익스플로잇 에이전트

취약점 익스플로잇 및 도구 조작을 위한 강력한 기술적 추론이 필요합니다. 중상위 티어에 라우팅됩니다.

정찰 에이전트

포트 스캔, 서비스 열거, 출력 파싱 등 구조화된 작업을 처리합니다. 더 빠른 모델로도 잘 작동합니다.

포스트 익스플로잇 에이전트

C2 세션을 통한 복잡한 포스트 익스플로잇. 익스플로잇 티어와 유사하게 라우팅됩니다.

자동 폴백

각 티어는 제공자별 폴백 체인을 가지고 있습니다. 기본 프로바이더가 레이트 리밋에 걸리거나 장애가 발생하면, Decepticon이 원활하게 전환합니다:

HIGH:  Opus 4.7   → GPT-5.5    → Gemini 2.5 Pro        → MiniMax-M2.5
MID:   Sonnet 4.6 → GPT-5.4    → Gemini 2.5 Flash      → MiniMax-M2.5-lightning
LOW:   Haiku 4.5  → GPT-5-nano → Gemini 2.5 Flash-Lite

제공자 순서는 DECEPTICON_AUTH_PRIORITY 환경 변수를 통해 구성 가능합니다 (예: anthropic_oauth,anthropic_api,openai_api,google_api,minimax_api). 전환은 투명합니다 — 수동 개입 없이, 작전이 중단되지 않습니다.

프로바이더 지원

LiteLLM 호환 모든 백엔드가 작동합니다:

Anthropic — Claude Opus 4.7, Sonnet 4.6, Haiku 4.5 (API 키 또는 Claude OAuth 구독)
OpenAI — GPT-5.5, GPT-5.4, GPT-5-nano
Google — Gemini 2.5 Pro / Flash / Flash-Lite
MiniMax — MiniMax-M2.5 및 M2.5-lightning
자체 호스팅 — vLLM, Ollama, 또는 OpenAI 호환 엔드포인트

decepticon onboard나 환경 변수를 통해 설정하세요. 자세한 내용은 설정을 참조하세요.

​개요

​모델 프로파일

​역할 기반 라우팅

오케스트레이터

익스플로잇 에이전트

정찰 에이전트

포스트 익스플로잇 에이전트

​자동 폴백

​프로바이더 지원

개요

모델 프로파일

역할 기반 라우팅

자동 폴백

프로바이더 지원