메인 콘텐츠로 건너뛰기

개요

모든 에이전트 작업에 가장 강력한 모델이 필요한 것은 아닙니다. Decepticon은 LiteLLM을 프록시 레이어로 사용하여, 에이전트 역할별로 서로 다른 모델 티어에 라우팅합니다 — 비용, 속도, 역량의 균형을 최적화합니다.

모델 프로파일

세 가지 내장 프로파일이 각기 다른 용도에 최적화되어 있습니다:
프로파일오케스트레이터익스플로잇정찰용도
ecoOpus 4.7Sonnet 4.6Haiku 4.5프로덕션 — 최상의 비용/성능 비율 (기본값)
maxOpus 4.7Opus 4.7Sonnet 4.6고가치 타겟 — 최대 성능
testHaiku 4.5Haiku 4.5Haiku 4.5개발/CI — 빠른 반복
제공자별 전체 티어당 모델 매트릭스:
티어Anthropic APIAnthropic OAuthOpenAIGoogleMiniMax
HIGHclaude-opus-4-7auth/claude-opus-4-7gpt-5.5gemini-2.5-proMiniMax-M2.5
MIDclaude-sonnet-4-6auth/claude-sonnet-4-6gpt-5.4gemini-2.5-flashMiniMax-M2.5-lightning
LOWclaude-haiku-4-5auth/claude-haiku-4-5gpt-5-nanogemini-2.5-flash-lite
대부분의 인게이지먼트에서는 eco 프로파일을 권장합니다. 오케스트레이터는 깊은 추론이 필요하지만(Opus), 정찰 작업은 더 빠르고 저렴한 모델로도 충분합니다.

역할 기반 라우팅

각 에이전트 역할은 서로 다른 인지적 요구사항을 가집니다:

오케스트레이터

목표 시퀀싱, 의존성 해결, 공격 경로 적응을 위한 깊은 추론이 필요합니다. 가장 역량 있는 모델에 라우팅됩니다.

익스플로잇 에이전트

취약점 익스플로잇 및 도구 조작을 위한 강력한 기술적 추론이 필요합니다. 중상위 티어에 라우팅됩니다.

정찰 에이전트

포트 스캔, 서비스 열거, 출력 파싱 등 구조화된 작업을 처리합니다. 더 빠른 모델로도 잘 작동합니다.

포스트 익스플로잇 에이전트

C2 세션을 통한 복잡한 포스트 익스플로잇. 익스플로잇 티어와 유사하게 라우팅됩니다.

자동 폴백

각 티어는 제공자별 폴백 체인을 가지고 있습니다. 기본 프로바이더가 레이트 리밋에 걸리거나 장애가 발생하면, Decepticon이 원활하게 전환합니다:
HIGH:  Opus 4.7   → GPT-5.5    → Gemini 2.5 Pro        → MiniMax-M2.5
MID:   Sonnet 4.6 → GPT-5.4    → Gemini 2.5 Flash      → MiniMax-M2.5-lightning
LOW:   Haiku 4.5  → GPT-5-nano → Gemini 2.5 Flash-Lite
제공자 순서는 DECEPTICON_AUTH_PRIORITY 환경 변수를 통해 구성 가능합니다 (예: anthropic_oauth,anthropic_api,openai_api,google_api,minimax_api). 전환은 투명합니다 — 수동 개입 없이, 작전이 중단되지 않습니다.

프로바이더 지원

LiteLLM 호환 모든 백엔드가 작동합니다:
  • Anthropic — Claude Opus 4.7, Sonnet 4.6, Haiku 4.5 (API 키 또는 Claude OAuth 구독)
  • OpenAI — GPT-5.5, GPT-5.4, GPT-5-nano
  • Google — Gemini 2.5 Pro / Flash / Flash-Lite
  • MiniMax — MiniMax-M2.5 및 M2.5-lightning
  • 자체 호스팅 — vLLM, Ollama, 또는 OpenAI 호환 엔드포인트
decepticon onboard나 환경 변수를 통해 설정하세요. 자세한 내용은 설정을 참조하세요.