AI Agents können schnell teuer werden — insbesondere bei GPT-4-class-Modellen und hohem Volumen. OpenClaw bietet granulares Kosten-Tracking und datengestützte Optimierungsempfehlungen.
OpenClaw berechnet Kosten pro Trace basierend auf aktuellen Modellpreisen:
Trace: order-processing-agent (tr_x9k2m1)
─────────────────────────────────────────
Modell: gpt-4o (2025-08-06)
Input Tokens: 1,245 × $2.50/1M = $0.003113
Output Tokens: 389 × $10.00/1M = $0.003890
Tool Calls: 2 × avg $0.001 = $0.002000
Embedding: 1 × 512 tokens = $0.000051
─────────────────────────────────────────
Gesamt: $0.009054
| Dimension | Beispiel | Nutzen |
|---|---|---|
| Per Agent | Support Agent: €847/Monat | Agent-Level-Budgets |
| Per Team | Sales Team: €2.100/Monat | Abteilungs-Allokation |
| Per Project | Onboarding Flow: €340/Monat | Projekt-ROI |
| Per Customer | Mandant A: €120/Monat | Mandanten-Abrechnung |
| Per Model | GPT-4o: €3.200/Monat | Modell-Vergleich |
OpenClaw ordnet Kosten automatisch zu:
with oc.trace("support-agent") as trace:
trace.set_cost_center({
"team": "customer-success",
"project": "tier-1-support",
"budget_id": "CS-2026-Q1"
})
# budgets.yml
budgets:
- id: CS-2026-Q1
name: "Customer Success Q1 2026"
limit: 5000 EUR
period: quarterly
alerts:
- at: 50% # €2.500
channels: [email]
- at: 80% # €4.000
channels: [slack, email]
- at: 95% # €4.750
channels: [slack, pagerduty, email]
- at: 100% # €5.000
action: throttle # Agent-Throughput reduzieren
OpenClaw warnt proaktiv:
OpenClaw analysiert Nutzungsmuster und gibt konkrete Empfehlungen:
Empfehlung: Modell-Downgrade für intent-classification
──────────────────────────────────────────────────────
Aktuell: gpt-4o ($2.50/$10.00 per 1M tokens)
Empfohlen: gpt-4o-mini ($0.15/$0.60 per 1M tokens)
Grund: Accuracy-Differenz nur 0,3% bei diesem Task
Ersparnis: ~€420/Monat (94% Reduktion für diesen Span)
Empfehlung: Prompt-Komprimierung für support-agent
──────────────────────────────────────────────────
Aktuell: Durchschnittlich 2.100 Input-Tokens pro Call
Problem: System-Prompt enthält 1.400 redundante Tokens
Empfohlen: Prompt auf 700 Tokens kürzen (Few-Shot → Instruction)
Ersparnis: ~€180/Monat (33% Reduktion Input-Kosten)
Empfehlung: Semantic Cache für FAQ-Anfragen
──────────────────────────────────────────
Aktuell: 68% der Support-Anfragen sind wiederkehrend
Empfohlen: Semantic Cache mit 0.95 Similarity-Threshold
Ersparnis: ~€560/Monat (Cache-Hit eliminiert LLM-Call)
Das Kosten-Dashboard zeigt:
Best Practice: Setzen Sie von Anfang an Cost Centers und Budgets auf. Ohne klare Kostenzuordnung wachsen AI-Ausgaben unkontrolliert. Die meisten Unternehmen sind überrascht, wenn sie erstmals sehen, was einzelne Agents tatsächlich kosten.