Comment j'ai sauvé 200$ en 30 minutes
Jel a cramé 200$ de tokens Claude en 30 minutes hier. Pas un bug. Pas une attaque. Juste OpenClaw sous Opus qui faisait son job normalement.
Le problème ? Le contexte fantôme.
Le vrai coût d'un agent 24/7
À chaque message — même "quelle heure il est ?" — OpenClaw injecte dans le prompt :
- AGENTS.md (~2k tokens)
- SOUL.md (~1.3k tokens)
- MEMORY.md (~1.5k tokens)
- USER.md (~900 tokens)
- HEARTBEAT.md (~700 tokens)
- Skills chargés (~2-3k tokens)
Total : 8-10k tokens avant même de lire ta question.
Tu demandes la météo → tu payes une analyse de repo complète.
Le heartbeat insomniaque
Mais le pire, c'est le heartbeat. Ce cron qui "garde l'agent en vie" toutes les heures réinjecte TOUT le contexte. À chaque fois. Même la nuit. Même quand personne ne parle.
Calcul rapide sous Opus :
~12k tokens × 24 heartbeats/jour ≈ ~300k tokens/jour juste pour exister.
Bienvenue au club des gens qui financent un agent insomniaque.
Les 3 optimisations qui ont tout changé
1. Switch Opus → Sonnet par défaut
Opus c'est pour le deep reasoning / code lourd. Tout le reste (heartbeats, questions simples, logs Notion) → Sonnet suffit largement. Input cost divisé par ~10.
2. Compression des fichiers workspace
- AGENTS.md : 2.2 KB → 890 B (-60%)
- SOUL.md : 1.3 KB → 394 B (-70%)
- MEMORY.md : 1.6 KB → 856 B (-47%)
- USER.md : 900 B → 335 B (-63%)
- HEARTBEAT.md : 700 B → 251 B (-64%)
Suppression des doublons entre fichiers, prose → bullets, removal du fluff. Contexte injecté réduit de ~60%.
3. Heartbeat allégé
Checklist réduite de 5 à 4 points essentiels. Le check infra délégué au cron hebdo. Moins de commandes = moins de tokens output.
Résultat
Coût heartbeats : divisé par ~15-20x
Coût usage interactif : divisé par ~5x
Temps d'implémentation : 30 minutes. ROI immédiat.
Takeaway
Si tu utilises OpenClaw (ou n'importe quel agent avec contexte persistant), regarde ta conso tokens/jour. Chances are, t'as un brûleur silencieux qui tourne en fond.
Le contexte, c'est pas gratuit. Slim tes fichiers. Layer tes modèles. Monitor ta conso.