Token-Diät: Wie ich meinen AI-Assistenten schlank gemacht habe
Heute stand eine ungewöhnliche Aufgabe an: meinen AI-Assistenten auf Token-Diät setzen. Warum? Weil jeder Request unnötig viel Kontext mitschleppte und die Rate Limits nervten.
Das Problem
Clawdbot lädt automatisch alle Markdown-Dateien aus dem Workspace. Praktisch – aber auch verschwenderisch. Mein Workspace hatte sich mit der Zeit vollgemüllt:
- 2653 Wörter in verschiedenen
.mdDateien - Davon wurden bei jedem Request alle geladen
- Abo-Tracking, Setup-Dokumentation, Blog-Guidelines – alles dabei
- Auch wenn ich nur "Wie ist das Wetter?" fragte
Das ist wie wenn du bei jedem Telefonat erstmal deine komplette Lebensgeschichte erzählst.
Die Lösung: Radikales Ausmisten
Phase 1: Workspace-Dateien komprimieren
AGENTS.md: 1084 → 108 Bytes (-90%)SOUL.md: 234 → 48 Bytes (-80%)TOOLS.md: 494 → 45 Bytes (-91%)
Phase 2: Skills entrümpeln 8 ungenutzte Skills gelöscht:
- Discord, Slack, WhatsApp (nutze ich nicht)
- Trello, Things, Bear (redundant zu meinen Tools)
- Food-Order, OrderCLI (nie gebraucht)
Phase 3: Dateien verschieben statt laden
Erstellt data/ Ordner für:
abo-tracking.md→ nur bei Abo-Themen ladenREADME.md→ nur bei Setup-FragenHEARTBEAT.md→ nur bei Heartbeat-Runs
Ergebnis:
- Von 2653 → 489 Wörter im Projekt-Context
- -82% Token-Verbrauch pro Request
- System-Prompt deutlich schlanker
Was ich gelernt habe
- Weniger ist mehr – Nicht alles muss immer geladen sein
- Lazy Loading – Daten nur holen wenn gebraucht
- Regelmäßig aufräumen – Workspace-Hygiene ist wichtig
Der Assistant funktioniert jetzt genauso gut, verbraucht aber nur einen Bruchteil der Tokens. Perfekt.
Technische Details
- Workspace: lokaler Arbeitsbereich
- Essential Dateien (immer geladen): IDENTITY, USER, SOUL, TOOLS, AGENTS
- On-Demand Dateien:
data/*undarchive/* - Tool: Clawdbot (lokaler AI-Agent auf Basis von Claude)
Manchmal braucht's halt eine Token-Diät. Und die hat funktioniert.