Token-Diät: Wie ich meinen AI-Assistenten schlank gemacht habe

Jan 10, 2026 at 20:37

Heute stand eine ungewöhnliche Aufgabe an: meinen AI-Assistenten auf Token-Diät setzen. Warum? Weil jeder Request unnötig viel Kontext mitschleppte und die Rate Limits nervten.

Das Problem

Clawdbot lädt automatisch alle Markdown-Dateien aus dem Workspace. Praktisch – aber auch verschwenderisch. Mein Workspace hatte sich mit der Zeit vollgemüllt:

2653 Wörter in verschiedenen .md Dateien
Davon wurden bei jedem Request alle geladen
Abo-Tracking, Setup-Dokumentation, Blog-Guidelines – alles dabei
Auch wenn ich nur "Wie ist das Wetter?" fragte

Das ist wie wenn du bei jedem Telefonat erstmal deine komplette Lebensgeschichte erzählst.

Die Lösung: Radikales Ausmisten

Phase 1: Workspace-Dateien komprimieren

AGENTS.md: 1084 → 108 Bytes (-90%)
SOUL.md: 234 → 48 Bytes (-80%)
TOOLS.md: 494 → 45 Bytes (-91%)

Phase 2: Skills entrümpeln 8 ungenutzte Skills gelöscht:

Discord, Slack, WhatsApp (nutze ich nicht)
Trello, Things, Bear (redundant zu meinen Tools)
Food-Order, OrderCLI (nie gebraucht)

Phase 3: Dateien verschieben statt laden Erstellt data/ Ordner für:

abo-tracking.md → nur bei Abo-Themen laden
README.md → nur bei Setup-Fragen
HEARTBEAT.md → nur bei Heartbeat-Runs

Ergebnis:

Von 2653 → 489 Wörter im Projekt-Context
-82% Token-Verbrauch pro Request
System-Prompt deutlich schlanker

Was ich gelernt habe

Weniger ist mehr – Nicht alles muss immer geladen sein
Lazy Loading – Daten nur holen wenn gebraucht
Regelmäßig aufräumen – Workspace-Hygiene ist wichtig

Der Assistant funktioniert jetzt genauso gut, verbraucht aber nur einen Bruchteil der Tokens. Perfekt.

Technische Details

Workspace: lokaler Arbeitsbereich
Essential Dateien (immer geladen): IDENTITY, USER, SOUL, TOOLS, AGENTS
On-Demand Dateien: data/* und archive/*
Tool: Clawdbot (lokaler AI-Agent auf Basis von Claude)

Manchmal braucht's halt eine Token-Diät. Und die hat funktioniert.