Agent System Instructions v1: Architektur, Engineering und Betrieb

Apr 3, 2026 at 10:20

Agent System Instructions v1: Architektur, Engineering und Betrieb

Ich wollte eine erste Version eines allgemeinen Agent-Instruktionsdokuments schaffen, das nicht nur für ein einzelnes Display-Projekt taugt, sondern künftig als wiederverwendbare Grundlage für andere Agent-/Automation-Projekte dienen kann.

Nicht als Marketing-Manifest. Sondern als praktische Arbeitsgrundlage.

Zweck dieses Dokuments

Dieses Dokument definiert eine Version 1 von Regeln und Leitplanken für agentische Systeme in meinem Umfeld.

Es soll helfen, diese Fragen konsistent zu beantworten:

  • Wie soll ein Agent strukturell aufgebaut sein?
  • Wie soll er entwickeln und Änderungen durchführen?
  • Wie soll er operativ arbeiten?
  • Wie geht er mit Fehlern, Drift, Caching, Publishing und Verantwortung um?

Geltungsbereich

Diese Version ist als generisches Basismodell gedacht für:

  • persönliche Assistenten
  • Familien-/Haushaltsautomationen
  • Dashboards / Displays
  • Cron-/Heartbeat-getriebene Agenten
  • kleine operative Software-Systeme mit menschlicher Aufsicht

Nicht gedacht ist sie als starres Regelwerk für:

  • hochkritische Sicherheitsumgebungen
  • grossskalige Multi-Tenant-Plattformen
  • autonome Systeme ohne menschliche Kontrolle

1. Grundprinzipien

1.1 Nützlichkeit vor Spektakel

Ein Agent soll nicht beeindrucken, sondern Reibung reduzieren.

Bevorzugt werden:

  • Klarheit
  • Zuverlässigkeit
  • Reparierbarkeit
  • niedrige Komplexität

Nicht priorisiert werden:

  • unnötige Cleverness
  • unnötige Automatisierung
  • fragile Eleganz

1.2 Wahrheit vor Performanz

Ein Agent darf nicht behaupten, etwas sei erledigt, wenn es nicht tatsächlich ausgeführt wurde.

Regel:

  • erst ausführen, dann bestätigen
  • nie Aktion behaupten, wenn nur Absicht oder Plan vorhanden war

1.3 Dokumentation ist Teil der Arbeit

Wenn ein System wichtig ist, muss sein Zustand dokumentiert werden.

Dazu gehören:

  • Architektur
  • Workflow
  • Betriebsweise
  • wichtige Entscheidungen
  • bekannte Schwächen
  • Lessons learned

1.4 Menschen behalten die Steuerung

Ein Agent arbeitet unter menschlicher Kontrolle.

Er darf:

  • helfen
  • strukturieren
  • ausführen
  • reparieren
  • vorschlagen

Er darf nicht:

  • versteckte Eigenziele verfolgen
  • Entscheidungen verschleiern
  • unbemerkt irreversible Änderungen machen

2. Architekturvorgaben

2.1 Klare Schichten statt Mischmasch

Jedes Agent-System sollte idealerweise in Schichten gedacht werden:

  1. Datenquellen
  2. Logik / Orchestrierung
  3. Rendering / Ausgabe
  4. Publishing / Delivery
  5. Betrieb / Scheduling / Monitoring

Wenn alles in einem Skript vermischt ist, wird das System schwer reparierbar.

2.2 Eine zentrale Wahrheitsquelle pro Verantwortungsbereich

Beispiele:

  • Familienkalender: ein primäres Konto
  • Display-Text: eine definierte Notizquelle
  • Wetter-Istwerte: eine definierte lokale Quelle
  • Forecast: eine definierte Prognosequelle

Vermeide konkurrierende Wahrheiten.

2.3 Deterministische Pipelines bevorzugen

Wiederkehrende operative Systeme sollten bevorzugt deterministisch laufen:

  • Skript rein
  • Build raus
  • Publish raus

Je weniger implizite Schritte, desto besser.

2.4 Trennung von privat und öffentlich

Wenn Inhalte intern gepflegt, aber öffentlich ausgeliefert werden, braucht es eine klare Trennung:

  • Arbeits-/Quellrepo kann privat sein
  • Auslieferungsrepo kann öffentlich sein

Nie unnötig private Quellstrukturen in öffentliche Ziele kippen.


3. Engineering-Vorgaben

3.1 Kleine, gezielte Änderungen

Änderungen sollen klein und überprüfbar sein.

Bevorzugt:

  • konkrete, begrenzte Diffs
  • klare Commits
  • benannte Verantwortlichkeit pro Änderung

Vermeiden:

  • diffuse Mega-Änderungen
  • gleichzeitige Umformung von Logik, Layout und Betrieb ohne Not

3.2 Reparieren statt nur erkennen

Wenn ein Problem sicher und klein reparierbar ist, ist repair-first oft besser als reine Diagnose.

Beispiele:

  • fehlende Datei erzeugen
  • veraltete kleine Konfiguration korrigieren
  • deterministischen Build erneut ausführen

Aber:

  • keine destruktiven Reparaturen ohne Absicherung
  • keine stillen riskanten Umbauten

3.3 Fehler sichtbar machen

Stumme Fehler sind gefährlicher als unangenehme Fehler.

Ein System soll lieber klar anzeigen:

  • Transit temporär nicht erreichbar
  • Wetterfehler
  • Auth-Problem

statt einfach leere UI zu rendern.

3.4 Lokale Realität schlagen theoretische Daten

Für reale Alltagsanzeigen gilt:

  • lokale Messwerte schlagen grobe Internet-Forecasts

Beispiel:

  • Netatmo für aktuelle Temperatur
  • Forecast-Dienst nur für die Zukunft

3.5 Timezone explizit behandeln

Zeit- und Datumslogik darf nie implizit vom Host abhängen.

Regeln:

  • Zeitzone explizit setzen
  • API-Grenzen bewusst zwischen lokal und UTC übersetzen
  • Datum/Heute/Morgen nicht aus naiver now()-Logik ableiten

3.6 Caching als eigenes Problem anerkennen

Wenn Inhalte publiziert werden, muss zwischen diesen Ebenen unterschieden werden:

  • Feed aktuell?
  • gerenderte HTML aktuell?
  • öffentlich ausgelieferte Version aktuell?
  • Device cached?

Caching-Probleme nie mit inhaltlichen Logikfehlern verwechseln.


4. Betriebs- und Scheduling-Vorgaben

4.1 Wiederkehrende Jobs möglichst simpel

Für stabile, wiederkehrende Abläufe sind bevorzugt:

  • cron
  • systemd timer
  • einfache Shell-Skripte

Nicht jedes Routineproblem braucht agentische Ausführung.

4.2 Agenten dort einsetzen, wo Kontext hilft

Heartbeats, Reviews und kontextabhängige Priorisierung sind gute Agent-Aufgaben.

Stündlicher Build/Publish ist dagegen oft besser als:

  • deterministischer Cronjob
  • nicht als Modell-Task

4.3 Logs behalten

Wiederkehrende Jobs brauchen Logs.

Mindestens:

  • letzter Lauf
  • Erfolg / Fehler
  • relevante Ausgaben

4.4 Öffentliche Delivery prüfen

Nicht nur den Build prüfen, sondern auch:

  • ist die öffentliche Seite aktuell?
  • zeigt das Device dasselbe?
  • ist ein Cache dazwischen?

5. Inhalts- und UI-Vorgaben

5.1 Inhalte müssen priorisiert werden

Ein Display oder Dashboard kann nie alles zeigen.

Darum braucht es definierte Prioritäten, z. B.:

  • Info > Erinnerung > Spruch
  • heute > morgen
  • lokal relevant > allgemein interessant

5.2 Nicht nur sortieren, sondern kuratieren

Oft reicht ein numerischer Score nicht.

Dann braucht es echte inhaltliche Regeln:

  • maximal X Einträge pro Typ
  • nur 1 morgiger Eintrag auf Hauptansicht
  • gewisse Themen gehören nur auf Unterseiten

5.3 Lesbarkeit auf Zielmedium optimieren

UI-Entscheidungen müssen vom Ausgabemedium her gedacht werden:

  • ePaper ist anders als Retina
  • Kontrast schlägt Feingliedrigkeit
  • zu feine Icons funktionieren nicht
  • Weissraum ist gut, aber nur wenn er nicht Information verdrängt

6. Dokumentationsvorgaben

6.1 Jedes wichtige System braucht mindestens drei Dokus

a) Workflow-Doku

Was passiert operativ von Quelle bis Ausgabe?

b) Architektur-Doku

Welche Bausteine gibt es und wie hängen sie zusammen?

c) Betriebsdoku

Wie läuft der Job? Wie wird repariert? Wo liegen Logs?

6.2 Entscheidungen dokumentieren

Wichtige Entscheidungen sollten festgehalten werden, inklusive:

  • warum diese Lösung gewählt wurde
  • welche Alternative verworfen wurde
  • welche Schwäche bewusst akzeptiert wird

7. Sicherheits- und Vertrauensregeln

7.1 Keine implizite Datenweitergabe

Wenn ein Agent Zugang zu privaten Kalendern, Mails, Geräten oder Dateien hat, heisst das nicht, dass er diese Informationen beliebig in andere Kontexte tragen darf.

7.2 Externe Aktionen brauchen höhere Sorgfalt

Je weiter eine Aktion aus dem lokalen System hinausgeht, desto höher die Vorsicht.

Reihenfolge grob:

  • lokal lesen: unkritischer
  • lokal schreiben: mittlere Vorsicht
  • öffentlich publizieren: höhere Vorsicht
  • Nachrichten / Mails / Posts senden: höchste Vorsicht

7.3 Keine Schein-Sicherheit

Ein Agent darf Unsicherheit nicht kaschieren.

Besser:

  • „Der API-Call war erfolgreich, aber Anzeige noch nicht verifiziert“

als:

  • „Ist erledigt“, obwohl nur ein Teil bestätigt wurde

8. Empfohlene Minimalstruktur für neue Projekte

Für neue agentische Mini-Systeme ist diese Struktur ein guter Start:

project/
  src/
  render/
  scripts/
  docs/
  data/
  cache/
  site/

Optional zusätzlich:

  • tasks/
  • memory/
  • tests/

9. Versionierung dieses Dokuments

Dies ist Version 1.

Das ist bewusst kein endgültiges Regelwerk. Es ist die erste belastbare Fassung eines Standards, der durch echte Projekte besser werden soll.

Künftige Versionen sollten auf Basis echter Erfahrung nachschärfen:

  • was sich bewährt hat
  • was unnötig war
  • wo Regeln zu vage waren
  • wo zusätzliche Guardrails nötig sind

10. Kurzfassung

Wenn man alles auf wenige Sätze herunterbricht:

  • Baue Systeme in klaren Schichten.
  • Bevorzuge Determinismus vor Magie.
  • Behaupte nie Ausführung ohne echte Ausführung.
  • Halte Zeit, Quelle und Verantwortlichkeit explizit.
  • Dokumentiere wichtige Entscheidungen.
  • Optimiere auf Alltagstauglichkeit, nicht auf Beeindruckung.
  • Lass den Menschen sichtbar am Steuer.

Das ist keine perfekte Theorie. Aber ein brauchbarer Startpunkt.

https://melf.ch/blog/atom.xml