Architektur · Lieferung · Operative Disziplin

    Principal Engineer für Teams, die KI-Software ausliefern

    Arbeit auf Principal-Niveau zu Architektur, Datenpfaden und Lieferung für KI-getriebene Produkte—Systeme und Teams, nicht isolierte Modellprompts.

    Gespräch vereinbaren

    Geschwindigkeit ist gelöst. Durchhaltevermögen nicht.

    Werkzeuge und Agenten machen Code und Dokumentation billig; CI/CD ist selbstverständlich. Die Belastung zeigt sich in Review-Last, Eigentum an dem, was gemerged wurde, und operativen Überraschungen, wenn das Volumen steigt. Hilfreich sind Prozess, klare Guardrails, Automatisierung mit klarem Eigentum und definierte statt improvisierte Aufsicht. Engagements erfolgen mit Führung und Engineering zu diesen Mechaniken—Release-Hygiene, Risikogrenzen und wie die Organisation Tempo hält, ohne Nachvollziehbarkeit zu verlieren.

    Kontext

    KI-Produkte: Systeme und Organisation, nicht nur das Modell

    Lieferzuverlässigkeit, Kosten- und Risikokontrollen sowie Rückkopplung in die Organisation zählen auf einem gesättigten Markt. Die Arbeit mit Kunden betrifft Engineering-Praxis und Systemdesign; Dokumentation und Folien stehen hintan.

    Schwerpunkte

    Arbeitsthemen

    Lieferrhythmus

    Pipelines, Umgebungen und Release-Takt. Änderungen reviewbar und nachvollziehbar halten, wenn das Beitragsvolumen steigt.

    Systemdesign

    Service- und Datenarchitektur für Produkte, die klassische APIs mit LLM-Funktionen verbinden: Kontextgrenzen, Retrieval-Schichten, Latenz, Kosten und Compliance.

    Guardrails und Review

    Review-, Test- und Rollback-Muster, wenn Automatisierung oder Agenten Code oder Betrieb berühren. Automatisierung mit klaren Verantwortlichen und Auditpunkten.

    Team-Betriebsmodell

    Rollen, Ownership und wiederkehrende Rituale für kleine Teams bei hoher Merge-Frequenz: wer was freigibt, wie Qualität definiert ist, Onboarding bei schnell wechselnder Codebasis.

    Architektur & Plattformen

    Plattformen, Daten und Betrieb

    Typischer Fokus: Ingestions- und Abfragepfade, Fehlerzuordnung, Produktions-Review. UI- und Service-Frameworks folgen, sobald Grenzen und Datenfluss stehen.

    Event-Streaming & Service-Grenzen

    Kafka-ähnliche Topologien, wenn Last oder Ordnungsmodell es erfordert: Topics, Consumer Groups, Backpressure, explizite Verträge zwischen Produzenten und Konsumenten. Verhindert implizites Teilen von Zustand über eine einzelne Datenbank.

    Telemetrie, wo KI Produktion berührt

    OpenTelemetry, Traces und SLIs auf Pfaden mit Modellen oder Tools. Trennt Ausfälle und Kosten zwischen Modell, Retrieval, Integration und Infrastruktur statt generischem Fehler.

    Operative Sichtbarkeit

    Dashboards und Alerts im Grafana-Stil: Latenz, Fehler, Sättigung, Warteschlangentiefe, Inferenzkosten, Datenfrische. Dieselben Signale für Ops und Engineering-Leads.

    Such- & Analyseoberflächen

    Elasticsearch oder Äquivalente für Volltext, Log-Suche und große Indizes. Als Produktfläche betreut, wenn Suche Teil des Workflows ist.

    Vektorspeicher & Retrieval-Architektur

    Milvus-ähnliche Vektordatenbanken, wenn dichtes Retrieval im Scope ist: Collections, Embedding-Refresh, hybride Filter auf strukturierten Feldern, Invalidierung veralteter Vektoren.

    Ingestion-Pipelines

    Strukturierte und unstrukturierte Eingaben, Schema und Deduplizierung, Anreicherungsschritte, Übergabe in Index oder Analytics-Stores. Ingestion-Fehler propagieren; Design und Monitoring gehören zur gleichen Arbeit.

    Semantische Suche & Relevanz

    Ranking und Offline-Evaluierung, Trennung transaktionaler Daten vs. Retrieval-Index, Pflege der Korpora für Generierung. Nicht auf Standard-RAG-Vorlagen beschränkt.

    Hintergrundarbeit & Analyse

    Asynchrone Worker und Langläufer: Re-Embedding, Abgleiche, Batch-Scoring, schwere Transformationen außerhalb des interaktiven Request-Pfads.

    BI

    Sichten, die Nutzung, Datenqualitätssignale, Modellkosten und Liefermetriken für Produkt- und Engineering-Planung kombinieren.

    Anwendungs-Frameworks

    React, Next.js, Node, Python, wo das Produkt es braucht. Nachgeordnet zu Architektur, Datenlayout und Observability.

    Engagements

    Beratung, eingebettet oder Aufräumen

    Principal Engineer in Teilzeit, begrenzte Architektur- oder Lieferarbeit oder Neustart nach hohem Merge-Volumen mit schwachem Prozess. Engagements sind zeitlich begrenzt mit vereinbarten Ergebnissen; kein unbefristeter Personaleinsatz zur bloßen Kapazitätserweiterung.

    Standardmäßig vertraulich

    Ausgewählte Engagements

    Kundenarbeit steht in der Regel unter Geheimhaltung (NDA). Namen nennende Referenzen oder öffentliche Texte nur mit Zustimmung des Kunden. Fragen Sie bei Bedarf nach Referenzen für Beschaffungsverfahren.