Architektur · Lieferung · Operative Disziplin
Principal Engineer für Teams, die KI-Software ausliefern
Arbeit auf Principal-Niveau zu Architektur, Datenpfaden und Lieferung für KI-getriebene Produkte—Systeme und Teams, nicht isolierte Modellprompts.
Gespräch vereinbarenGeschwindigkeit ist gelöst. Durchhaltevermögen nicht.
Werkzeuge und Agenten machen Code und Dokumentation billig; CI/CD ist selbstverständlich. Die Belastung zeigt sich in Review-Last, Eigentum an dem, was gemerged wurde, und operativen Überraschungen, wenn das Volumen steigt. Hilfreich sind Prozess, klare Guardrails, Automatisierung mit klarem Eigentum und definierte statt improvisierte Aufsicht. Engagements erfolgen mit Führung und Engineering zu diesen Mechaniken—Release-Hygiene, Risikogrenzen und wie die Organisation Tempo hält, ohne Nachvollziehbarkeit zu verlieren.
Kontext
KI-Produkte: Systeme und Organisation, nicht nur das Modell
Lieferzuverlässigkeit, Kosten- und Risikokontrollen sowie Rückkopplung in die Organisation zählen auf einem gesättigten Markt. Die Arbeit mit Kunden betrifft Engineering-Praxis und Systemdesign; Dokumentation und Folien stehen hintan.
Schwerpunkte
Arbeitsthemen
Lieferrhythmus
Pipelines, Umgebungen und Release-Takt. Änderungen reviewbar und nachvollziehbar halten, wenn das Beitragsvolumen steigt.
Systemdesign
Service- und Datenarchitektur für Produkte, die klassische APIs mit LLM-Funktionen verbinden: Kontextgrenzen, Retrieval-Schichten, Latenz, Kosten und Compliance.
Guardrails und Review
Review-, Test- und Rollback-Muster, wenn Automatisierung oder Agenten Code oder Betrieb berühren. Automatisierung mit klaren Verantwortlichen und Auditpunkten.
Team-Betriebsmodell
Rollen, Ownership und wiederkehrende Rituale für kleine Teams bei hoher Merge-Frequenz: wer was freigibt, wie Qualität definiert ist, Onboarding bei schnell wechselnder Codebasis.
Architektur & Plattformen
Plattformen, Daten und Betrieb
Typischer Fokus: Ingestions- und Abfragepfade, Fehlerzuordnung, Produktions-Review. UI- und Service-Frameworks folgen, sobald Grenzen und Datenfluss stehen.
Event-Streaming & Service-Grenzen
Kafka-ähnliche Topologien, wenn Last oder Ordnungsmodell es erfordert: Topics, Consumer Groups, Backpressure, explizite Verträge zwischen Produzenten und Konsumenten. Verhindert implizites Teilen von Zustand über eine einzelne Datenbank.
Telemetrie, wo KI Produktion berührt
OpenTelemetry, Traces und SLIs auf Pfaden mit Modellen oder Tools. Trennt Ausfälle und Kosten zwischen Modell, Retrieval, Integration und Infrastruktur statt generischem Fehler.
Operative Sichtbarkeit
Dashboards und Alerts im Grafana-Stil: Latenz, Fehler, Sättigung, Warteschlangentiefe, Inferenzkosten, Datenfrische. Dieselben Signale für Ops und Engineering-Leads.
Such- & Analyseoberflächen
Elasticsearch oder Äquivalente für Volltext, Log-Suche und große Indizes. Als Produktfläche betreut, wenn Suche Teil des Workflows ist.
Vektorspeicher & Retrieval-Architektur
Milvus-ähnliche Vektordatenbanken, wenn dichtes Retrieval im Scope ist: Collections, Embedding-Refresh, hybride Filter auf strukturierten Feldern, Invalidierung veralteter Vektoren.
Ingestion-Pipelines
Strukturierte und unstrukturierte Eingaben, Schema und Deduplizierung, Anreicherungsschritte, Übergabe in Index oder Analytics-Stores. Ingestion-Fehler propagieren; Design und Monitoring gehören zur gleichen Arbeit.
Semantische Suche & Relevanz
Ranking und Offline-Evaluierung, Trennung transaktionaler Daten vs. Retrieval-Index, Pflege der Korpora für Generierung. Nicht auf Standard-RAG-Vorlagen beschränkt.
Hintergrundarbeit & Analyse
Asynchrone Worker und Langläufer: Re-Embedding, Abgleiche, Batch-Scoring, schwere Transformationen außerhalb des interaktiven Request-Pfads.
BI
Sichten, die Nutzung, Datenqualitätssignale, Modellkosten und Liefermetriken für Produkt- und Engineering-Planung kombinieren.
Anwendungs-Frameworks
React, Next.js, Node, Python, wo das Produkt es braucht. Nachgeordnet zu Architektur, Datenlayout und Observability.
Engagements
Beratung, eingebettet oder Aufräumen
Principal Engineer in Teilzeit, begrenzte Architektur- oder Lieferarbeit oder Neustart nach hohem Merge-Volumen mit schwachem Prozess. Engagements sind zeitlich begrenzt mit vereinbarten Ergebnissen; kein unbefristeter Personaleinsatz zur bloßen Kapazitätserweiterung.
Ausgewählte Engagements
Kundenarbeit steht in der Regel unter Geheimhaltung (NDA). Namen nennende Referenzen oder öffentliche Texte nur mit Zustimmung des Kunden. Fragen Sie bei Bedarf nach Referenzen für Beschaffungsverfahren.
