Aufgaben
- Gestaltung, Aufbau und Betrieb skalierbarer Cloud-, On-Prem- und Hybrid-Infrastrukturen auf Basis von IaC-Tools wie Terraform, Terragrunt oder Ansible
- Automatisierung des gesamten Kubernetes-Lifecycles – von Provisionierung und Upgrades bis hin zu stabilen, sicheren Cluster-Deployments
- Entwicklung und Optimierung von CI/CD-Pipelines für Infrastruktur- und Applikationsartefakte sowie Umsetzung von GitOps-Workflows mit FluxCD
- Sicherstellung einer vollständigen Observability über Metriken, Logs, Tracing, Dashboards und Alerting, inklusive Analyse von Incidents und Systemverhalten
- Einführung und Betrieb von DevSecOps-Praktiken wie Vulnerability Scanning, Geheimnis-Management, Policy Enforcement und Plattform-Hardening
- Durchführung von Reliability-Initiativen wie High-Availability-Konzepten, Chaos-/Fault-Testing, Kapazitätsanalysen und Performance-Optimierung
- Enge Zusammenarbeit mit Engineering-Teams bei Architektur, Fehleranalysen und Designentscheidungen, um verteilte Systeme stabil und zuverlässig zu betreiben
- Einsatz moderner AI-Coding-Assistenten (Copilot, Cursor, Claude Code) im IaC-Kontext und Aufbau von AI-gestützten Guardrails zur Prävention fehlerhafter Konfigurationen
Profil
- Mehrjährige Erfahrung im DevOps-, Platform- oder Site-Reliability-Engineering-Umfeld
- Tiefe praktische Kenntnisse in der Arbeit mit Kubernetes (idealerweise produktiv + CKA-Niveau oder gleichwertige Erfahrung)
- Sehr gutes Verständnis von Infrastructure as Code, bevorzugt mit Terraform, Terragrunt, Ansible oder Crossplane
- Routine im Aufbau und Betrieb moderner CI/CD-Pipelines (z.?B. GitLab CI, GitHub Actions, Jenkins)
- Vertraut mit GitOps-Methoden wie FluxCD oder ArgoCD
- Solide Kenntnisse in Observability-Stacks wie Prometheus, Grafana, SigNoz oder ELK
- Erfahrung mit DevSecOps-Ansätzen: Vulnerability Scanning, Secret-Management, Policy-Frameworks.
- Sehr gute Englischkenntnisse; Deutsch ist ein Plus
- Optional von Vorteil: Erfahrung mit Bare-Metal-/Hybrid-Kubernetes, Scripting (Bash/Python), Chaos Engineering, Performance-Optimierung oder Nutzung von AI-Tools im Infrastrukturkontext
- Bereitschaft zur Teilnahme an Sicherheitsüberprüfungen (SÜG) je nach Projektumfeld
Benefits
- Arbeiten Sie an einer Plattform, die es Entwicklerteams ermöglicht, Ideen schneller, sicherer und effizienter in Produktion zu bringen
- Nutzen Sie ein zukunftsorientiertes Technologieumfeld mit Tools wie Terraform, Kubernetes, FluxCD und SigNoz und gestalten Sie technische Standards aktiv mit
- Kombinieren Sie Homeoffice – inklusive hochwertiger technischer Ausstattung für produktives Arbeiten
- Vertiefen Sie Ihre technischen Fähigkeiten, evaluieren Sie neue Technologien und wirken Sie aktiv an der Weiterentwicklung der Engineering-Kultur mit.
- 30 Tage Urlaub