Aufgaben
- Design, Installation und Automatisierung einer hochverfügbaren Kubernetes-Plattform gehören zu deinen Kernaufgaben. Du planst Upgrades, implementierst Backup- und Disaster-Recovery-Strategien und sorgst dafür, dass das System jederzeit einsatzbereit bleibt.
- Als Plattform-Owner stellst du internen End-User-Teams zuverlässige PaaS- und SaaS-Services zur Verfügung, berätst bei Architektur- und Deploy-Strategien und reagierst proaktiv auf deren Anforderungen. Du überwachst kontinuierlich die Einhaltung der Service Level Agreements.
- Du entwickelst deklarative IaC-Playbooks und setzt moderne GitOps-Pipelines (Argo CD/Flux) ein, sodass Infrastrukturänderungen nachvollziehbar versioniert und automatisch ausgerollt werden.
- Du etablierst sichere Build-Pipelines, betreibst ein privates Container-Registry und implementierst Runtime-Security nach Best Practices.
- Du implementierst und betreibst einen vollständigen Observability-Stack, richtest aussagekräftige Kennzahlen und Service Level Agreements (SLAs) ein, bearbeitest Alerts in Echtzeit und führst tiefergehende Root-Cause-Analysen durch. Die Ergebnisse dokumentierst du in umfassenden Reports und Runbooks, um zukünftige Vorfälle effizient zu bewältigen.
- Das Lifecycle-Management der Linux-Hosts liegt in deiner Verantwortung. Du automatisierst Patch- und Hardening-Prozesse nach CIS-Benchmarks und gewährleistest durch proaktives Monitoring eine lückenlose Security-Compliance.
Profil
- Du hast eine abgeschlossene IT-Ausbildung oder ein Informatikstudium sowie idealerweise CKA/CKAD- oder LFCS-Zertifizierungen und mehrjährige Berufserfahrung mit Kubernetes-Umgebungen
- Du planst, installierst und betreibst produktive On-Premise-Kubernetes-Clusterbare metal oder virtualisiertund führst reibungslose Upgrades sowie zuverlässige Backup- und Disaster-Recovery-Strategien durch.
- Du übernimmst Projekt- oder Produktverantwortung beim Aufbau und Betrieb interner PaaS-/SaaS-Services, definierst SLAs und überwachst den laufenden Betrieb für End-User-Teams.
- Du setzt Infrastructure-as-Code-Tools und GitOps-Prinzipien konsequent ein, um automatisierte, nachvollziehbare Infrastrukturen zu gewährleisten.
- Du baust und betreibst Observability-Stacks, führst Incident Management (Alert Handling, Root-Cause-Analyse, Run Book Erstellung) durch und nutzt Metriken zur proaktiven Service-Optimierung.
- Du verfügst über tiefgehende Kenntnisse in Linux-Systemadministration (RHEL), Container-Security, IT-Service-Management und kundenorientierter Kommunikation zur Sicherstellung der Plattformqualität.
- Du arbeitest analytisch und strukturiert, erkennst und löst komplexe Infrastruktur-Probleme, agierst flexibel, belastbar und eigeninitiativ, und optimierst kontinuierlich die Plattform.
Das bieten wir
Für uns ist es selbstverständlich, optimale Rahmenbedingungen zu bieten. Dazu gehören unter anderem:
- Welcomeday und Onboardingprogramm
- Attraktive tarifliche Vergütung
- Flexible und familienfreundliche Arbeitszeitgestaltung durch Gleitzeit-/ und Lebensarbeitszeitkonto sowie Homeoffice-Regelung
- 30 Tage Jahresurlaub sowie Sonderurlaub gemäß Tarifvertrag
- Hervorragende betriebliche Altersversorgung
- Spannende Aufgaben an innovativen Produkten in einem wachsenden Marineunternehmen
- Zuschuss zum Jobticket bzw. Deutschlandticket
- Firmenfitness mit bundesweiten Verbundpartnern
- Bikeleasing
- Umfassende Zusatzleistungen / attraktive externe Angebote
- Individuelle Lern- & Entwicklungsmöglichkeiten in Präsenz und digital
- Umfassendes Gesundheitsmanagement inkl. Präventionsangebote
- Enge Zusammenarbeit mit Führungskräften und der Mitarbeitendenvertretung
Kollegiale Zusammenarbeit und Respekt im Umgang miteinander das bieten wir seit über 185 Jahren!
Wir freuen uns über Online-Bewerbungen unter Angabe der Gehaltsvorstellung und der aktuellen Kündigungsfrist.
Kontakt
TKMS GmbH
Acquisition & Experience
Kian Alai
















