„Wir nehmen einfach drei Server mit ein paar Platten und machen Ceph drauf“ — so beginnen viele Storage-Projekte, und manche enden in Performance-Problemen oder einem Cluster, der ab 70 % Füllgrad anfängt zu schwächeln. Ceph ist ein exzellentes verteiltes Storage-System, aber es verzeiht Dimensionierungsfehler schlechter als ein klassisches RAID — weil viele Entscheidungen sich nachträglich nur mit Datenmigration korrigieren lassen.

Hier, wie wir Ceph-Cluster für Proxmox-Umgebungen auslegen — und welche Zahlen wirklich zählen.

Warum Ceph-Dimensionierung anders funktioniert

Bei einem klassischen RAID-Controller denken Sie in einzelnen Arrays: ein paar Platten, ein RAID-Level, fertig. Ceph verteilt jedes Objekt über den gesamten Cluster und hält automatisch mehrere Kopien vor. Das hat zwei Konsequenzen für die Planung:

Wer Ceph wie ein RAID plant, plant zu knapp. Die folgenden Abschnitte sind die Reihenfolge, in der wir die Auslegung tatsächlich durchgehen.

Die Node-Zahl: drei ist Minimum, fünf ist der Sweet Spot

Ceph braucht für die Monitor-Quorumsbildung eine ungerade Anzahl von mindestens drei Monitoren. Für die Datenhaltung gilt:

Die häufigste Fehlentscheidung in dieser Phase: aus Kostengründen mit drei Nodes starten und planen, „später zu erweitern“. Das geht — aber die ersten Monate fährt man ohne echte Selbstheilungs-Reserve.

Replikation oder Erasure Coding?

Zwei Verfahren, zwei Anwendungsfälle:

Unsere Faustregel: VM-Disks und alles Latenzkritische auf einen replizierten Pool (size=3). Große, selten geänderte Datenmengen auf einen EC-Pool, wenn genug Nodes da sind. Niemals min_size=1 setzen, um „mehr Platz“ zu bekommen — das ist die Einladung zum Datenverlust beim nächsten Plattenfehler während eines Rebuilds.

OSDs, Platten und BlueStore

Jede Datenplatte wird zu einer OSD (Object Storage Daemon). Hier die Punkte, die in der Praxis über Performance entscheiden:

Das Netzwerk ist der häufigste Engpass

Wir sehen es immer wieder: leistungsfähige NVMe-OSDs, die an einem 10-GbE-Netz verhungern. Ceph erzeugt erheblichen Ost-West-Verkehr — jede Schreiboperation wird repliziert, jeder Rebuild schiebt Terabytes durch den Cluster. Was wir empfehlen:

Wenn das Budget knapp ist, kürzen Sie eher bei der Plattenkapazität als beim Netz. Ein kapazitätsschwacher, aber schneller Cluster lässt sich erweitern; ein netzlimitierter Cluster bleibt langsam.

Nutzbare Kapazität ehrlich rechnen

Die Rechnung, die in Angeboten oft fehlt. Bei size=3 gilt grob:

Beispiel: 5 Nodes à 8 × 4 TB NVMe = 160 TB roh. Geteilt durch 3 ≈ 53 TB. Abzüglich Reserve und Füllgrad landen Sie realistisch bei rund 38 – 42 TB sicher nutzbar. Wer dem Kunden die 160 TB als „Speicher“ verkauft, baut den ersten Konflikt schon ins Projekt ein.

Placement Groups und der Autoscaler

Placement Groups (PGs) sind die Verteilungseinheit zwischen Pools und OSDs. Zu wenige PGs führen zu ungleicher Auslastung, zu viele kosten RAM und CPU auf den OSDs. Moderne Ceph-Versionen haben einen PG-Autoscaler, der das in den meisten Fällen gut löst — wir lassen ihn im Modus on oder zumindest warn laufen und greifen nur bei klar definierten Pools manuell ein. Wichtig ist, beim Anlegen eines Pools eine sinnvolle Ziel-Größe (target_size) zu hinterlegen, damit der Autoscaler nicht ständig nachjustiert.

Stolperfallen aus echten Projekten

Fazit

Ceph richtig zu dimensionieren heißt: ehrlich rechnen (Faktor 3, Füllgrad, Failure-Reserve), beim Netz nicht sparen und mit mindestens vier, besser fünf Nodes starten. Wer das von Anfang an einplant, bekommt ein Storage-System, das jahrelang stabil mitwächst — statt eines Clusters, der beim ersten vollen Pool oder dem ersten Plattenausfall die ganze Virtualisierung mitreißt.

Wenn Sie einen Ceph-Cluster planen oder Ihr bestehender an Grenzen stößt: unsere Ceph-Leistung beschreibt, wie wir Auslegung, Aufbau und Betrieb angehen. Eine kurze Einordnung Ihrer Anforderungen gibt es im Erstgespräch — und die Grundbegriffe erklärt unser Glossar-Eintrag zu Ceph.

Ceph-Cluster geplant oder am Limit?

30 Minuten reichen für eine ehrliche Einschätzung. Kostenfrei, ohne Vertriebsdruck.

← Zurück zur Blog-Übersicht