Cold-Email-Deliverability überwachen: Spam erkennen
Warum der Warmup-Score täuscht und wie man echte Inbox-Platzierung misst: Bounce und Reply nach Empfänger-ESP, ESP-Matching, Schwellenwerte und eine Aktions-Ladder.
Die meisten „Deliverability”-Dashboards zeigen Ihnen einen Proxy, nicht die Wahrheit. Kein Mailprovider meldet dem Absender „diese Mail ging in den Spam”. Genau deshalb sterben gute Kampagnen oft leise — die Zustellbarkeit kippt, und niemand merkt es, bis die Antworten ausbleiben. Dieser Leitfaden ist die Monitoring-Perspektive: nicht wie man Deliverability aufsetzt (das steht im Deliverability-Grundlagen-Artikel), sondern wie man erkennt, dass sie kippt — rechtzeitig.
Die 7 Dinge, die die meisten Teams falsch machen
- Sie wissen nicht, ob Sie im Posteingang sind. Bounces, Opens und Replies messen keine Platzierung.
- Der Warmup-Score ist eine Vanity-Metrik. 98–100 Punkte, während echte Prospects nie antworten — das häufigste falsche Sicherheitsgefühl im Cold Email.
- Der größte Hebel ist nicht Copy oder Warmup, sondern ESP-Matching. Gmail→Gmail, Microsoft→Microsoft.
- Aggregierte Metriken verstecken das Problem. Eine gesunde Gesamt-Bounce-Rate kann einen Microsoft-Kollaps maskieren.
- Trauen Sie den Provider-Labels Ihres Tools nicht. Erkennen Sie den echten ESP aus den DNS-MX-Records, nicht aus dem Label.
- Microsoft ist ein anderes, härteres Spiel — niedrigere Volumen-Grenzen, strengere Filter, langsamste Erholung.
- Täglich monitoren und auf Schwellen automatisch handeln. Ein Montags-Problem ist bis Freitag eine verbrannte Domain, wenn erst ein Mensch es bemerken muss.
„Sind wir im Spam?” — schwerer zu beantworten als gedacht
Die unbequeme Wahrheit: Bounces, Opens und Replies sagen nichts über die Platzierung. Ein Bounce ist eine Ablehnung an der Tür, kein Spam-Foldering. Opens sind unzuverlässig (No-Pixel-Best-Practice + Apple Mail Privacy). Was bleibt:
| Signal | Was es beweist | Erkennt Spam-Ordner? |
|---|---|---|
| Bounce-Rate (pro Empfänger-ESP) | Harte Ablehnung an der Tür | Stärkster Frühindikator — aber Ablehnung, nicht Junk |
| Reply-Einbruch vs. Baseline | Leute sehen die Mail nicht | Bester praktischer Inbox-Proxy für Cold Email |
| Warmup-Pool-Spamrate | Platzierung im Warmup-Netz | ❌ Vanity — nicht Ihre echte Zielgruppe |
| Seed-/Placement-Test | Inbox vs. Spam über ein Seed-Panel | ✅ Direkt — aber synthetisch |
| Google Postmaster | Echte Gmail-Complaint-Rate + Reputation | ✅ Direkt — nur Gmail |
| Microsoft SNDS | Outlook-Reputation | ✅ Direkt — IP-basiert, bei Managed-Mailboxen oft nicht verfügbar |
Takeaway: Die kostenlosen Signale, die Sie ohnehin haben (Bounce + Reply-Einbruch, getrennt nach ESP), sind ein exzellentes Frühwarnsystem. Wer wissen statt schließen will, braucht einen Placement-Test oder Postmaster.
Der Warmup-Score-Trap
Warmup-Scores messen die Platzierung innerhalb des Warmup-Pools. Diese Zahl kann 98–100 anzeigen, während Ihre echten Microsoft-Prospects nichts sehen. Nie allein auf den Warmup-Score automatisch pausieren oder throtteln. Speichern, darauf alarmieren — aber als die Vanity-Metrik behandeln, die er ist. Vertrauen Sie stattdessen Bounce-by-ESP und Reply-Trends.
ESP-Matching funktioniert nur, wenn beide Seiten existieren
„Google→Google, Microsoft→Microsoft” ist der wirkungsvollste Deliverability-Move. Aber er hat eine Voraussetzung, die Teams übersehen: Sie brauchen Microsoft-Sende-Postfächer, an die Sie Microsoft-Empfänger routen können. Ist Ihre Flotte zu 100 % Google, bringt ESP-Matching für Ihr Microsoft-Segment nichts — es gibt nichts zum Matchen.
Die subtile Falle danach: Wie die Postfächer angebunden sind, entscheidet, ob das Matching greift. Über natives Microsoft-OAuth verbundene Postfächer werden als Microsoft erkannt. Über generisches IMAP/SMTP angeflanschte landen oft im „Sonstige”-Bucket — Sie besitzen dann Microsoft-Postfächer, die nie als Microsoft genutzt werden. Verbindungstyp immer prüfen.
Alles nach Empfänger-ESP splitten
Die Analytics Ihres Sequencers sind aggregiert. Aggregation versteckt genau den Fehlermodus, der deutsches/EU-B2B-Cold-Email killt: Gmail-Platzierung in Ordnung, Microsoft-Platzierung kollabiert. Bauen Sie den Split selbst — jede Empfänger-Domain auf ihren echten Provider mappen (statische Map für die häufigen, MX-Lookup für den Rest) und Bounce/Reply pro ESP rechnen. Diese eine Sicht macht aus einem unsichtbaren Problem ein offensichtliches.
Und: Klassifizieren Sie den ESP aus den MX-Records, nicht aus dem Tool-Label. Wir haben Managed-Mailboxen gefunden, deren Provider-Codes nicht zur Doku des Anbieters passten. DNS lügt nicht.
Die Zahlen, die zählen (Schwellenwert-Cheatsheet)
| Metrik | Ziel | Warnung | Handeln |
|---|---|---|---|
| Inbox-Platzierung | >80 % | <80 % | <60 % → untersuchen |
| Bounce-Rate (Kampagne) | ~1 % | >1 % | >2 % → pausieren |
| Bounce-Rate (Domain) | <2 % | >2 % | >4 % → Versand stoppen, auf Heilungs-Domain rotieren |
| Microsoft-Segment-Bounce | <3 % | >3 % | auf Microsoft-Sender routen / Segment pausieren |
| Spam-Complaints | <0,1 % | >0,05 % | >0,1 % → pausieren (Google/Yahoo-Limit: 0,3 %) |
| Human-Reply-Rate | >10 % | <5 % | Einbruch >50 % vs. Schnitt → untersuchen |
Sende-Limits pro Provider (kalt/Tag pro Inbox)
| Provider | Kalt/Tag max | Hinweis |
|---|---|---|
| Google Workspace | ~15 | Warmup-Ratio ~1:1,75 |
| Microsoft 365 | ~10 | härtester Filter, langsamste Erholung |
| Azure-Tenant (50 Mbx/Tenant) | ~5 max | Überschreiten riskiert tenant-weiten Burn (4–6 Wochen Erholung) |
Skalieren über mehr Domains/Inboxes, nie über mehr Volumen pro Box. Faustregel: 8 Domains × 5 Inboxes × ~20/Tag, nicht 2 Inboxes × 250/Tag.
Die abgestufte Aktions-Ladder
Automatisieren Sie das Sichere, gaten Sie das Destruktive:
- Alert — Slack-Hinweis mit Entität + Metrik + Fix.
- Throttle — Tageslimit automatisch Richtung Policy senken.
- Pause — Kampagne/Mailbox bei Gefahr-Schwellen automatisch stoppen.
- Rotate — brennende Domain gegen Heilungs-Domain tauschen — menschlich gegated.
Schritte 1–3 mit vollem Audit-Log automatisch ausführen; für Rotation und für das Wiederaufnehmen von allem einen Menschen verlangen. Tempo, wo es sicher ist — eine Hand am Steuer, wo nicht. (Dasselbe Human-in-the-Loop-Prinzip wie im Multichannel-Outbound.)
Die 10-Punkte-Pre-Flight-Checkliste
- SPF: ein Record, ≤10 Lookups, endet auf
~all - DKIM signiert und passierend auf jeder Domain
- DMARC:
p=none→quarantine(4–8 Wo) →reject(4+ Mon) - One-Click-Unsubscribe (RFC 8058)
- Nie kalt von der primären Firmendomain senden
- 2×-Domains-Regel: halb sendend, halb heilend, monatlich rotieren
- ≤15/Tag Google, ≤10/Tag Microsoft, pro Inbox
- Sender-ESP-Mix passt grob zum Lead-ESP-Mix
- <100 Wörter, Plain Text, keine Tracking-Pixel, keine Links im Erstkontakt
- Tägliches Monitoring mit automatischen Schwellen — kein Mensch, der Dashboards anschaut
Behandeln Sie jede „95 % Inbox-Garantie” eines Anbieters als Marketing, nicht als Metrik. Wie viele Mails ein Termin am Ende kostet, rechnen wir hier vor: Cold Emails pro B2B-Termin.
CegTec betreibt Cold-Email-Deliverability-Monitoring als Teil des Outbound-Systems — Bounce/Reply nach ESP gesplittet, automatische Schwellen-Aktionen mit Human-in-the-Loop bei der Domain-Rotation. Den vollständigen Threshold-Config + Monitoring-Blueprint gibt es als Lead Magnet.
Häufige Fragen
Woher weiß ich, ob meine Cold Emails im Spam landen?
Kein Mailprovider sagt dem Absender 'das ging in den Spam'. Die belastbarsten frei verfügbaren Frühindikatoren sind Bounce-Rate und Reply-Einbruch — jeweils getrennt nach Empfänger-Provider (ESP). Wer es genau wissen will, braucht einen Seed-/Placement-Test oder Google Postmaster (nur Gmail).
Ist ein hoher Warmup-Score ein gutes Zeichen?
Nein. Der Warmup-Score misst nur die Platzierung innerhalb des Warmup-Netzwerks — Accounts, die sich gegenseitig schreiben. Er kann 98–100 anzeigen, während echte Microsoft-Empfänger Ihre Mail nie sehen. Nie allein auf den Warmup-Score throtteln oder pausieren.
Was ist ESP-Matching und warum ist es der größte Hebel?
Gmail-Absender an Gmail-Empfänger, Microsoft an Microsoft. Diese Übereinstimmung ist der wirkungsvollste Deliverability-Hebel überhaupt. Voraussetzung, die viele übersehen: Sie brauchen Microsoft-Sende-Postfächer, sonst läuft Ihr Microsoft-Segment ins Leere — es gibt nichts zum Matchen.
Warum ist Microsoft/Outlook schwieriger als Gmail?
Microsoft filtert strenger, hat niedrigere Volumen-Grenzen und die langsamste Erholung nach einem Reputationsschaden. Im EU-/DACH-B2B ist der Microsoft-Anteil hoch — deshalb gehört das Microsoft-Segment als eigener Track behandelt, nicht als Fußnote.
Wie skaliert man Cold-Email-Volumen sicher?
Über mehr Domains und Postfächer, nie über mehr Volumen pro Postfach. Faustregel: 8 Domains × 5 Inboxes × ~20 Mails/Tag statt 2 Inboxes × 250/Tag. Pro Inbox: ≤15/Tag Google, ≤10/Tag Microsoft.