Alle Guides
AI im B2B-Vertrieb 8 Min. Lesezeit

Lead-Scoring & ICP-Fit mit KI: priorisieren statt gießen

Wie Sie mit KI Leads nach ICP-Fit und Intent scoren, das Top-Segment priorisieren und so qualifizierter verkaufen, statt blind alle anzuschreiben.

CT
CegTec Team
21. Juni 2026

Das Problem heißt nicht “zu wenig Leads”

Die meisten B2B-Teams haben kein Mengenproblem, sondern ein Reihenfolge-Problem. Die Liste ist da — 3.000, 8.000, manchmal 20.000 Kontakte. Der naheliegende Reflex: alle anschreiben, dann sortiert sich der Rest schon. Genau dieser Reflex ist teuer.

“Alle anschreiben” scheitert an zwei Stellen, die nichts mit dem Text zu tun haben. Erstens die Zustellbarkeit: Wer schlecht gefilterte Listen über das eigene Domain-Setup jagt, sammelt Bounces, Spam-Beschwerden und kaputte Reputation — irgendwann landet auch die gute Nachricht im Spam-Ordner. Zweitens die Reply-Qualität: Auf eine ungezielte Aussendung antworten die Falschen — “kein Bedarf”, “falscher Ansprechpartner”, “nehmt mich raus” — und jede dieser Antworten kostet Sales-Zeit, die für echte Opportunities fehlt. Der Aufwand pro qualifiziertem Termin steigt, während die Trefferquote sinkt.

Die Alternative ist nicht “weniger machen”, sondern in der richtigen Reihenfolge machen. Lead-Scoring nach ICP-Fit und Intent ist der Mechanismus, der aus einer flachen Liste eine priorisierte Pipeline macht: Die heißesten 10–20 % zuerst, der Mittelbau ins Nurturing, der Rest raus. KI macht diesen Sortierschritt skalierbar — sie liest mehr Datenpunkte pro Lead, als ein Mensch je manuell durchgehen würde, und sie tut es bei jedem neuen Lead wieder.

Erst der ICP, dann das Scoring

Ein Scoring-Modell ist nur so gut wie das Zielbild dahinter. Wer nicht präzise weiß, wie der ideale Kunde aussieht, vergibt Punkte ins Blaue. Deshalb steht am Anfang immer das Ideal Customer Profile — und zwar nicht als grobe Branchenliste, sondern als belegbares Muster aus den eigenen besten Kunden.

Ein tragfähiger ICP beantwortet mindestens:

  • Firmografie: Branche, Mitarbeiterzahl, Umsatzklasse, Region (für DACH-Outbound meist die harte Grenze)
  • Technografie: welcher Stack im Einsatz ist — ein bestimmtes CRM, eine Marketing-Plattform, ein ERP kann Fit oder Disqualifikation bedeuten
  • Rolle & Buying Center: wer entscheidet, wer beeinflusst, wer blockiert
  • Auslöser-Situationen: in welcher Lage ein Unternehmen typischerweise zum Kunden wird (Wachstum, neuer Vertriebsleiter, Tool-Migration)

Der ehrlichste Weg zum ICP führt über das eigene CRM: Welche Merkmale teilen die Closed-Won-Deals, die die verlorenen nicht haben? Dieses Muster ist die Grundlage, gegen die später jeder Lead gemessen wird.

Fit-Signale und Intent-Signale sauber trennen

Der häufigste Modellfehler ist, Fit und Intent in einen Topf zu werfen. Beide gehören in den Score, aber sie beantworten verschiedene Fragen:

  • Fit-Signale sind statisch und sagen, ob ein Lead grundsätzlich passt: Branche, Größe, Rolle, Region, eingesetzte Technologie. Sie ändern sich selten.
  • Intent-Signale sind dynamisch und sagen, wann ein Lead heiß ist: ein Pricing-Seiten-Besuch, eine Funding-Runde, eine ausgeschriebene Stelle, ein geöffnetes Pitch-Deck, eine Antwort auf eine frühere Mail.

Ein CEO eines perfekten ICP-Unternehmens, der noch nie von Ihnen gehört hat, ist hoher Fit / null Intent — ein guter Nurturing-Kandidat, kein Sofort-Anruf. Ein Manager, der dreimal Ihre Preisseite besucht hat, aber im falschen Land sitzt, ist hoher Intent / null Fit — Rauschen, das man verwerfen muss. Die Pipeline-fähigen Leads sind die mit Fit UND Intent. Genau diese Kombination ist der Kern signal-basierten Outbounds: das Marktsignal liefert das Timing, der ICP-Filter sorgt dafür, dass das Timing auch beim Richtigen ankommt.

Wie KI scort: drei Datenebenen

KI-gestütztes Scoring kombiniert drei Ebenen zu einem Gesamtwert. Jede Ebene speist sich aus anderen Datenquellen, und die Gewichtung entscheidet über den Charakter des Modells.

Scoring-DimensionDatensignal (Quelle)Gewichtung / Beispiel
Firmografischer FitBranche, Mitarbeiterzahl, Umsatz, Region aus Enrichment-DatenHoch — ICP-Treffer +25, falsche Region als hartes K.-o.-Kriterium
Rollen-FitJobtitel, Seniorität, Abteilung, EntscheidungsbefugnisHoch — Entscheider/Buying-Center +20, irrelevante Rolle -10
Technografischer Fiterkannter Tech-Stack (CRM, Marketing-Tools)Mittel — komplementärer Stack +10
Behavioral / EngagementWebsite-Besuche, Pricing-Seite, Content-Downloads, E-Mail-Opens & Klicks, Demo-AnfrageMittel–hoch — Pricing-Besuch +25, Demo-Anfrage +40, reiner Open +3
Markt-/Intent-SignalFunding, Hiring-Welle, Tool-Migration, Branchen-VorhabenMittel — frisches Auslöser-Ereignis +15, kombiniert mit Fit höher
Closed-Loop-Lernsignalhistorische Win/Loss-Muster aus dem CRMjustiert alle obigen Gewichte datenbasiert nach

Der entscheidende Unterschied zur klassischen Punktevergabe: Eine KI muss die Datenpunkte nicht nur addieren, sie kann sie im Kontext lesen. Sie wertet aus, dass ein Geschäftsführer eines 80-Personen-Maschinenbauers in NRW, der gerade eine Vertriebsleitung sucht und zweimal die Lösungsseite besucht hat, ein anderes Profil ist als die Summe seiner Einzelpunkte vermuten lässt — und sie liefert dazu eine Begründung in einem Satz. Das macht den Score nachvollziehbar statt zur Blackbox und erlaubt es dem Sales-Team, dem Modell zu vertrauen.

Wie das maschinelle Scoring technisch in Tools abbildbar ist, vertieft der Beitrag zu Lead-Scoring im B2B; welche Werkzeuge dafür in Frage kommen, ordnet die Übersicht zu KI-Sales-Tools ein.

Ein Scoring-Modell aufbauen — pragmatisch

Ein gutes Modell beginnt klein und wird verfeinert, nicht umgekehrt. Wer mit 50 fein abgestuften Kriterien startet, baut etwas, das niemand mehr versteht und niemand pflegt.

  1. Fit-Achse definieren (ICP). 8–12 harte Kriterien aus dem ICP, inklusive K.-o.-Kriterien (falsche Region, Wettbewerber, falsche Branche → sofort raus). Diese Achse entscheidet, wer überhaupt in die Pipeline darf.
  2. Intent-Achse definieren. Welche beobachtbaren Ereignisse signalisieren Kaufnähe? Engagement-Aktionen plus Markt-Signale. Diese Achse entscheidet über die Reihenfolge.
  3. Gewichten und schwellen. Fit und Intent zu einem Score zusammenführen und in Bänder schneiden: Top-Segment (sofort), Warm (Nurturing mit Bezug), Cold (passiv oder verwerfen).
  4. KI als Bewerter einsetzen. Statt starrer Regeln liest die KI die angereicherten Daten pro Lead und vergibt Score plus Begründung — bei jedem neuen Lead automatisch.
  5. Verwerfen erlauben. Die wichtigste und am seltensten genutzte Funktion: Ein Lead ohne Fit ist kein Lead. Die Disziplin, Signale zu verwerfen, trennt sauberes Scoring von Alert-Spam.

Priorisieren: das Top-Segment zuerst, nicht alle gleichzeitig

Mit einem funktionierenden Score wird aus der flachen Liste eine geordnete Schlange. Statt 8.000 Kontakte parallel anzuschreiben, läuft die Bearbeitung gestaffelt:

  • Top-Segment (Fit + Intent): geht zuerst und mit der höchsten Personalisierung in die Ansprache. Hier rechtfertigt sich der manuelle Feinschliff, hier sitzen die Termine.
  • Warm (Fit, wenig Intent): kommt ins Nurturing — Content, Touchpoints, Wiedervorlage. Wird hochgestuft, sobald ein Intent-Signal auftaucht.
  • Cold / kein Fit: wird pausiert oder entfernt. Diese Kontakte nicht anzuschreiben ist eine aktive Entscheidung, die die Zustellbarkeit schützt.

Der Effekt ist doppelt: Die Reply-Qualität steigt, weil nur relevante Kontakte angesprochen werden, und die Domain-Reputation bleibt intakt, weil das Volumen nicht in schlecht gefilterte Adressen verpufft. Volumen wird damit nicht zum Selbstzweck — es multipliziert nur noch, was vorher schon trifft. Wie Priorisierung in einen automatisierten Outbound-Fluss eingebettet wird, zeigt der Beitrag zur KI-gestützten Lead-Generierung.

Den Loop schließen: Lernen aus Antworten

Ein Scoring-Modell, das nach dem Aufsetzen nie wieder angefasst wird, veraltet. Der eigentliche Hebel liegt im Feedback: Jede Antwort, jeder Termin, jeder gewonnene und verlorene Deal ist ein Datenpunkt, der verrät, ob der Score recht hatte.

Die Fragen, die der Loop beantwortet:

  • Konvertieren hoch-gescorte Leads tatsächlich besser als mittel-gescorte? Wenn nicht, stimmt die Gewichtung nicht.
  • Welche Fit-Merkmale tauchen bei Closed-Won überproportional auf — und welche bei Closed-Lost?
  • Welche Intent-Signale gingen echten Terminen voraus, welche waren Fehlalarm?

Wer diese Auswertung systematisch fährt, justiert die Gewichte datenbasiert nach, statt nach Bauchgefühl. Aus einem statischen Punkteschema wird ein lernendes System, das mit jedem Lauf präziser den nächsten guten Kunden erkennt. Genau hier macht KI den Unterschied: Sie kann Win/Loss-Muster über viele Merkmale gleichzeitig erkennen, die ein Mensch in der Tabelle übersieht.

Praktisch heißt das: Die Antwort eines Leads wird nicht nur als “Termin ja/nein” verbucht, sondern als Rückmeldung an den Score. Ein “gerade kein Bedarf, aber Q4 wieder melden” ist ein Wiedervorlage-Signal mit Datum — der Lead bleibt im System, statt verloren zu gehen. Eine harte Absage mit Begründung (“wir setzen schon X ein”) ist ein Technografie-Hinweis, der das Fit-Profil schärft. So wird jede Konversation, auch die negative, zu Trainingsmaterial für den nächsten Lauf.

Häufige Fehler beim ICP-Scoring

Die meisten Modelle scheitern nicht an der Technik, sondern an wiederkehrenden Denkfehlern:

  1. Nur Fit, kein Intent. Ein sauber gefilterter ICP ohne Intent-Achse ist eine gute Liste ohne Timing — die Reply-Raten bleiben niedrig, weil der Anlass fehlt.
  2. Nur Intent, kein Fit. Jedem Website-Besucher hinterherzulaufen behandelt Rauschen wie Kaufabsicht und verwässert die Pipeline.
  3. Modell nie validiert. Das Scoring wird einmal aufgesetzt und nie gegen reale Abschlüsse geprüft. Ohne Closed-Loop bleibt es Vermutung.
  4. Zu komplex gestartet. 40 Kriterien mit Nachkommastellen wirken gründlich, aber niemand pflegt sie und niemand vertraut dem Ergebnis.
  5. Marketing und Sales nicht aligned. Marketing definiert den Score, Sales ignoriert ihn. Ein gemeinsam getragenes Modell mit regelmäßigem Feedback ist Voraussetzung, kein Bonus.

Vom Modell zum Betrieb

Lead-Scoring nach ICP-Fit ist kein Theorie-Projekt — bei CegTec ist es die Grundlage des eigenen Outbound-Betriebs. Über 87.000 versendete E-Mails haben gezeigt, dass nicht das Volumen, sondern die Priorisierung den Unterschied macht; im Mandanten-Setup für ProSeller sind so 41 qualifizierte Sales-Gespräche entstanden. Der entscheidende Schritt war jeweils nicht “mehr senden”, sondern “an die Richtigen senden”.

CegTec betreibt Scoring, Priorisierung und KI-gestütztes Outbound als geschlossenen Kreislauf — vom ICP-basierten Score über die Top-Segment-Ansprache bis zum Lernen aus jeder Antwort, mit menschlicher Freigabe vor jedem Versand. Wer diesen Loop nicht selbst aufbauen, sondern als Ergebnis kaufen will, findet die Lösung dahinter unter GTM Goat — ab 2.500 €/Monat.


Lead-Scoring ist der Hebel, der den Vertrieb von “alle gleich behandeln” zu “die Richtigen zuerst” bringt. Fit beantwortet das Ob, Intent das Wann, der geschlossene Loop sorgt dafür, dass das Modell mit jedem Deal besser wird.

Lead ScoringICPKI VertriebLead PriorisierungOutbound

Häufige Fragen

Was ist der Unterschied zwischen ICP-Fit und Intent beim Lead-Scoring?

ICP-Fit beantwortet die Frage 'Passt dieses Unternehmen grundsätzlich zu uns?' — Branche, Größe, Rolle, Region. Intent beantwortet 'Ist gerade ein Anlass da?' — Website-Besuch, Funding, Hiring, Antwort auf Outbound. Fit ohne Intent ist eine gute Liste ohne Timing. Intent ohne Fit ist Rauschen. Erst die Kombination ergibt einen priorisierungsfähigen Score.

Warum funktioniert 'einfach alle anschreiben' nicht mehr?

Massenversand an schlecht gefilterte Listen ruiniert die Zustellbarkeit (Spam-Beschwerden, Bounces, Domain-Reputation) und produziert irrelevante oder negative Antworten, die das Sales-Team binden. Die Reply-Qualität sinkt, während der Aufwand pro echtem Termin steigt. Priorisierung nach Fit und Intent dreht dieses Verhältnis um.

Wie scort KI einen Lead konkret?

Die KI bewertet drei Datenebenen: firmografisch (passt das Unternehmen zum ICP), behavioral (welches Engagement zeigt der Kontakt), signalbasiert (gibt es ein zeitliches Ereignis). Aus diesen Dimensionen entsteht ein gewichteter Gesamtscore plus eine kurze Begründung — nachvollziehbar statt Blackbox.

Wie viele Leads sollte ich aus einer Liste wirklich anschreiben?

Es gibt keine feste Zahl, aber die Logik ist klar: Nur das Top-Segment nach Score zuerst — das sind die Leads mit Fit UND Intent. Der Mittelbau geht in Nurturing, der Rest wird verworfen oder pausiert. Ziel ist nicht maximales Volumen, sondern maximale Trefferquote pro versendeter Nachricht.

Wird mein Scoring-Modell mit der Zeit besser?

Ja — wenn Sie den Loop schließen. Jede Antwort, jeder gewonnene und verlorene Deal ist Trainingssignal. Wer auswertet, welche Score-Merkmale tatsächlich Termine und Abschlüsse vorhersagen, justiert die Gewichte nach und macht das Modell mit jedem Lauf präziser.

Playbooks für B2B Outbound freischalten

Kostenlos. E-Mail eintragen → Passwort erhalten → Playbooks lesen.