Agenten-Erkennung

Menschen, gute Bots und KI-Agenten, in einer Anfrage unterschieden.

Agentischer Traffic explodiert und robots.txt ist nur eine Empfehlung. Agentscan klassifiziert jede Anfrage als Mensch, verifizierten bekannten Bot, KI-Agenten oder schädliche Automatisierung, indem es den IP-Ursprung mit Headless-Merkmalen, JA4-Fingerabdrücken und einer verifizierten Allowlist verbindet, sodass Sie die gewünschten Crawler zulassen und die unerwünschten blockieren können.

4
Ergebnis-Klassen
< 50ms
Latenz bei gecachtem Ergebnis
JA4
TLS-Client-Fingerabdruck
rDNS
vorwärtsbestätigte Allowlist
POST/v1/agentscan/check

Anfrage

{
  "ip": "198.51.100.7",
  "user_agent": "Mozilla/5.0 HeadlessChrome/120",
  "ja4": "t13d1516h2_8daaf6152771_...",
  "headless_flags": { "webdriver": true },
  "headers": { "Accept": "*/*" }
}

Antwort

{
  "class": "malicious_automation",
  "confidence": 0.9,
  "action": "block",
  "signals": { "network_origin": "datacenter", "headless": true }
}
Warum jetzt

Steuern Sie agentischen Traffic, blockieren Sie ihn nicht einfach

KI-Crawler und Headless-Scraper machen heute einen riesigen Anteil des Traffics aus. Manche wollen Sie, etwa Ihre Inhalte in den richtigen Antwort-Engines, und manche nicht, etwa Trainings-Scraper und Credential-Stuffer. Eine einzelne Blockliste kann sie nicht auseinanderhalten, und eine Mauer schadet dem SEO, wenn sie Googlebot erwischt.

  • KI-Agenten rufen im Auftrag von Nutzern ab, daher kostet pauschales Blockieren Sie Reichweite und Umsatz.
  • Headless Chrome, Playwright und Puppeteer geben sich überzeugend als echte Browser aus.
  • robots.txt ist nur beratend, daher befolgen wohlerzogene Bots sie, während Scraper sie ignorieren.
  • Sie müssen verifizierten Googlebot und ausgewählte KI-Crawler zulassen und den Rest blockieren.
So funktioniert es

Identität vom Netzwerk bis hinauf zur Anfrage

Agentscan verbindet die gemeinsame IP-Engine mit Fingerabdrücken auf Anfrageebene und einer verifizierten Allowlist.

IP-Ursprungsklasse

Beginnt mit dem Engine-Ergebnis Rechenzentrum, VPN, proxy oder sauberes Wohnnetz, denn ein verschleierter Ursprung ändert alles.

Headless- und Automatisierungs-Merkmale

Erkennt HeadlessChrome, Playwright, Puppeteer, Selenium und skriptgesteuerte Clients anhand des User-Agent sowie clientseitiger Signale wie webdriver.

JA4 TLS-Fingerabdruck

Ein TLS-Client-Fingerabdruck, der einen gefälschten User-Agent übersteht und echte Browser von Hochstaplern trennt.

Header-Konsistenz

Bewertet, wie browserähnlich der Header-Satz ist, da echte Browser Accept, Accept-Language und Accept-Encoding gemeinsam senden.

Verifizierte Allowlist

Googlebot, Bingbot und Co. werden per vorwärtsbestätigtem Reverse DNS bestätigt, nicht durch eine fälschbare User-Agent-Zeichenkette.

KI-Crawler-Bewusstsein

Kennt GPTBot, ClaudeBot, PerplexityBot, Google-Extended und weitere, sodass Sie sie namentlich zulassen oder blockieren können.

Ergebnisse

Vier Klassen, je eine Aktion

Jede Anfrage landet in genau einer Klasse mit einer Konfidenz und einer empfohlenen Aktion.

Mensch

Eine echte Person in einem echten Browser, die Anfrage wird zugelassen.

Bekannter Bot

Ein verifizierter guter Bot wie Googlebot oder Bingbot, der zugelassen und nie versehentlich blockiert wird.

KI-Agent

Ein identifizierter KI-Abrufer wie GPTBot oder ClaudeBot, den Sie kennzeichnen und je nach Richtlinie entscheiden.

Schädliche Automatisierung

Headless-Automatisierung ohne gute Identität, oft von einem verschleierten Ursprung, daher wird die Anfrage blockiert.

API

Senden Sie die Anfragesignale, erhalten Sie eine Klasse und eine Aktion.

Rufen Sie sie vom Edge mit den vom Snippet erfassten Signalen auf. Ergebnisse werden in Redis gecacht, für geringe Latenz.

POST/v1/agentscan/check

Anfrage

{
  "ip": "198.51.100.7",
  "user_agent": "Mozilla/5.0 HeadlessChrome/120",
  "ja4": "t13d1516h2_8daaf6152771_...",
  "headless_flags": { "webdriver": true },
  "headers": { "Accept": "*/*" }
}

Antwort

{
  "class": "malicious_automation",
  "confidence": 0.9,
  "action": "block",
  "signals": { "network_origin": "datacenter", "headless": true }
}
Anwendungsfälle

Wo Agentscan sich bezahlt macht

Content- und SEO-Schutz

Lassen Sie die Antwort-Engines zu, die Sie indexiert haben möchten, und blockieren Sie Trainings-Scraper, ohne Googlebot zu erlegen.

Anti-Scraping und Scalping

Stoppen Sie Headless-Automatisierung, die Preis-, Bestands- und Ticket-Endpunkte bombardiert.

Kontosicherheit

Fügen Sie Reibung gegen Credential-Stuffing und Registrierungsmissbrauch hinzu, der von Automatisierung aus verschleierten IPs ausgeht.

KI-Traffic-Richtlinie

Entscheiden Sie pro Crawler, ob Sie GPTBot, ClaudeBot, Perplexity und andere namentlich monetarisieren, zulassen oder ablehnen.

FAQ

Fragen, beantwortet

Agentscan führt vorwärtsbestätigtes Reverse DNS durch. Es schlägt den PTR-Eintrag der IP nach, prüft, ob er auf eine offizielle Domain wie googlebot.com endet, löst diesen Hostnamen dann zurück auf und bestätigt, dass er mit der IP übereinstimmt. Ein gefälschter Googlebot-User-Agent aus dem falschen Netzwerk scheitert daran und wird nicht als bekannter Bot behandelt.

Agentscan noch diese Woche live schalten

Ein REST-Aufruf, ein kostenloses Kontingent zum Start und dieselbe Engine, die hinter jeder IPScanner-Abfrage steht.

Keine Kreditkarte für den Start nötig