Agentdetectie

Mensen, goede bots en AI-agents, onderscheiden in één verzoek.

Agentverkeer explodeert en robots.txt is een suggestie. Agentscan classificeert elk verzoek als mens, geverifieerde bekende bot, AI-agent of kwaadaardige automatisering door IP-oorsprong te combineren met headless-signalen, JA4-fingerprints en een geverifieerde allowlist, zodat je de crawlers kunt toestaan die je wilt en de crawlers kunt blokkeren die je niet wilt.

4
oordeelsklassen
< 50ms
latentie gecachet oordeel
JA4
TLS-client-fingerprint
rDNS
forward-confirmed allowlist
POST/v1/agentscan/check

verzoek

{
  "ip": "198.51.100.7",
  "user_agent": "Mozilla/5.0 HeadlessChrome/120",
  "ja4": "t13d1516h2_8daaf6152771_...",
  "headless_flags": { "webdriver": true },
  "headers": { "Accept": "*/*" }
}

antwoord

{
  "class": "malicious_automation",
  "confidence": 0.9,
  "action": "block",
  "signals": { "network_origin": "datacenter", "headless": true }
}
Waarom nu

Beheer agentverkeer, blokkeer het niet zomaar

AI-crawlers en headless-scrapers vormen nu een enorm deel van het verkeer. Sommige wil je, zoals je content in de juiste answer engines, en sommige niet, zoals trainingsscrapers en credential-stuffers. Eén blocklist kan ze niet uit elkaar houden, en een muur schaadt SEO wanneer hij Googlebot opvangt.

  • AI-agents halen content op namens gebruikers, dus blanco blokkeren kost je bereik en omzet.
  • Headless Chrome, Playwright en Puppeteer doen overtuigend echte browsers na.
  • robots.txt is adviserend, dus goedaardige bots gehoorzamen het terwijl scrapers het negeren.
  • Je moet geverifieerde Googlebot en gekozen AI-crawlers toestaan terwijl je de rest blokkeert.
Hoe het werkt

Identiteit van het netwerk tot aan het verzoek

Agentscan combineert de gedeelde IP-engine met fingerprints op verzoekniveau en een geverifieerde allowlist.

IP-oorsprongsklasse

Begint bij het engine-oordeel van datacenter, VPN, proxy of schoon residentieel, omdat gemaskeerde oorsprong alles verandert.

Headless- en automatiseringssignalen

Detecteert HeadlessChrome, Playwright, Puppeteer, Selenium en gescripte clients op basis van de User-Agent plus client-side signalen zoals webdriver.

JA4 TLS-fingerprint

Een TLS-client-fingerprint die een vervalste User-Agent overleeft en echte browsers van bedriegers scheidt.

Header-consistentie

Scoort hoe browser-achtig de headerset is, aangezien echte browsers Accept, Accept-Language en Accept-Encoding samen versturen.

Geverifieerde allowlist

Googlebot, Bingbot en consorten worden bevestigd door forward-confirmed reverse DNS in plaats van door een vervalsbare User-Agent-string.

Bewustzijn van AI-crawlers

Kent GPTBot, ClaudeBot, PerplexityBot, Google-Extended en meer, zodat je ze per naam kunt toestaan of blokkeren.

Oordelen

Vier klassen, elk één actie

Elk verzoek belandt in precies één klasse met een betrouwbaarheid en een aanbevolen actie.

Mens

Een echte persoon in een echte browser, dus het verzoek wordt toegestaan.

Bekende Bot

Een geverifieerde goede bot zoals Googlebot of Bingbot die wordt toegestaan en nooit per ongeluk wordt geblokkeerd.

AI-Agent

Een geïdentificeerde AI-fetcher zoals GPTBot of ClaudeBot die je markeert en per beleid over beslist.

Kwaadaardige Automatisering

Headless-automatisering zonder goede identiteit, vaak vanuit een gemaskeerde oorsprong, dus het verzoek wordt geblokkeerd.

API

Stuur de verzoeksignalen, krijg een klasse en een actie.

Roep het aan vanaf de edge met signalen die door het fragment zijn verzameld. Oordelen worden Redis-gecachet voor lage latentie.

POST/v1/agentscan/check

verzoek

{
  "ip": "198.51.100.7",
  "user_agent": "Mozilla/5.0 HeadlessChrome/120",
  "ja4": "t13d1516h2_8daaf6152771_...",
  "headless_flags": { "webdriver": true },
  "headers": { "Accept": "*/*" }
}

antwoord

{
  "class": "malicious_automation",
  "confidence": 0.9,
  "action": "block",
  "signals": { "network_origin": "datacenter", "headless": true }
}
Toepassingen

Waar Agentscan zijn waarde bewijst

Content- en SEO-bescherming

Sta de answer engines toe die je geïndexeerd wilt hebben en blokkeer trainingsscrapers, zonder Googlebot kapot te maken.

Anti-scraping en scalping

Stop headless-automatisering die prijs-, voorraad- en ticket-endpoints bestookt.

Accountbeveiliging

Voeg wrijving toe aan credential-stuffing en aanmeldmisbruik gedreven door automatisering vanaf gemaskeerde IP's.

AI-verkeersbeleid

Beslis per crawler of je GPTBot, ClaudeBot, Perplexity en anderen per naam wilt monetariseren, toestaan of weigeren.

FAQ

Vragen, beantwoord

Agentscan doet forward-confirmed reverse DNS. Het zoekt het PTR-record van het IP op, controleert of het eindigt op een officieel domein zoals googlebot.com, lost vervolgens die hostnaam terug op en bevestigt dat deze overeenkomt met het IP. Een vervalste Googlebot-User-Agent vanaf het verkeerde netwerk faalt hierop en wordt niet als bekende bot behandeld.

Lanceer Agentscan deze week

Eén REST-aanroep, een gratis tier om te beginnen, en dezelfde engine achter elke IPScanner-opzoeking.

Geen creditcard nodig om te starten