Détection d'agents

Humains, bons bots et agents IA, distingués en une seule requête.

Le trafic agentique explose et robots.txt n'est qu'une suggestion. Agentscan classe chaque requête comme humain, bot connu vérifié, agent IA ou automatisation malveillante en fusionnant l'origine IP avec les indices sans interface, les empreintes JA4 et une liste d'autorisation vérifiée, afin que vous puissiez autoriser les crawlers que vous voulez et bloquer ceux que vous ne voulez pas.

4
classes de verdict
< 50ms
latence des verdicts en cache
JA4
empreinte de client TLS
rDNS
liste d'autorisation confirmée par recherche directe
POST/v1/agentscan/check

requête

{
  "ip": "198.51.100.7",
  "user_agent": "Mozilla/5.0 HeadlessChrome/120",
  "ja4": "t13d1516h2_8daaf6152771_...",
  "headless_flags": { "webdriver": true },
  "headers": { "Accept": "*/*" }
}

réponse

{
  "class": "malicious_automation",
  "confidence": 0.9,
  "action": "block",
  "signals": { "network_origin": "datacenter", "headless": true }
}
Pourquoi maintenant

Gérez le trafic agentique, ne le bloquez pas simplement

Les crawlers IA et les scrapers sans interface représentent désormais une part énorme du trafic. Certains, vous les voulez, comme votre contenu dans les bons moteurs de réponse, et d'autres non, comme les scrapers d'entraînement et les bourreurs d'identifiants. Une simple liste de blocage ne peut pas les distinguer, et un mur nuit au SEO lorsqu'il attrape Googlebot.

  • Les agents IA récupèrent du contenu au nom des utilisateurs, un blocage total vous coûte donc en portée et en revenus.
  • Headless Chrome, Playwright et Puppeteer imitent les vrais navigateurs de façon convaincante.
  • robots.txt est consultatif, les bots bien élevés le respectent donc tandis que les scrapers l'ignorent.
  • Vous devez autoriser Googlebot vérifié et certains crawlers IA tout en bloquant le reste.
Comment ça marche

L'identité, du réseau jusqu'à la requête

Agentscan fusionne le moteur IP partagé avec les empreintes au niveau de la requête et une liste d'autorisation vérifiée.

Classe d'origine IP

Part du verdict du moteur, datacenter, VPN, proxy ou résidentiel propre, car une origine masquée change tout.

Indices sans interface et d'automatisation

Détecte HeadlessChrome, Playwright, Puppeteer, Selenium et les clients scriptés à partir du User-Agent et de signaux côté client comme webdriver.

Empreinte JA4 TLS

Une empreinte de client TLS qui résiste à un User-Agent falsifié, séparant les vrais navigateurs des imposteurs.

Cohérence des en-têtes

Évalue à quel point l'ensemble des en-têtes ressemble à celui d'un navigateur, puisque les vrais navigateurs envoient Accept, Accept-Language et Accept-Encoding ensemble.

Liste d'autorisation vérifiée

Googlebot, Bingbot et consorts sont confirmés par DNS inverse confirmé en direct plutôt que par une chaîne User-Agent falsifiable.

Connaissance des crawlers IA

Connaît GPTBot, ClaudeBot, PerplexityBot, Google-Extended et d'autres, afin que vous puissiez les autoriser ou les bloquer par nom.

Verdicts

Quatre classes, une action chacune

Chaque requête tombe dans exactement une classe avec un niveau de confiance et une action recommandée.

Humain

Une vraie personne dans un vrai navigateur, la requête est donc autorisée.

Bot connu

Un bon bot vérifié tel que Googlebot ou Bingbot qui est autorisé et jamais bloqué par accident.

Agent IA

Un récupérateur IA identifié tel que GPTBot ou ClaudeBot que vous signalez et arbitrez selon votre politique.

Automatisation malveillante

Une automatisation sans interface sans identité valable, souvent d'une origine masquée, la requête est donc bloquée.

API

Envoyez les signaux de la requête, obtenez une classe et une action.

Appelez-la depuis le edge avec les signaux collectés par l'extrait. Les verdicts sont mis en cache par Redis pour une faible latence.

POST/v1/agentscan/check

requête

{
  "ip": "198.51.100.7",
  "user_agent": "Mozilla/5.0 HeadlessChrome/120",
  "ja4": "t13d1516h2_8daaf6152771_...",
  "headless_flags": { "webdriver": true },
  "headers": { "Accept": "*/*" }
}

réponse

{
  "class": "malicious_automation",
  "confidence": 0.9,
  "action": "block",
  "signals": { "network_origin": "datacenter", "headless": true }
}
Cas d'usage

Où Agentscan fait ses preuves

Protection du contenu et du SEO

Autorisez les moteurs de réponse que vous voulez voir indexés et bloquez les scrapers d'entraînement, sans anéantir Googlebot.

Anti-scraping et anti-revente

Arrêtez l'automatisation sans interface qui martèle les points de terminaison de prix, de stock et de billetterie.

Sécurité des comptes

Ajoutez de la friction au bourrage d'identifiants et à l'abus d'inscription pilotés par l'automatisation depuis des IP masquées.

Politique de trafic IA

Décidez par crawler s'il faut monétiser, autoriser ou refuser GPTBot, ClaudeBot, Perplexity et d'autres, par nom.

FAQ

Vos questions, nos réponses

Agentscan effectue un DNS inverse confirmé en direct. Il recherche l'enregistrement PTR de l'IP, vérifie qu'il se termine par un domaine officiel tel que googlebot.com, puis résout ce nom d'hôte en retour et confirme qu'il correspond à l'IP. Un User-Agent Googlebot falsifié provenant du mauvais réseau échoue à ce test et n'est pas traité comme un bot connu.

Déployez Agentscan cette semaine

Un seul appel REST, une offre gratuite pour démarrer, et le même moteur derrière chaque requête IPScanner.

Aucune carte bancaire pour commencer