Detección de agentes

Humanos, bots buenos y agentes de IA, distinguidos en una sola solicitud.

El tráfico agéntico está explotando y robots.txt es una sugerencia. Agentscan clasifica cada solicitud como humano, bot conocido verificado, agente de IA o automatización maliciosa fusionando el origen de IP con señales de headless, huellas JA4 y una lista de permitidos verificada, así puedes permitir los rastreadores que quieras y bloquear los que no.

4
clases de veredicto
< 50ms
latencia de veredicto en caché
JA4
huella de cliente TLS
rDNS
lista de permitidos confirmada por reenvío
POST/v1/agentscan/check

solicitud

{
  "ip": "198.51.100.7",
  "user_agent": "Mozilla/5.0 HeadlessChrome/120",
  "ja4": "t13d1516h2_8daaf6152771_...",
  "headless_flags": { "webdriver": true },
  "headers": { "Accept": "*/*" }
}

respuesta

{
  "class": "malicious_automation",
  "confidence": 0.9,
  "action": "block",
  "signals": { "network_origin": "datacenter", "headless": true }
}
Por qué ahora

Gestiona el tráfico agéntico, no solo lo bloquees

Los rastreadores de IA y los scrapers headless ahora suponen una enorme porción del tráfico. Algunos los quieres, como tu contenido en los motores de respuesta adecuados, y otros no, como los scrapers de entrenamiento y los rellenadores de credenciales. Una sola lista de bloqueo no puede distinguirlos, y un muro perjudica el SEO cuando atrapa a Googlebot.

  • Los agentes de IA recuperan en nombre de los usuarios, así que el bloqueo generalizado te cuesta alcance e ingresos.
  • Headless Chrome, Playwright y Puppeteer imitan navegadores reales de forma convincente.
  • robots.txt es orientativo, así que los bots que se portan bien lo obedecen mientras los scrapers lo ignoran.
  • Necesitas permitir a Googlebot verificado y a los rastreadores de IA elegidos mientras bloqueas el resto.
Cómo funciona

Identidad desde la red hasta la solicitud

Agentscan fusiona el motor de IP compartido con huellas a nivel de solicitud y una lista de permitidos verificada.

Clase de origen de IP

Parte del veredicto del motor de centro de datos, VPN, proxy o residencial limpio, porque un origen enmascarado lo cambia todo.

Señales de headless y automatización

Detecta HeadlessChrome, Playwright, Puppeteer, Selenium y clientes con script a partir del User-Agent más señales del lado del cliente como webdriver.

Huella JA4 TLS

Una huella de cliente TLS que sobrevive a un User-Agent falsificado, separando navegadores reales de impostores.

Coherencia de encabezados

Puntúa cuán parecido a un navegador es el conjunto de encabezados, ya que los navegadores reales envían Accept, Accept-Language y Accept-Encoding juntos.

Lista de permitidos verificada

Googlebot, Bingbot y compañía se confirman mediante DNS inverso confirmado por reenvío en lugar de por una cadena de User-Agent falsificable.

Conocimiento de rastreadores de IA

Conoce GPTBot, ClaudeBot, PerplexityBot, Google-Extended y más, así puedes permitirlos o bloquearlos por nombre.

Veredictos

Cuatro clases, una acción cada una

Cada solicitud cae en exactamente una clase con una confianza y una acción recomendada.

Humano

Una persona real en un navegador real, así que la solicitud se permite.

Bot conocido

Un bot bueno verificado como Googlebot o Bingbot que se permite y nunca se bloquea accidentalmente.

Agente de IA

Un recuperador de IA identificado como GPTBot o ClaudeBot que marcas y decides según tu política.

Automatización maliciosa

Automatización headless sin una buena identidad, a menudo desde un origen enmascarado, así que la solicitud se bloquea.

API

Envía las señales de la solicitud, obtén una clase y una acción.

Llámala desde el edge con señales recopiladas por el fragmento. Los veredictos se almacenan en caché en Redis para baja latencia.

POST/v1/agentscan/check

solicitud

{
  "ip": "198.51.100.7",
  "user_agent": "Mozilla/5.0 HeadlessChrome/120",
  "ja4": "t13d1516h2_8daaf6152771_...",
  "headless_flags": { "webdriver": true },
  "headers": { "Accept": "*/*" }
}

respuesta

{
  "class": "malicious_automation",
  "confidence": 0.9,
  "action": "block",
  "signals": { "network_origin": "datacenter", "headless": true }
}
Casos de uso

Dónde se gana su sitio Agentscan

Protección de contenido y SEO

Permite los motores de respuesta que quieres indexar y bloquea los scrapers de entrenamiento, sin aniquilar a Googlebot.

Anti-scraping y reventa

Detén la automatización headless que martillea los endpoints de precios, inventario y entradas.

Seguridad de cuentas

Añade fricción al relleno de credenciales y al abuso de registro impulsado por automatización desde IP enmascaradas.

Política de tráfico de IA

Decide por rastreador si monetizar, permitir o denegar GPTBot, ClaudeBot, Perplexity y otros por nombre.

Preguntas frecuentes

Preguntas, respondidas

Agentscan realiza DNS inverso confirmado por reenvío. Consulta el registro PTR de la IP, comprueba que termina en un dominio oficial como googlebot.com, luego resuelve ese nombre de host de vuelta y confirma que coincide con la IP. Un User-Agent de Googlebot falsificado desde la red equivocada falla esta prueba y no se trata como un bot conocido.

Lanza Agentscan esta semana

Una llamada REST, un nivel gratuito para empezar y el mismo motor detrás de cada consulta de IPScanner.

Sin tarjeta de crédito para empezar