Question 1

你们如何验证 Googlebot 而不是信任 User-Agent？

Accepted Answer

Agentscan 采用正向确认的反向 DNS。它查询该 IP 的 PTR 记录，检查其是否以 googlebot.com 等官方域名结尾，然后将该主机名再解析回去并确认与该 IP 匹配。来自错误网络的伪造 Googlebot User-Agent 无法通过这一核验，因而不会被当作已知机器人。

Question 2

我能放行某些 AI 爬虫并拦截另一些吗？

Accepted Answer

可以。Agentscan 按名称识别 AI 爬虫，包括 GPTBot、ClaudeBot、PerplexityBot、Google-Extended 和 CCBot，并在全局允许列表之上支持客户自管理的允许列表，因此你可以放行想要的并拦截其余的。

Question 3

它能检测无头浏览器以及 Playwright 或 Puppeteer 吗？

Accepted Answer

可以。它将 HeadlessChrome、Playwright、Puppeteer 和 Selenium 等 User-Agent 特征，与 webdriver 及缺失的浏览器特性等客户端信号相结合，并将其与 IP 来源加以权衡。来自数据中心 IP 段的无头浏览器是典型的恶意自动化。

Question 4

什么是 JA4，它为何重要？

Accepted Answer

JA4 是 TLS client hello 的指纹。由于它反映了客户端实际进行 TLS 通信的方式，因此远比 User-Agent 头更难伪造，所以即便机器人伪装成 Chrome，仍可凭其 TLS 指纹被识别出来。

Question 5

它会拖慢我的网站吗？

Accepted Answer

不会。判定结果由在边缘端采集的信号计算得出，并以 IP、User-Agent 和 JA4 为键缓存在 Redis 中，因此重复查询可在 50ms 内返回。使用真实浏览器的真实用户绝不会仅凭来源就被拦截，因此使用 VPN 的人依然会被分类为真人。

真人、良性机器人和 AI 智能体，一次请求即可分辨。

管理智能体流量，而非一味拦截