Agent 偵測

真人、良性 bot 與 AI Agent, 在一個請求中分辨清楚。

Agentic 流量正在爆發,而 robots.txt 只是一項建議。Agentscan 透過將 IP 來源與無頭瀏覽器特徵、JA4 指紋及已驗證白名單融合在一起,把每個請求分類為真人、已驗證的已知 bot、AI Agent 或惡意自動化,讓你能允許想要的爬蟲並封鎖不想要的爬蟲。

4
判定類別
< 50ms
已快取判定延遲
JA4
TLS 客戶端指紋
rDNS
正向確認白名單
POST/v1/agentscan/check

請求

{
  "ip": "198.51.100.7",
  "user_agent": "Mozilla/5.0 HeadlessChrome/120",
  "ja4": "t13d1516h2_8daaf6152771_...",
  "headless_flags": { "webdriver": true },
  "headers": { "Accept": "*/*" }
}

回應

{
  "class": "malicious_automation",
  "confidence": 0.9,
  "action": "block",
  "signals": { "network_origin": "datacenter", "headless": true }
}
為何是現在

管理 agentic 流量,而非一味封鎖

AI 爬蟲與無頭抓取程式如今佔據了流量的一大部分。有些你想要,例如讓你的內容出現在合適的答案引擎中;有些你不想要,例如訓練用抓取程式與撞庫攻擊者。單一封鎖清單無法分辨它們,而當一道牆攔下 Googlebot 時,更會損害 SEO。

  • AI Agent 代表用戶抓取內容,所以一刀切的封鎖會令你損失觸及率與收入。
  • Headless Chrome、Playwright 與 Puppeteer 能極具說服力地冒充真實瀏覽器。
  • robots.txt 只屬建議性質,所以行為良好的 bot 會遵守,抓取程式卻會忽視。
  • 你需要允許已驗證的 Googlebot 與選定的 AI 爬蟲,同時封鎖其餘的。
運作方式

由網絡層一直到請求層的身份識別

Agentscan 將共用 IP 引擎與請求層級的指紋及已驗證白名單融合在一起。

IP 來源類別

由引擎對數據中心、VPN、proxy 或乾淨住宅的判定開始,因為遭遮蔽的來源會改變一切。

無頭瀏覽器與自動化特徵

從 User-Agent 加上 webdriver 等客戶端訊號偵測 HeadlessChrome、Playwright、Puppeteer、Selenium 與腳本化客戶端。

JA4 TLS 指紋

一種即使 User-Agent 遭偽造仍能存活的 TLS 客戶端指紋,將真實瀏覽器與冒充者區分開來。

標頭一致性

評估標頭組合有多像瀏覽器,因為真實瀏覽器會同時送出 Accept、Accept-Language 與 Accept-Encoding。

已驗證白名單

Googlebot、Bingbot 等是透過正向確認反向 DNS 來確認,而非靠可偽造的 User-Agent 字串。

AI 爬蟲識別

認得 GPTBot、ClaudeBot、PerplexityBot、Google-Extended 等,讓你能按名稱允許或封鎖它們。

判定

四個類別,每個對應一項動作

每個請求都會準確落入一個類別,並帶有信心度與建議動作。

真人

使用真實瀏覽器的真實用戶,因此請求獲准。

已知 Bot

Googlebot 或 Bingbot 等已驗證的良性 bot,獲准通過且絕不會被誤封。

AI Agent

GPTBot 或 ClaudeBot 等已識別的 AI 抓取程式,由你按政策標記並作決定。

惡意自動化

沒有良性身份的無頭自動化,往往來自遭遮蔽的來源,因此請求遭封鎖。

API

送出請求訊號,取得一個類別與一項動作。

從邊緣節點以程式碼片段收集的訊號進行呼叫。判定會經 Redis 快取以達低延遲。

POST/v1/agentscan/check

請求

{
  "ip": "198.51.100.7",
  "user_agent": "Mozilla/5.0 HeadlessChrome/120",
  "ja4": "t13d1516h2_8daaf6152771_...",
  "headless_flags": { "webdriver": true },
  "headers": { "Accept": "*/*" }
}

回應

{
  "class": "malicious_automation",
  "confidence": 0.9,
  "action": "block",
  "signals": { "network_origin": "datacenter", "headless": true }
}
使用案例

何處能體現 Agentscan 的價值

內容與 SEO 保護

允許你想被索引的答案引擎並封鎖訓練用抓取程式,同時不會誤殺 Googlebot。

防抓取與防搶購

阻止無頭自動化猛攻定價、庫存與門票端點。

帳戶安全

為來自遭遮蔽 IP 的自動化所驅動的撞庫與註冊濫用增添阻力。

AI 流量政策

按名稱逐一決定是否將 GPTBot、ClaudeBot、Perplexity 等變現、允許或拒絕。

常見問題

為你解答疑問

Agentscan 採用正向確認反向 DNS。它查找該 IP 的 PTR 記錄,檢查其是否以 googlebot.com 等官方網域結尾,再將該主機名稱反向解析並確認其與該 IP 相符。一個來自錯誤網絡、偽造的 Googlebot User-Agent 無法通過這項檢查,因此不會被視為已知 bot。

本週就推出 Agentscan

一個 REST 呼叫、可免費起步的方案,以及支撐每次 IPScanner 查詢的同一個引擎。

起步無需信用卡