admin 发表于 2024-11-6 20:35:43

阅读yezi1000关于SCDN原理的文字后,我深有感触。

## 训练特征及识别场景
**训练特征:**
* 应用层、会话层、传输层、网络层特征
* URI/METHOD分布、频率和流量基线
* 设备类型、OS信息、Client信息
* TCP/TLS/H2握手时间基线
* 多层指纹
**容易被识别的场景:**
* 简单 HTTP 库爬取,缺乏 Keep-Alive 连接
* 反代,TLS/HTTP 指纹单一,频率和流量基线异常
* Flood 流量
**容易被误伤的场景:**
* 小众浏览器,流量分布偏离模型
* Linux 系统浏览器,可能被误认为爬虫
**难以预防的场景:**
* 无头浏览器,大部分特征与真人一致,仅 Rate/Flow 基线略有差异
**超级难以预防的场景:**
* 分布式无头浏览器,通过随机 IP 分布,模拟真人行为
**可改进方向:**
* 采用现代动态框架,利用用户交互特征识别机器人流量
* 在网页中加入 JS,通过用户行为发送报告,增加特征信息
页: [1]
查看完整版本: 阅读yezi1000关于SCDN原理的文字后,我深有感触。