- 在 BidItem 实体中添加 priority 和 unit 字段,扩展数据结构 - 将爬虫浏览器模式改为非无头模式(headless: false)便于调试 - 为 ChngCrawler 添加人类行为模拟功能: * 模拟鼠标随机移动,增加移动步数和停顿时间 * 模拟人类滚动行为,包括随机滚动距离和停顿 * 添加 navigator 属性伪装,包括语言、插件等 - 在关键节点添加截图功能(bing.png, newPage.png, huaneng.png)用于调试 - 优化反检测策略,降低被目标网站识别为机器人的风险
- 新增 ChngCrawler 爬虫类,支持华能集团电子商务平台招标信息抓取 - 更新 BidCrawlerService,集成 ChngCrawler 到爬虫任务中 - 添加代理配置支持,从环境变量读取代理设置 - 优化爬虫逻辑,支持多个爬虫并行执行 - 新增 ChngCrawler 的单元测试文件 - 改进错误处理,单个爬虫失败不影响其他爬虫执行 - 更新 chdtp_target.ts,添加代理认证支持