有没有采集高手 解决一个采集问题

网址: manwadc.cc/chapter/30782166 (只需要要这个 chapter 页的里面的图片地址) 费用: 50U 问题: 这个网站我不管是用Puppeteer Selenium 还是 Get 请求 都会出现一个问题  采集被封禁 403 (能访问但是会少图片) 然后 class=”img-content” 里面就变成只剩 2 张 或者是 图片乱序  封禁规则应该是按 IP 使用代理 IP 降低速率 采集一段时间 都会出现这个问题 需求: 稳定采集不触发 能正常长时间采集 (需要一个 Api 返回图片列表 然后稳定采集列表是对的 顺序对的 不漏图片) 能解决的私信我  获取很简单  就是目前这个采集一会就会出现只有 2 张图片的情况  一般采集个 5-6 本就出现了 间隔 10s左右 跑一天左右还是会出现

请登录后发表评论

    没有回复内容