“风讯4.05”实战第六天:试用火车头采集器

1、“正文”中过滤链接,因为多数站带有站内导航。

2、要获得正文中真实的绝对地址,只有手工替换src=为src=http://www.……,采集器自带的分析“真实地址,不下载文件”无效。

3、HTML模板必须要重新选择,必须要是绝对地址,否则不生成。

4、特别要注意的是在WEB发布中的根目录地址的设置,一定要是不带任何目录的,否则与设置文件中的相对地址产生冲突,造成无法使用的故障。

发表评论

邮箱地址不会被公开。 必填项已用*标注