1、“正文”中过滤链接,因为多数站带有站内导航。
2、要获得正文中真实的绝对地址,只有手工替换src=为src=http://www.……,采集器自带的分析“真实地址,不下载文件”无效。
3、HTML模板必须要重新选择,必须要是绝对地址,否则不生成。
4、特别要注意的是在WEB发布中的根目录地址的设置,一定要是不带任何目录的,否则与设置文件中的相对地址产生冲突,造成无法使用的故障。
1、“正文”中过滤链接,因为多数站带有站内导航。
2、要获得正文中真实的绝对地址,只有手工替换src=为src=http://www.……,采集器自带的分析“真实地址,不下载文件”无效。
3、HTML模板必须要重新选择,必须要是绝对地址,否则不生成。
4、特别要注意的是在WEB发布中的根目录地址的设置,一定要是不带任何目录的,否则与设置文件中的相对地址产生冲突,造成无法使用的故障。