爬虫的规则独立出来写到配置文件

【爬虫的规则独立出来写到配置文件】

爬虫的规则独立出来写到配置文件

文章插图
爬虫的规则被独立地写入配置文件 。爬虫的规则被独立地写入配置文件 。导读:看了一个webcollect , 抓取页面的规则全部写入代码 。如果网站被修改 , 代码必须重新编译并从头开始运行 。有没有办法把“//*[@ TPL =# 039;se _ com _ default# 039]/*/*/d