Nutch二次开发总结[修改版]
第一篇:Nutch二次开发总结1.1 信息源选择及规范制定Nutch通过制定相应的URL规则来达到对限定的URL进行爬取,即过滤信息。默认情况下可以在相关的配置文件中进行配置,它用正则表达式来规范UR
Nutch二次开发总结[修改版]