博客评论和引用通告--抓取网址
将你要抓取的关键词保存在文本文件里,一行一个 。文件保存到
里,可以放多个文件。
抓取PJBlog2 v2.6 build 02的语法示例:(其实就是GOOGLE搜索框里面的内容),每行指令后面还可以附加中文英文的关键词,空格空开即可。
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启"
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.org
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.org.cn
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.com
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.com.cn
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.net
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.net.cn
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.gov
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.gov.cn
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.edu
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.edu.cn
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.biz
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.info
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.name
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.cn
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.hk
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.tw
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.us
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.uk
inurl:article.asp?id= "PJBlog2 v2.6 build 03" "UBB代码 开启" site:.jp
点菜单 【抓取网址】 就开始按照指定的关键词开始初步抓取URL。抓取的结果会自动以关键词命名,文本文件的方式保存到
中。
需要说明的是:GOOGLE可能能够区分程序抓取网址,过了一段时间之后程序抓取出现连续失败的情况,这时候你用IE访问 WWW.GOOGLE.COM 也会发现打不开了,有时候要输入验证码!!!如果是ADSL用户重新拨号换个IP就可以继续了。固定IP用户可能需要等几个小时解封才能继续抓取哦。目前抓取间隔可以设置,最低为2秒,很少出现这种情况了。
抓取过程中中断没有关系,因为已经抓取的结果存在会自动跳过。 如果需要重新抓取请删除
中之前抓取生成的文件!
本步骤完成后,请运行 【验证网址】 ,验证所抓取到的网址,成功的会自动加入数据库。
具体软件订购请咨询 QQ:552129950