软件的主要作用是提取网页中的某些内容。 可以用来搜集E-mail地址、手机号等信息。 可以用来扫描网页中是否存在某些关键字,发现网页被黑客篡改或挂马等现象。 开始采集之前,需要在“参数设置”中填写合适的关键字或者正则表达式来匹配你需要的内容。 软件默认以爬虫方式工作,自动跟踪网页上的超级链接,一页一页进行数据采集。 软件也可以只扫描url.txt文件中指定的网址列表。 采集到的结果将会保存到类似“Data_20190809”的文件夹里,默认保存为*.htm格式。 软件支持采集百度搜索的网页内容:(采集前需要设置提取内容的正则表达式) 先在软件中打开百度页面,输入关键字搜索您想要的任何内容,然后点击“开始采集”。安装和使用:
绿色软件,无需安装,解压后直接打开即可 如果运行时提示出错,请先运行regMSINET.bat,再重新运行软件。
--------------------------------------------
软件作者: 福建 吴世昌
作者主页:
http://www.fj543.com
http://www.543yy.com(音乐网)
开发者QQ群: 80784252
音乐迷QQ群: 8817999
-------------------------------------------
欢迎web开发、软件开发技术交流!