v1.0.2版本的下载地址为 http://pan.baidu.com/share/link?shareid=326717&uk=940392313 (此为百度盘的共享链接),里面有各个版本的压缩包,下载本篇文章对应的v1.0.2版本。至于视频教程请...

    v1.0.2版本的下载地址为 http://pan.baidu.com/share/link?shareid=326717&uk=940392313 (此为百度盘的共享链接),里面有各个版本的压缩包,下载本篇文章对应的v1.0.2版本。至于视频教程请查看本栏目第一篇文章"智能采集器v1.0.0 安装使用教程",里面有视频教程。虽然该版本在上一个版本中做了些改动,但也只是在获取分类和分类操作上做了些改动(为了适应全行业上万分类的情况),采集的过程和v1.0.0版本还是一致的。

    v1.0.2版本对两个PHP接口做了些改动,使其能输出成千上万的分类及关键词数据给客户端,之前的v1.0.0版本在加载几十个上百个分类的时候都要 几十秒才能搞定,上万个分类直接就获取不到了,本版本对于几十上百的分类加载只要几秒钟,原因在于上个版本在本地数据库插入分类数据的时候,是一条条插入 的,v1.0.2则采用的数据库事务方式进行批量插入。另外在PHP接口循环上做了改进。这里需要注意的是你的网站数据能否完全的获取下来,取决于两个因 素,一个是你的服务器的php.ini配置文件是否将memory_limit内存上限放开,一般上万的分类,memory_limit至少要50M以 上,如果你的后台能正常更新分类缓存而不出现空白的情况,就说明你的服务器已经配置好了,一般的网站达到这么多分类的时候都会做这方面的配置,所以通常都 不需考虑,另外一个因素就是你的服务器是否允许php的set_time_limit函数,大部分虚拟机,空间商都支持这个函数,所以在通常情况下都能正 常的完整的获取到分类数据,如果获取不到,或者获取不完整,则请从这两个方面进行考虑。
    此外,接口文件还对编码做了处理,解决了GBK和UTF8版本的小部分乱码问题。

    将v1.0.2的压缩包解压后,可以看到如下目录结构:

    上面的目录结构和v1.0.0版本的大体一致,只是多了个"发布到待审核 Module",默认 的"Module"目录中的采集脚本所上传的信息都是直接通过状态,"发布到待审核 Module"目录中的采集脚本上传的信息则是待审核状态,这样你除了可以在采集器中简单的处理下采集数据(主要是过滤删除操作)外,还可以在服务端后台 对上传上去的数据进行下编辑。如果要使用"发布到待审核 Module"的话,只需将原来的Module目录改个名字,再将"发布到待审核 Module"目录改名为Module即可,或者直接将"发布到待审核 Module"里的所有脚本拷贝并覆盖到Module目录中(前提做好Module目录的备份)。

    将两个PHP接口文件上传到服务端根目录中(注意本版本的接口和上一个版本的不同,所以一定要重新上传本版本的接口文件),然后启动"智能采集器2013PC桌面版.exe"。该版本的采集器多了个"分类列表操作"的菜单:

    当有成千上万个分类时,可以使用"在左侧分类列表中查找分类"的菜单项,该菜单项会弹出一个常规的查找对话框:

    在分类列表操作菜单下还多了分类列表全选和全不选,原来的v1.0.0版本只能反转分类的选择状态(将所有原来选择的变为不选择状态,不选择的变为选择状态),有了全选和全不选,操作会方便很多,尤其是在分类很多的情况下。

    后面的章节将介绍zengl脚本的语法和采集规则的写法。

    最后,再次感谢各位网友使用和测试本软件。

    如果转载请注明来源 http://www.zengl.com   , OK , 先到这里,休息,休息一下 O(∩_∩)O~

 

上下篇

下一篇: zengl脚本语法 第一章入门篇

上一篇: 智能采集器v1.0.0 使用入门

相关文章

智能采集器 v1.2.2共享版

zengl脚本语法 第六章内建函数枚举

智能采集器 v1.2.0 公测版

智能采集器v1.0.4

智能采集器v1.0.0 使用入门

智能采集器v1.0.0 安装使用教程