找软件用软件,到华军软件园!
您的位置:华军软件园>编程软件>源码下载>其他源码>

WebMagic (Java爬虫框架)

WebMagic (Java爬虫框架)

WebMagic (Java爬虫框架) PC版WebMagic (Java爬虫框架)手机版

  • 版  本:PC版
  • 软件授权:免费软件
  • 软件类型:国产软件
  • 软件语言:简体中文
  • 更新时间:2017/11/29 11:31:45
  • 应用平台:WinAll
  • 软件官网: www.188soft.com
  • 软件大小:6.89M
基本简介
WebMagic (Java爬虫框架)

webmagic采用完全模块化的设计,功能覆盖整个爬虫的生命周期(链接提取、页面下载、内容抽取、持久化),支持多线程抓取,分布式抓取,并支持自动重试、自定义UA/cookie等功能。
WebMagic(Java爬虫框架)更新日记
此次更新主要是一些依赖包的升级和bugfix。
#290 代理增加用户名密码认证 @hepan
#194 重构代理池部分代码,支持自定义代理池 @EdwardsBean
#314 修复版本json-path依赖2.x的StringUtils导致报错的问题
#380 升级fastjson 到1.2.21
#301 修复JsonPath在注解模式不可用的问题 @Salon-sai
#377 修复监控模块在URL带有端口时会报错的问题
#400 修复FileCacheQueueScheduler的NullPointerException问题
#407 为PhantomJSDownloader添加新的构造函数,支持phantomjs自定义命令 @jsbd
#419 修复抓取https链接线程无法结束导致进程一直运行的问题 @cpaladin
#374 升级HttpClient到4.5.2,修复一些安全问题
#424 去掉Guava依赖
因为Guava不同版本兼容性不好,经常导致demo无法运行,所以我最后决定去掉了Guava的依赖。如果使用了BloomFilterDuplicateRemover的用户,需要手动依赖Guava包。

相似软件
版本说明
软件地址
所属专题
网络爬虫

网络爬虫

网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。...

软件截图
  • WebMagic (Java爬虫框架)
WebMagic (Java爬虫框架)下载地址
网友评论
网名:
(您的评论需要经过审核才能显示)
  • 置顶 华军网友 2017-06-17 11:55:36
    讲真,其他源码里我只服WebMagic (Java爬虫框架),不解释
  • 置顶 华军网友 2017-05-10 17:14:10
    WebMagic (Java爬虫框架)虽然是免费软件的,但还是有些问题,有待改进呀~
  • 置顶 华军网友 2016-12-21 20:13:45
    其他源码软件终于让我找到一款不错的软件,以后就认准WebMagic (Java爬虫框架)了
  • 置顶 华军网友 2016-12-10 20:54:03
    下载完WebMagic (Java爬虫框架)以后提示有毒?是我电脑的问题还是软件的问题啊,不应该有这种情况。
  • 置顶 华军网友 2016-11-09 11:52:36
    WebMagic (Java爬虫框架)这么好的软件你到哪里去找啊
  • 10楼 华军网友 2016-05-18 12:41:30
    WebMagic (Java爬虫框架)在同类软件里,体积已经非常小巧了,才6.89MB
  • 9楼 华军网友 2016-02-26 13:47:23
    你们下载了C语言的编程软件了吗??求帮助
  • 8楼 华军网友 2016-01-23 14:20:04
    这一版本的WebMagic (Java爬虫框架)的内容占用问题好多了,不如以前那么厉害了。
  • 7楼 华军网友 2016-01-01 15:58:43
    这个蛮好用。
  • 6楼 华军网友 2015-05-18 17:43:04
    什么网卡的驱动能要300兆?这不坑人的吗??
精彩推荐
软件介绍
相关文章
所属专题
相关下载
软件截图
下载地址
网友点评
返回顶部
前往
下载