HOME  PRODUCT  PRICE  DOWNLOAD  ABOUT  HELP  FAVORITE   
网站首页  软件介绍  价格列表  下载中心  关于我们  帮助文档  加入收藏   
 下载共享版
  下载《网络神采》
 软件很小,软件包大小 4.28 MB
 不需要安装,解压后即可使用
 共享版,无条数限制、无时间限制
 在线咨询
 问题反馈 / 软件合作
Q Q 15630515 点击这里给我发消息
电话
 技术支持
客服1 1686814147 点击这里给我发消息
客服2 1181814147 点击这里给我发消息
客服3 1161614147 点击这里给我发消息
 如果客服人员不在线,请联系第一个QQ。
 技术交流群
QQ群 634617626
 
《网络神采》是一款用于互联网数据采集的工具软件,用于快速采集、下载网页数据。
软件特点:操作简便、好用,采集速度快,共享版免费。
详细介绍:功能与主界面
 
2019-05-13 V6.3.3
1、修复“历史记录”bug:上个版本(V6.3.2)中,判断“非POST参数”的历史记录失效
2019-05-13 V6.3.2
1、解决问题:JSON格式的POST请求发包后,返回的“JSON包”源文件内容被截断。2、源文件查看器和导航规则中,重构选项:进行JS解码 -> 进行字符反转义(CharUnescape)。3、源文件查看器和导航规则中,增加选项:进行HTML解码(HtmlDecode)。4、源文件查看器,改进细节:进行HTML解码、进行字符反转义后,记住滚动条位置。5、重构选项:兼容旧版任务 -> 格式化HTML(1.0),为“格式化HTML”的后期升级,明确了模式。6、优化任务日志:开始任务后的提示日志,缩进一级。7、修复“历史记录”bug:提取下一页时,如果带有post参数,历史记录判断失败(之前没有判断post参数部分,优化后改为“判断post参数的哈希值”)。8、采集规则,重构选项:全局规则(Global)-> 始终从顶部查找(FindingFromTop),静态规则(Static)-> 当前位置不移动(PositionNotMove)。9、任务编辑:优化部分标签名称、提示信息(ToolTip)。
2019-04-23 V6.3.1
1、增加功能:支持JSON格式的POST请求,可自动识别JSON格式。2、源文件查看器:进行JS解码,改成即时生效的方式,类似于“格式化JSON”。3、修复bug:使用Gecko内核后,如果内核文件夹不存在,任务编辑时会自动改为IE内核,而运行任务时却提示“请下载 Gecko 内核”。4、优化“可视化配置”界面细节:在“配置模式”下,按 C、E、R、F 键后,在状态栏给出提醒文字;提取规则名称:在网页中选中内容后,也可以提取为规则名称。5、任务编辑:必填项标签右侧,增加一个红色 * 号(包括可视化配置)。6、优化部分日志细节:service_trace.txt 中的日志。
2019-04-13 V6.3
1、优化“模拟点击”:解决了单路径限制问题,大幅提升了“模拟点击”的应用范围。2、增强“模拟点击查看器”的界面稳定性,任务开始时,打开窗口界面不再卡顿。3、解决问题:在win10系统中,基于IE内核的欢迎页面中的链接无法弹窗。4、提升“模拟点击”速度,等待 ReadyState 的时间缩短。 5、增强“代理服务器”功能,开始支持IE、Gecko内核,插件接口支持:切换代理服务器的同时可换请求头(如UserAgent等)。6、增加重启选项:有任务正在运行,则推迟重启。7、可视化配置“浏览模式”下,按“R键、F键、E键、C键”后,不再拦截,允许输入到网页。7、修复bug:切换帐号后,Gecko内核无法再次使用,必须退出程序重新登录。
2018-10-25 V6.2.22
修复bug:6.2.21 引入的bug,添加起始地址时,误判为多行(每次都提示包含换行)。
2018-10-21 V6.2.21
1、可视化采集时,普通“循环标志”将不起作用,在任务日志中给出明确提示。2、使用XPath提取下一页失败时,也要在日志中提示。3、日志提示细节:提取下一页重复时,不能提示达到最后一页,必须明确提示。4、循环采集:找不到“普通”循环标志时,日志提示不正确,应该提示“循环采集 1 次. 在源文件中, 未找到循环标志: xxxx”。5、删除界面控件的 Tag,与 ToolTip 统一内容。6、废除选项:采集结果替换 -> 反复执行替换,需要时,可手动复制多条“替换”。7、增加选项:采集结果替换 -> 下载文件前替换(BeforeDownload)。8、动作失败后,通知管理员时,通知邮件支持SSL加密协议。9、改进细节:源文件替换成功或失败时,都会提示一下,方便调试任务。10、修复bug:在某些win10机器上,点击文本框后,输入法会换成全角中文。11、添加起始地址,支持一次添加多条,可自动识别“换行符”并提示“是否添加为多条”。
2018-09-06 V6.2.20
1、原本想法,任务运行时,让IE内核支持“短XPath”:已改为,统一使用“短XPath”,包括Gecko内核。2、JSON内容,在源文件查看器中,可以格式化显示;增加设置:导航规则 -> 高级选项 -> 格式化JSON(FormatJson)。3、解决有些机器上,软件升级失败的问题,同时重构“Updater”本身的升级思路。
2018-08-17 V6.2.19
1、修复gug:提示日志“由于 加载源文件 导致查询XPath失败时, 建议尝试切换模拟点击内核, 或使用单路径模式”后,不能暂停任务,否则会反复采集此条。
2018-08-09 V6.2.18
1、解决:升级到.net4.5后,某些机器上,无法提示安装.net4.5框架的问题。2、重构名称:处理脚本 -> 解析脚本。3、细节:任务恢复区,快捷键改为 F9(跟任务继续运行有关)。
2018-08-04 V6.2.17
1、可视化配置,修复bug:在采集规则、导航规则名称下拉输入框,按C键时,会复制XPath,同样按E键时,会提取规则名称。2、可视化配置,XPath测试:改进XPath表达式,不再以 [*] 结尾,如:li[*] -> li。3、可视化配置,开始支持连续点击元素,在某些场景下,大幅提升配置效率。3、可视化配置:点击当前元素“XX”后,会导致之后所有“点击事件”拦截失败。原因:点击后,并未引发 Navigating 事件,导致无法拦截、无法加亮 (已处理)。4、软件.net框架,升级到 .net 4.5,以适合某些最新技术页面的采集。
2018-06-22 V6.2.16

可视化配置,不用再切换线程:
1、使用工作线程,打开可视化配置窗口。
2、可视化配置时,考虑高优先级,即对工作线程加锁。

2018-05-29 V6.2.15

1、可视化配置,修复bug:使用IE内核后,关闭窗口时出错:未将对象引用设置到对象的实例 (已解决:浏览器返回的Cookie 为 null)。2、可视化配置,重构快捷键:覆盖现有 Alt+R -> R,显示完整XPath Alt+F -> F。3、修复bug:插件接口 ProcessResultRow(ref ResultRow extractedResultRow),修改 extractedResultRow 值后,反映不到软件。

2018-05-26 V6.2.14
1、修复模拟点击bug一处。2、重构“使用XPath”名称,如:使用XPath -> 使用XPath提取网址 等。3、解析脚本:暂停任务时,回收URL,以避免漏采URL。4、加载“模拟点击缓存”失败时,会导致:无法继续翻页(点击下一页),或当前URL丢失(点击下一层),已解决:回收URL。5、修复bug:源文件查看器,与软件不一致(已解决:设置IE版本时,必须使用 Application.ExecutablePath,而不是固定字符串“bget.exe”)。6、可视化采集:IE内核,打开源文件查看器时,需要标准化源文件,否则有大写字母。7、模拟点击查看器:保持单一窗口。8、任务设置:增加选项“浏览器运行时可见”(WebBrowserAlwaysVisible)。9、增加任务设置:使用单路径模式 (SinglePathMode)。10、可视化配置:首次切换(或被迫切换)可视化配置内核时,也要绑定cookie,与打开时类似。 11、改进其它细节功能。
2018-05-04 V6.2.13

模拟点击时,也要支持:
1、如果筛选失败或“关键规则”采集失败,则不提取下一层网址(因为向下导航已没有意义)。
2、如果筛选失败、“关键规则”采集失败、“全局数据行”不可用,同时,如果是“合并分页”模式,且为最终页面,则不再提取下一页网址。注意:中间层或其它情况,下一页网址要提取。

2018-05-02 V6.2.12

修复 V6.2.11 bug:由于增加枚举 Operator,导致XML配置中显示为“<Operator>⊙</Operator>”。

2018-04-27 V6.2.11

1、采集结果筛选:增加操作符“匹配正则式 (MatchRegex) ”。2、 循环标志右侧,增加2个选项:跳过首行、跳过尾行。

2018-04-25 V6.2.10
1、采集范围没有内容时,也要记录URL等特殊结果字段,以方便排查“数据拆分”成功率。2、 可视化配置:重构快捷键2处。
2018-04-18 V6.2.9
1、导航规则、采集规则,支持复制粘贴。2、循环采集标志,开始支持正则表达式。
2018-04-16 V6.2.8
1、在线发布器,修复bug:无法识别MDB文件,会识别为 SQLite。2、软件导出 Access 时,自动添加主键。
2018-04-12 V6.2.7
1、修复“在线发布器”bug:运行时,出现未捕获异常(由于旧功能“在线验证”导致)。2、在线发布器:目标地址编辑,增加查找功能。
2018-04-04 V6.2.6
1、插件插件升级,支持生成网页截图。2、插件增加接口:从插件加载扩展脚本参数值(LoadExtendedJSParamValues)。3、重构其它插件细节参数。
2018-03-22
网络神采 V6.2.5 发布:1、修复bug:循环采集,如果关键规则采集失败,数据仍被保留。2、改进细节:“连续采集内容失败已达到 5 次, 任务动作失败!”,只提示一次。3、修复bug:本地起始地址,修改或清空后,无法保存成功。4、可视化采集配置,修复bug:使用Gecko内核时,个别网页,移动鼠标时,元素加亮失败。5、细化任务日志多处。6、采集规则,编辑现有条目:如果“所属层次”为空,则保留现有值,不影响保存,以方便保存单条测试任务。
2018-03-15
网络神采 V6.2.4 发布:1、增加全局设置:扩展脚本执行后,延迟几秒。2、修复bug:翻页点击时,有时出现“无法继续点击翻页,未找到拟点击XPath”。3、修复bug:IE内核,任务暂停后,再继续,出现“模拟点击出错: 未将对象引用设置到对象的实例”。4、模拟点击查看器:增加按钮“查看完整源文件”。5、细化任务日志3处:已兼容旧版任务、点击下一层XPath、点击下一页XPath。
2018-02-28
网络神采 V6.2.3 发布:1、修复bug:带有base标记时,合并相对URL失败。2、修复6.2版本bug:使用 IE、Gecko 解析脚本时,由于bug导致下一层网址模板变成了相对路径,最终导致任务运行时提取“下一层网址”失败。
2018-01-28
网络神采 V6.2.2 发布:1、解决:可视化采集配置时,IE内核,放大范围时每次跳2次。2、修复bug:部分页面出现“模拟点击出错:未将对象引用设置到对象的实例”。3、将全局设置“解析脚本内核”统一到任务,统一为“模拟点击内核”。4、新功能:任务 -> 模拟点击查看器,可查看模拟点击的过程,方便调试问题。5、主界面,重构快捷键:任务恢复区、清理空闲任务缓存。6、新功能:IE内核,也开始支持扩展脚本。7、解决可视化采集配置,屏幕兼容问题:最小可兼容到 1366x768 像素。8、细化日志:如果由于内核不兼容导致XPath匹配失败,则给出提示。9、可视化采集配置,改进操作细节多处。
2018-01-02
网络神采 V6.2.1 发布:1、修复6.2版本bug:由于bug导致下一层网址模板变成了相对路径,最终导致任务运行时提取“下一层网址”失败。2、可视化采集配置,改进操作细节2处(包括:IE内核,支持快捷键;测试JS脚本时,空内容不允许测试)。
2018-01-01
网络神采 V6.2 发布:1、解决不同内核的XPath兼容性问题。2、修复bug:模拟点击时,有时加载“成功标志”失败。3、新功能:支持“扩展JS脚本”,用于强化模拟点击,方便前端开发者进行JS编程。4、修复bug:智能采集日期时,日期与时间连到了一起。5、可视化采集配置,改进操作细节多处(包括:测试XPath时,细化提示;可以直接打开源文件查看器;放大范围时,源文件跟随变化;如果需要登录,自动将现有Cookie绑定到可视化浏览器;可测试“扩展JS脚本”内容等)。

联系我们 | 加入收藏
郑州神采软件技术有限公司 版权所有 ©2005-2018 豫ICP备11025191号