用户文档 使用技巧

安装说明

  • 您的电脑必须安装Windows .Net Framework 2.0框架,
    • 当前检查:
    • 如果没有安装,点击这里下载并安装
    • 安装版:下载智能网络资源系统安装程序,运行安装程序
    • 绿色版:下载智能网络资源系统绿色版,解压
  • 运行智能网络资源系统主程序 Resio.exe

功能模块

  • 采集:您可以使用采集,对网络上的各种资源进行挖掘。
    • 采集工程:采集工作的详细设置文件,包含了要采集的资源链接;
      • 采集模式:
        • 精确:根据指定资源格式(字段)的定义,进行数据库字段级别的采集;
        • 蜘蛛/爬虫:根据指定的文件匹配表达式,自动对指定网站的资源进行全面分析和采集;
      • 字段:各种资源的最小单位,譬如您要采集某个网站的多个帖子,那么每个帖子可能包含以下字段:作者、标题、日期、内容等;
      • 链页:一些帖子在多页面里的,这种情况下您可以为帖子的内容字段设置链页属性,自动把多个分页的内容合并到内容字段;
      • 追踪:一些资源是要从列表页面中,通过点击多个页面才显示的,这种情况下,您可以为内容自动设置跟踪属性,自动获取最终的内容;
      • 登录验证:一些资源网站需要您登录后才可以访问内容,这种情况下下,您可以为整个网站、每个链接甚至每个资源单独定义登录验证以满足具体需求;
        • 参数:这是模拟登录需要的参数,譬如用户名、密码等;
        • 登录采集工程:一些网站的登录认证相当复杂,往往会采用一些动态参数/值,如果用固定的参数是无法满足登录需求的,这个时候,您可以使用采集工程来自动获取登录参数的值!
        • 登录脚本:如果即便使用采集工程仍然无法满足一些特别网站的登录需求,您可以使用自定义的登录脚本来实现相应的登录认证;
      • 数据处理:
        • 脏字过滤:内置对超过11000个符合国家规定的敏感字符的过滤,您还可以自定义要过滤的字符,以确保您采集到的内容符合相关法律法规;
        • 垃圾内容过滤:使用贝叶斯概率模型对已采集的内容自动分析判定是否为垃圾内容,您可以自行对各种垃圾内容进行训练;
        • 内容嗅探:对于Flash/Silverlight播放器,会在页面加载之后才从后台获取实际的文件(.FLV/MP3/.XAP等),您可以使用内容嗅探实现对这些实际内容的采集;
        • 关键字/标签(Tag)自动分析:利用全文分词对采集的内容进行分析,自动获取内容的关键字/标签列表;
        • 文件格式批量转换:对大量文件的快速转换,改变图片或视频的大小/添加水印/改变格式,抽取压缩文件,Office系列文档转换为HTML,以多种方式修改文件名称和内容,修改多媒体文件属性,媒体文件修复与剪切,修改图片文件属性,文本排版,文本混淆,简繁大小写互转,文本切分合并,网页文本互转,电子书抽取制作,可执行文件抽取生成,不良图片过滤,数据转换等
          • 图片:jpg,bmp,png,gif,tif,tga,pcx,wmf,emf,psd,mng,ico,icl,cur,ani,ppm,pbm,pgm,svg,jpeg2000,eip,hif,raw,dicom,sgi等;
          • 多媒体文件:wav,wmv,avi,asf,rm,rmvb,mpg,qt,mov,mp3,flv等;
          • 压缩文档:zip,rar,7z,cab,msi,iso,cbz,cbr,jar,tar,gzip,bzip2,arj,cpio,deb,dmg,hfs,lzh,lzma,nsis,rpm,udf,wim,xar,xz,z,pak,nsa,ses,m2m,crx,qps等;
          • Office文档:doc,docx,xls,xlsx,ppt,pptx,uof,msg,eml,mht,chm,hxs,wps,db,xml,box,dps,et,xlb,pdf,rtf,odt,ods,fo,nws,isc,wml,aw,abw,zabw等,另支持iFilter;
          • 多媒体文件属性:wav,wmv,avi,asf,rm,rmvb,mpg,qt,mov,mp3,flc,wma,mpc,ogg,ape;
          • 图片文件属性:jpg,png
          • 文件名修改:支持所有文件;
          • 文件名内容修改:支持所有文本文件;
          • 媒体文件修复与剪切:rmvb,avi,asf;
          • 文本排版:段落智能修正、去掉干扰符、修正段落首尾空格、修正标点符号,支持txt,htm,eml;
          • 文本切分合并:按大小、行数或段落数剪切文本内容和并内容,支持txt,htm,eml;
          • 文本混淆:给文本内容插入干扰字符,支持txt,htm,eml;
          • 简繁大小写互转:简体和繁体、全角半角互相转换,支持txt,htm,eml;
          • 网页文本互转:网页转为文本或文本转为网页,支持txt,htm,eml;
          • 电子书抽取制作:支持UMD,JAR,CHM,PDB;
          • 可执行文件抽取生成:抽取各种可执行文件,生成可执行文件,支持各种文件;
          • 色情图片过滤:识别并过滤色情图片,支持所有图片;
          • 数据转为网页:根据数据生成网页,支持采集工程和各种数据库;
          • 数据转换:使用自定义脚本转换数据和文件,支持采集工程、各种数据库和各种文件;
        • 贴霸:快速把其它论坛的帖子内容转换到使用UBB内容格式的论坛作为新帖子的工具,特别针对图片而进行了处理,非常适合进行灌水贴图;
        • 媒体文件修复与剪切:修复rmvb文件的错误,剪切内容;
        • 快速下载:
          • 链接:复制要下载各种资源(如图片等)的链接或网页内容,全自动分析并下载到本地磁盘;
          • 嗅探:复制视频地址或内容,全自动分析并下载视频,特有嗅探功能,支持所有视频网站;
  • 导出
    • 数据库:把采集后的数据导出到各大数据库/数据文件中;
    • 本地HTML网页文件
  • 发布:
    • 采集后的数据:您可以把采集后的数据,发布到各大网络CMS系统或者论坛;
    • 网络请求:您可以自定义请求,譬如网络投票等;
  • 任务计划:您可以指定采集、转换、导出、发布、请求等各种任务定时执行。
  • 消息通知:能够自动通过多种方式(MSN、ICQ、QQ、Jabber、电子邮件、手机短信、飞信、网络接口请求、信使服务、Web服务、各种数据库、文件、系统日志、系统声音、注册表、博客、Twitter、饭否、嘀咕、火兔、同学、做啥、9911、新浪微博、滔滔、QZone、ChinaRen、随心微博、雷猴、滴、KaiXin001、i贴吧、51、搜狐、豆瓣、人人、若邻、占座、人间、Follow5、原始村、海内、你我他、Plurk、Gadu、NNTP、IRC、第三方接口、脚本、插件等)通知
    • 在各种任务完成之后,如采集,发布,计划任务等;
    • 监控指定网站并在数据改变时;
  • 监控:您可以定义当网络资源更新时,通过各种通知方式,随时提醒您。
  • 脚本:脚本是对各种功能的自定义扩展,您可以使用C#/VB.NET/JScript.NET/PHP/VBScript/JavaScript/IronPython/IronRuby等等语言编写;
    • 采集脚本:在采集工程中,如果遇到一些特殊的资源,正常的采集方式无法胜任的时候,可以通过脚本来进行自定义的采集;
    • 发布脚本:可以针对特殊的网站进行发送请求;
    • 消息通知:
    • 计划任务:
    • 常用:本系统内置了超过100个常用的脚本,如对专用链的解释/编码、条形码的生成、敏感字符的过滤、中文分词/Tag识别、计算数学表达式、RSS解释与生成等等;
  • 认证码识别:自动识别各种登录页面的认证码:
    • 默认:全自动识别各种常见的认证码;
    • 智能学习:自定义学习各种特殊的认证码;
  • 扩展与外部工具:
    • 本系统提供以下丰富的程序接口,以便您对本系统进行二次开发:
      • 消息通知:编写各种特定的消息通知方式以满足你的需求;
      • 中文分词/Tag识别
      • 数据转换:转换各种采集后的数据到您的业务系统中;
      • 工程扩展:对各种工程(采集、发布、脚本、消息通知、计划任务等)进行自定义设置并应用到实际的工程运行中;
      • 界面:个性化本系统;
    • 外部工具:本系统内置对9大类100多种常用软件的识别,您还可以添加各种软件,以便快速运行;
  • 任务管理:您可以对采集、发布、请求、计划任务、脚本、消息通知等各种任务进行全面管理:添加、停止、跟踪进度、趋势图、性能报告等。
  • 应用服务器:应用服务器以Windows服务的形式在系统后台运行,它包括以下模块:
    • 分布式计划任务管理器:
    • 分布式数据采集与同步:
    • Web服务管理器:允许您在远程用Web浏览器(如IE/FireFox/Opera/Chrome/Safari等)对本系统进行全面管理;


还想了解吗?点击这里:各种版本

还想了解吗?点击这里查看:界面演示

还想了解吗?点击这里查看:说明文档