国家级高新技术企业 中华人民共和国公共安全行业标准制定单位
双软认证企业 领先的系统整体解决方案提供商
免开发的非web应用封装的数据抓取系统c2800
  • 文章作者:佚名    点击量:    更新时间:2015年04月08日

对于非web应用封装的数据,主要有两种类型:1各种信息文件,例如pdf、doc、ppt、flash等等,2各种非web的应用程序,例如ODBC、Siebel、Lotus Notes、Oracle、Exchange等等。这两种类型的封装数据,用针对web应用的模拟操作的方式进行数据获取是不能完全适应的,必须为业务流程模拟引擎增配对应的工具集,才能进行数据抓取。对于类型1,需要转化器工具集,对于类型2,需要提取器工具集。浙江万赛的免开发的非web应用封装的数据抓取系统c2800集成了标准的转化器工具集和提取器工具集,可以应对多数非web应用封装的数据抓取。

转化器包含以下组件:

l二进制转化工具

用来将二进制文件(除了PDF、doc、xls、ppt或rtf格式)转换成HTML格式

lFlash转化工具

用来将SWF文件转换成HTML格式

l混合二进制转化工具

用来从不同的二进制文件格式中抽取数据,包括所有存储在二进制文件中的文本数据(例如 MS office文档)

lPdf转化工具

用来将PDF文件转换成HTML格式

所支持格式

转化器可处理以下数据格式。注意,一些音频和视频格式需要附加额外订购的插件。

点此在新窗口浏览图片

 

电子数据表

lMicrosoft Works V3.x 以上

lMicrosoft Excel V3.x以上

显示图形格式

lShockwave Flash

lMicrosoft Powerpoint 4以上

音频

lWindows Media Audio (WMA) and Windows Media Audio 元文件 (WAX)

lWindows Media Video (WMV) and Windows Media Video 元文件 (WVX)

lWindows Media 文件 (ASF) and Windows Media 元文件 (ASX) 视频点播 (VOD)

l运动图象专家组 标准 1 和 2 (MPEG-1, MPEG-2), 包括 MPEG Layer-3 音频(MP3)

l隐藏字幕 (SMI, SAMI)

l由Windows Media支持的非流型(本地重放)格式

l光盘音频 (CD)

l数字化视频光盘 (DVD)

l视频-音频 (AVI)

lApple QuickTime (QT, MOV), 2.0版本和以上版本

lIndeoT Video 5以上

l波形音频(WAV)

l语音文件(SND)

lUNIX 音频(AU)

l音频互换文件格式(AIFF)

lRM, RA, RAM RealAudio/RealVideo 流内容

lRT RealText 流文本格式

lMP3 MPEG Layer 3 (音频格式)

lSWF RealSystem G2 with Flash

lSMIL, SMI SMIL files (见SMIL)

lWAV, AIFF*

lMPG, MPEG Standard MPEG Layer 1 video and Layer 2 音频格式

lAVI* Audio/Video Interleave- Microsoft视频格式

lASF* NetShow 文件

 

提取器是针对各种非web的应用程序所封装数据的抓取工具。提取器为不同的信息源准备有不同的提取工具。标准组件包括:

lFTP提取器

l文件系统提取器

可获取NT/2000. NetWare,UNIX等等常见系统中的文件信息

lODBC 提取器

ODBC提取器能够通过ODBC的方式来获取数据库中的信息。

lSiebel提取器

Siebel提取器能够提取Siebel中的信息

lLotus Notes提取器

Notes提取器能够获取Lotus Notes中的信息。

lOracle提取器

Oracle提取器能够获取Oracle数据库中的信息。

lExchange 提取器

Exchange提取器能够获取Exchange系统中的信息。

lDocumentum提取器

Documentum提取器能够获取Documentum系统中的信息。

l常规文件系统提取器

常规文件系统提取器能够获取常见文件系统中文档的信息,如MS Word、MS Powerpoint、MS Excel、TXT、PDF、HTML等。

lPcDocs提取器

PcDocs 提取器能够获取PcDocs文件的信息。

l FileNet提取器

FileNet提取器能够获取FileNet系统中的信息。

lOpenText提取器

OpenText提取器能够获取OpenText系统中的信息。

 

每个提取器都可以根据用户信息源的差异,以及用户的需求而给与设定。提取器被设置好以后将会自动地运行。把信息源中的信息经过整理后通过业务流程模拟引擎进行数据提取,整理和索引。

提取器运行时将不断地观察信息源的变化和更新,把新的或更新过的信息传送给业务流程模拟引擎,把信息源中删除了的信息从业务流程模拟引擎所产生的数据集中同步删除。

分享到: