文档交换标准

  Aaron ·  2010-08-04 23:01  ·  34315 次点击
文档交换标准DocumentInterchangeStandards
如果没有如美国标准信息交换码(ASCⅡ)等字符格式标准,计算机信息的交换是不可能的。ACSII码将字母表中的每个字母用一个7位的码来表示,并使用8位编码提供了一个扩展字符集。几乎每个计算机都识别ASCII代码集,所以你与其它用户交换的任何文件能无需转换地显示出来(除了定制编码扩展)。但是,在这种情况的方式中,并没有你在文档中采用的格式,如页面布局、段落排列和字符风格等。于是需要一种在不同平台上交换文件时保存文档格式的方法。
已开发出了许多文档交换标准,使用户能运行在同一操作系统下的应用程序之间,或不同平台上的应用程序之间交换文档。例如,一个UNIX应用程序和一个DOS应用程序都能打开并格式化文档,只要系统和文档采用相同的文档交换标准,格式化信息如黑体标题、段落标识、页面布局(页边空白、栏外标题、标尾)和其它文本信息都被编码到文档中,于是文档在各种系统上显示时都会是一样的。这些信息通常还包括图形格式信息。Microsoft的建成已久的丰富文本格式(RTF)具有文档格式信息,但除了在Microsoft自己的产品中,RTF并不能很好工作。
文档规定要有下列特性:
文档具有内容,它以特定的布局安排在页面中。
文档具有结构,它定义了文档的段,如标题和段落。
一个特定的文档体系结构,通过使用一种能被任何需要打开并显示文档的系统理解的语言,描述以上特性。文档应该以同样的方式表示信息,不管它下层的系统是什么(只要系统认识文档的体系结构)。用户应能编辑任何交换文档,或者发送者应能给文档上锁以防止再作编辑,虽然严格控制,这后一种功能是很难达到完善的地步的。
在包含有许多不同计算平台的企业计算环境中,标准的文档格式对于用户间的信息交换是基本的。企业网的基本目的就是为所有用户提供一种信息交换的方法。在建好这样的一个网络后,使用简单的文件交换技术,仅维持如ASCII码之类信息是很荒唐的。提供了跨平台文档交换能力的先进文档体系结构是必不可少的。
有好些领域的工作正在进行之中,包括面向对象信息交换,如在MicrosoftWindows对象链接与嵌入(OLE)或Apple的Amber所实现的那样。这些环境强有力地支持面向图形和声音及视频等多媒体信息的交换。但是,对于包括声音和视频的复杂对象,接收这种文档的人必须有一个应用程序能“回放”这些声音和图象,或者必须有一条链路回到创建该对象的应用程序。例如,一个用户用鼠标双击一个,音对象,于是能放出声音的应用程序就被调用。但这会限制文档的便携性。在网上,相应的应用程序必须存在于用户的环境中。在OLE和Amber中,对象能维持网上别处应用程序的链接。于是用户不再需要在他们本地系统中保存该应用程序。但如果该应用程序不能采用的话,将文档移到另一网络仍会带来问题。详见:“复合文档”和“对象链接与嵌入”。
电子数据交换(EDI)是在美国国家标准协会(ANSI)控制下的电子交换标准,它起源于航运业和交通业。EDI为商用单据如购货单、发票和船运通知等规定了结构,并为一个机构提供了通过通信链路交换这些单据的方法。交换关系通常在供应商和顾客之间,例如EDI提供了一种在可重订单据的基础上,顾客计算机向供应商计算机定购的办法。交货也是一样,并且开出发票。在最简单的单据中,EDI类似于公司间的电子函件。在某些机构中,Email已经由EDI实现。一旦安装了一个合适的系统,EDI具有降低开销和工作量需求的潜力。参见“电子数据交换。”
OpenDocumentArchitecture开放文档体系结构(ODA)
开放文档体系结构(ODA)是国际标准化组织(ISO)为系统间交换那些包括有各种信息的文档而制定的标准,以便接收者能象创建该文本时一样查询这些文本,并在必要时修改。前提是发送和接收两个系统都要遵从ODA标准。ODA常用于通过X.400邮件系统交换文本或使用文件传输访问方式(FTAM)时。
ODA复合文档有以下组成部分:
文本(ISO字符集)。
基于ISO超文件计算机图形标准的几何图形。
基于CCITT传真标准的光栅图形。
ODA文档包括许多布局对象,它定义了一个文档中的表示要素,如页面和每页重复的栏外标题和标尾。逻辑对象是加到文档布局中的要素,如章、节、段、标题、脚注和其它可格式化的对象。ODA文档要经历三个阶段,产生三种类型的文本。
首先创建和编辑的文档叫可处理文档,它处于一种可校订状态,即使在交换后。
下一阶段是布局处理,它规定了文档按页面的表示。于是形成了不可校订的格式化文档或可作进一步校订的格式化可处理文档。
最后阶段是影象阶段,它形成最终打印或交换的文档。
内容布局结构可以修改,但其逻辑结构被保留,这意味着你能改变文档的表示方法,而不能改变最初作者的内容。当文档在不同设备上显示或在不同类型打印机上打印时其表示格式有时不一样。
StandardGeneralizedMarkupLanguage(SGML)标准规范化标记语言(SGML)
SGML是一种文档语言,它定义了文档的结构和内容,但它没有象ODA那样定义格式参数。它超出了ASCII码集,为综合和共享其它环境中创建的信息提供了方法。SGML基本上用于工作流和文档管理环境中,它生成的文档是智能的,而不是“愚笨”的。SGML文档包含用于定义段落和标题之类组成部分的属性,使文档具有软硬件独立性。使用这种文档,工作流软件能将精力更多地集中在功能上而不是在文档的转换上。用户和编程人员也可将信息存储在这种文档中,当这些文档在其它系统中使用时,它们能够转换以执行相应操作或格式化。NovellNetWare4.x中的Dynatext文档查看软件就是基于SGML的。
使用SGML,文档格式能从包含数据的文档中分离出来。这些格式信息被放在文档类型定义(DTD)文件中,格式标志标识文档的每一个部分。例如,一个段落可能有一个格式标志表示它是缩进圆体表格。字样并不是SGML定义的部分,它们与下面定义的AdobeAcrobat之类的产品有关。
SGMLOpen是一种包括Novell、Oracle和Intergraph的供应商组织,它的目的是将SGML作为一种可互操作标准来推动其发展。SGML缺乏显示信息,但SGMLOpen正推出和采用另一种ISO标准,叫做文档格式语义规范语言(DSSSL),来实现显示,它定义了一个带有文档显示信息的附加文件。
AcrobatAdobeSystemIncAdobe系统公司的Acrobat
Adobe系统公司的Acrobat提供了移动文档交换能力,使文档接受者能浏览格式化的文本。Acrobat适用于文献编集出版社和使用许多不同类型计算机处理包括大量图形内容文档的其它商务应用。Acrobat包括下列模块:
便携文档格式(PDF)软件,它在Macintosh和基于Windows的计算机上代替了打印驱动程序(包括Postscript驱动程序)。生成源文档的应用程序不再要求打印用于交换的文本。PDF是一种文档描述语言,类似于Postscript,它描述文本将以怎样的形式输出,文档输出时怎样查看它。
交换软件,它运行在每种不同的计算机系统上,如DO〕S、Macintosh和UNIx系统。该软件用于浏览并编辑已交换的文档。
读者软件,它使其他人能浏览并打印交换的文档,但不能创建文档。该软件以低价格单独出售。
Adobe增加了Acrobat对SGML的支持,使用户能修改他们和其他用户交换的文档。
MultipurposeInternetMarlExtension(MIME)Internet多功能邮件传递扩展标准(MIME)
MIME是一个Internet标准,它使不同类型的数据,如图形、声音、视频和文档等都包含在电子函件的消息中。格式化功能使用户能指定字体风格、字体大小和文档中的页布局,这样使那些没有类似应用程序的其它系统上的用户能阅读并理解它们。

0 条回复

暂无讨论,说说你的看法吧!

 回复

你需要  登录  或  注册  后参与讨论!