
本书以可扩展置标语言XML为核心,全面介绍了开放的文档格式标准与文档互操作理论及实践。
- 书名 开放文档格式标准与互操作基础
- 作者 李宁、田英爱、侯霞 等
- ISBN 9787302364672
- 定价 79元
- 出版社 清华大学出版社
图书信息
作者:李宁、田英爱、侯霞 等
定价:79元
印次:1-1
ISBN:97873023646对住构72
出版日期:2014.1重措料0.01
印刷日期:2014.10.10
内容简介
本书以可扩展置标语言XML为核心,全面介绍了开放的文档格式标准与文档互操作理论及实践。其内来自容涵盖了置标语言技术、文档格式与相关标准、360百科文档处理技术、文档互操作模型以及互操作性度量理论。此外,本书为方便读者学习与研究,还介绍了相关领域的基本知识、技术现状、研究成果以及未来发展方向等。
本书可作为高等院校计算机和信息技术相关专业的高年级本科生、研究生或教师的教材或学习资料,也可作为文档格式标准、文档处理技术、办公自动化、信息系统建设等相关领域科研工作者的参考用书。
前言
文档作为信息和知识的载体来自,已经深入到人类社会的每一个角落:私人信件、政府公文、商业360百科信函、合同契约、历史档案、科学论文、产品手册、媒体网页、电子读物……无一不是文档。随着数字化和网络的发展,如今信息处理已经逐渐从面向数据为中心的模式逐步发展到面向文逐充章督船犯式按车档为中心的模式。文档信息处理技术涵盖文档的表示、编辑、转换、存储、检索、发布、印刷、出版、数字版权、数据流整合以及智能文档等各个方面。近年来,人们尤为关注以XML为基础的文档信息的结构化表示、文档格式的标准化与互操作、网络化办公、文档信息挖掘、语义网与智能文档的结合等新的技术发展动向。
如今,办公软件已经成为人们日常最常用的软件,产生了大量的办公文档。一些国海际械面讨跳学下行威家的政府组织发现,如果这些文档以某航个私有公司的文档格式保存,那就意味着政府所有的公文都必须由该公司提供的软件才可以打开,而且在向社会提供政府服务的时玉格翻候,还要求被服务者只有购买某个特定公司的软掉移优证销红数会来件才可以提供这种服务。作为政府公文,可能要保存很长时间,如果仅依赖秋卫眼硫乱均激草光花一家厂商的产品,谁也无法保证这些文档可以获得持续的支持。这是很不合理的。
因此,美国马萨诸塞州首先通过了必须采用开放文档格式的政策,要求政府采购的软件必须支持开放的文档格式国际标准。这一政策得到了很大反响,包括美国其他州政府以及欧盟
、亚洲、非洲等很多国家都认识到这个问题的严重性,纷纷发布政策,别物威江确保政府公文应当采用开放文档格式标准。
如今丝织永千各死还,有关文档的开放标准在全世界越来越受到重视,联合国、世界贸易组织、欧盟以及其他国家和地区都制定了相应的政策支持开放的格套仍怕情肥敌宗贵宜式标准。例如,欧盟20多年来一直致力于甲使用开放标准实现欧盟各国间文档信息的互联互通,曾经好但肉这根场积资助开发旨在方便应用程序间传递文档的开放文档体系结构标准(OpenDocumentA好输据希终苏rchitecture,ODA),该标准1985年成为ECMA标准,1994年前后成为国际标准化组织(InternationalStandardOrganization,I激朝减穿情选协生领院SO)标准(ISO/IEC8613行)。2003年,欧盟又开展了对开放文档格式标准和市场发展走向的调查,并提出一些评价开放文档格式的准则。联合国也在2005年指肉出,所有成员国和有关人员占思德都应该有权访问联合国各机构以电子格式提供的公共信息,任何人都没质有义务为享有该权利而安装特定的软件。各机构应通过使用开放标准促进边各ICT(Information&CommunicationTechnology)系统的互操作性,使人们无论使用何种软件都可以打开相应格式的文档。他们还应确保数据的编码可以满足公共电子记录的持久性,而不依赖于特定的软件提供商。一些国家(如英国)在2005年的电子政务互操作性框架中确定了以办公应用XML规范为核心的互操作性需求。2006年,挪威就开始考虑在政府公文中采用开放的文档格式标准ODF。2007年10月,丹麦政府向WTO(WorldTradeOrganization)正式通告《政府基于开放标准软件采购的WTO声明》,指出目前的研究表明,开放标准对于产业的发展和市场的竞争有积极的推动作用,要求从2008年起,所有的政府采购都必须基于ODF(OpenDocumentFormat)或OOXML(OfficeOpenXML)标准。其他国家,包括荷兰、比利时、日本、南非和美国麻省州政府等国家和地区,都积极推动类似政策的制定和实施。
近年来顺应开放文档格式标准的呼声,出现了一系列开放的国际国内标准。例如,2007年成为国际标准的ODF(ISO/IEC26300),2008年成为国际标准的OOXML(ISO/IEC29500)。
我国文档信息处理的标准化工作开展得很早。2001年就开始了办公软件文档格式国家标准的研制工作。2007年"标文通"(UniformOfficeFormat,UOF)正式成为我国国家标准,并得到各主流办公软件产品的广泛支持。随后"标文通"标准一直在不断发展。"标文通"2.0草案已经于2010年年底完成。此外,我国正在制定面向电子公文的电子文件存储与交换格式标准,标准工作组已经确定将"标文通"2.0作为电子文件的文书类流式文档格式规范。
上述这些标准为文档互操作创造了条件,但是离真正达到互操作的目标还有很长的路要走。
本书的作者是一批长期从事文档信息处理的专家和学者,亲身参加了近年各类主要的与文档格式相关的国家标准的制定和应用推广工作。尽管文档信息处理是一个由来已久的研究方向,但是近年来文档处理技术的研究又得到前所未有的重视。我们在研究和教学实践中却很少见到一部能够全面反映近年文档信息处理技术发展成就的专业书籍,我们深切感到出版这样一部书的迫切性。恰逢2009年IBM公司将FacultyAward授予我们,给予我们宝贵的支持,于是我们几位作者自不量力,开始了本书的编写过程。经过4年的努力,终于得以付梓杀青。
本书的重点是开放的文档格式与互操作。本书以可扩展置标语言XML为核心,围绕文档格式与互操作,介绍文档信息处理的相关技术及其标准化状况。本书的目的是使读者了解相关领域的基本知识、技术发展以及最新成果。本书的读者可以是大学与研究机构中信息技术相关专业的本科生、研究生和教师,以及从事文档信息处理技术、办公自动化、信息系统建设的技术人员和管理人员。
本书共分为9章。
第1章为概述,主要讲解文档技术的相关概念,文档的分类,文档相关标准的概况以及文档处理技术的发展。
第2章为置标语言,主要介绍置标语言的概念与历史,置标语言在开放文档格式与文档互操作中的作用,关于"所见即所得"与式样内容分离的讨论以及基于XML的文档格式的设计方法。
第3章为文档格式基础,主要介绍流式文档与版式文档的主要区别,并分别介绍常见的流式办公文档及版式文档格式,重点介绍流式办公文档的基本构成要素。
第4章为主要的办公文档格式标准,剖析主要的办公文档格式标准ODF、OOXML以及UOF,并对这3种主流的格式标准进行比较和分析。
第5章为其他文档格式标准,较为详细地介绍EPUB电子书格式标准,并简单地对EPUB与其他电子书格式标准进行比较和分析;此外,还介绍一些其他的文档格式规范,包括HTML(XHTML、HTML5)、XSLFO、MathML、SMIL、SVG等。
第6章为办公软件与文档处理,介绍主要的办公软件产品、文档的编辑处理与文档编程,并简单介绍文档的自动化处理。
第7章为文档处理关键技术,主要介绍文档的一体化处理技术、跨媒体复合出版与交互、智能文档技术、文档安全与数字版权技术、国际化与本地化技术、信息无障碍技术、基于文档格式的文档内容理解等技术;此外,还介绍了文档处理技术的最新发展。
第8章为文档互操作技术,主要介绍文档互操作的概念、文档互操作的需求、影响文档互操作的因素、文档互操作的实现途径、文档格式转换工具及方法、文档互操作模型、文档互操作度量模型以及文档互操作的保障。
第9章为当前标准化工作与未来发展,主要介绍ISO/IECSC34、OASIS、ECMA、W3C、标文通工作组、OpenOffice社区以及IBM等各大组织、机构、社团所开展的标准化工作,并勾勒出文档信息处理和互操作技术的未来。
目录
第1章概述
1.1文档的概念及分类
1.1.1文档的概念
1.1.2文档的分类
1.2文档格式与标准化
1.3文档技术及其发展
1.4开放的文档处理与互操作
参考文献
第2章置标语言
2.1置标语言的概念与历史
2.1.1通用标记语言GML
2.1.2标准通用置标语言SGML
2.1.3可扩展置标语言XML
2.2置标语言在开放文档格式与文档互操作中的作用
2.3关于"所见即所得"与式样内容分离的讨论
2.4基于XML的文档格式的设计方法
2.4.1做好需求分析,保证文档格式适合应用的要求
2.4.2尽量重用已有的标准
2.4.3尽量规避私有的标准
2.4.4让已有的文档格式逐步过渡到新的格式
2.4.5置标体现内容与式样分离的原则
2.4.6置标人机可读
2.4.7设计最易兼容的文档格式
2.4.8适当处理好非XML内容
参考文献
第3章文档格式基础
3.1流式文档与版式文档
3.2常见的办公文档
3.2.1文字处理文档
3.2.2电子表格文档
3.2.3演示文稿文档
3.3办公文档的基本要素
3.3.1元数据
3.3.2链接与书签
3.3.3脚注与尾注
3.3.4文本和字符
3.3.5段落
3.3.6表格
3.3.7列表
3.3.8标题
3.3.9目录与索引
3.3.10图表
3.3.11多媒体对象
3.3.12式样
3.3.13页面布局
3.3.14修订与批注
3.3.15幻灯片中的动画
3.4常见的版式文档
3.4.1 PDF/Mars
3.4.2 CEBX
参考文献
第4章主要的办公文档格式标准
4.1 ODF
4.1.1标准概述
4.1.2字处理文档
4.1.3电子表格文档
4.1.4演示文稿文档
4.2 OOXML
4.2.1标准概述
4.2.2文字处理文档
4.2.3电子表格文档
4.2.4演示文稿文档
4.3 UOF
4.3.1标准概述
4.3.2字处理文档
4.3.3电子表格文档
4.3.4演示文稿文档
4.4主流文档格式标准的分析与比较
4.4.1打包方式
4.4.2式样的描述
4.4.3字处理文档
4.4.4电子表格文档
4.4.5演示文稿
4.4.6小结
参考文献
第5章其他文档格式标准
5.1电子书格式标准
5.1.1 EPUB
5.1.2其他主要电子书格式标准及其比较
5.2其他文档格式规范
5.2.1HTML
5.2.2XSLFO
5.2.3MathML
5.2.4SMIL
5.2.5SVG
5.2.6其他格式标准
参考文献
第6章办公软件与文档处理
6.1概述
6.2主要的办公软件产品
6.2.1 OpenOffice.org
6.2.2 IBM Lotus Symphony
6.2.3 Microsoft Office
6.2.4国产办公软件
6.2.5主要办公软件对平台和格式标准的支持
6.2.6其他文档处理工具
6.3文档的编辑
6.3.1文字处理文档的编辑
6.3.2电子表格文档的编辑
6.3.3演示文稿文档的编辑
6.4文档的编程
6.4.1使用办公软件提供的SDK
6.4.2使用文档格式API及SDK
6.4.3使用XML应用编程接口
6.5文档的自动化处理
参考文献
第7章文档处理关键技术
7.1文档一体化处理技术
7.1.1复合文档技术
7.1.2流式文档与用户数据的结合
7.1.3版流一体化技术
7.2跨媒体复合出版与交互
7.2.1复合出版技术
7.2.2文档对多媒体内容的支持
7.3智能文档技术
7.3.1早期的文档自动化技术
7.3.2智能标签技术
7.3.3智能表单技术
7.3.4智能文档处理模型
7.4文档安全与数字版权技术
7.4.1办公文档的安全保障机制
7.4.2文档标识方法
7.4.3数字版权保护技术
7.5国际化与本地化技术
7.5.1文档处理国际化、本地化面对的问题
7.5.2国际化、本地化文档处理技术
7.6信息无障碍技术
7.6.1信息无障碍的概念
7.6.2文档处理的信息无障碍要求
7.7基于格式的文档内容理解
7.7.1文档格式对于内容理解的重要性
7.7.2基于格式的文本信息抽取与分类
7.7.3文档格式校验
7.8文档处理技术的新发展
7.8.1在线办公系统
7.8.2云计算环境下的文档协同
7.8.3云计算带来出版业的变革
参考文献
第8章文档互操作技术
8.1文档互操作的概念
8.2文档互操作的需求
8.3影响文档互操作的因素
8.4文档互操作的实现途径
8.4.1制定完善的标准
8.4.2文档格式转换
8.4.3开发文档模板
8.4.4采用应用编程接口
8.4.5基于语义的互操作
8.4.6其他互操作途径
8.4.7 IBM互操作观点
8.5文档格式转换
8.5.1常见的文档格式转换工具
8.5.2办公文档格式转换方法
8.5.3办公文档格式转换项目
8.6互操作模型
8.7文档互操作度量模型
8.8文档互操作的保障
参考文献
第9章当前标准化工作与未来发展
9.1当前的研究工作
9.1.1国际标准化组织ISO/IEC JTC1 SC34的相关工作
9.1.2 OASIS的相关工作
9.1.3 ECMA的相关工作
9.1.4 W3C的相关工作
9.1.5 "标文通"工作组的相关工作
9.1.6 OpenOffice.org的工作
9.1.7 IBM的互操作努力
9.2未来展望
参考文献
评论留言