选择显示字体大小

xml轻松学习手册(4)xml的术语之一

第三章 xml的术语

 


提纲:



导言

一.xml文档的有关术语

二.dtd的有关术语




导言




初学xml最令人头疼的就是有一大堆新的术语概念要理解。由于xml本身也是一个崭新的技术,正在不断发展和变化,各组织和各大网络公司(微软,ibm,sun等)都在不断推出自己的见解和标准,因此新概念漫天飞就不足为奇了。而国内又缺乏权威的机构或组织来对这些术语正式定名,你所看见的有关xml的中文教材大部分是靠作者本身的理解翻译过来的,有些是正确的,有些是错误的,更加妨碍了我们对这些概念的理解和学习。




你下面将要看到的关于xml术语的解释,也是作者本身的理解和翻译。阿捷是以w3c组织发布的xml1.0标准规范和相关的正式说明文档为根据来讲述。可以确保这些理解是基本正确的,至少不是错误的。你如果想进一步阅读和了解,我在本文的最后部分列明了相关资源的出处和链接,你可以直接访问。好,我们转入正题:


一.xml文档的有关术语

什么是xml文档?知道html原代码文件吧,xml文档就是用xml标识写的xml原代码文件。xml文档也是ascii的纯文本文件,你可以用notepad创建和修改。xml文档的后缀名为.xml,例如myfile.xml。用ie5.0以上浏览器也可以直接打开.xml文件,但你看到的就是"xml原代码",而不会显示页面内容。你可以将下面代码存为myfile.xml试试:


<?xml version="1.0" encoding="gb2312"?>

<myfile>

<title>xml轻松学习手册</title>

<author>ajie</author>

<email>ajie@aolhoo.com</email>

<date>20010115</date>

</myfile>


xml文档包含三个部分:

1. 一个xml文档声明;

2. 一个关于文档类型的定义;

3. 用xml标识创建的内容。


举例说明:

<?xml version="1.0"?>

<!doctype filelist system "filelist.dtd">


<filelist>

<myfile>

<title>quick start of xml</title>

<author>ajie</author>

</myfile>

......

</filelist>

其中第一行<?xml version="1.0"?>就是一个xml文档的声明,第二行说明这个文档是用filelist.dtd来定义文档类型的,第三行以下就是内容主体部分。
我们来了解xml文档中有关的术语:


1.element(元素):

元素在html我们已经有所了解,它是组成html文档的最小单位,在xml中也一样。一个元素由一个标识来定义,包括开始和结束标识以及其中的内容,就象这样:<author>ajie</author>


唯一不同的就是:在html中,标识是固定的,而在xml中,标识需要你自己创建。


2.tag(标识)

标识是用来定义元素的。在xml中,标识必须成对出现,将数据包围在中间。标识的名称和元素的名称是一样的。例如这样一个元素:

<author>ajie</author>

其中<author>就是标识。


3.attribute(属性):

什么是属性?看这段html代码:<font color="red">word</font>。其中color就是font的属性之一。

属性是对标识进一步的描述和说明,一个标识可以有多个属性,例如font的属性还有size。xml中的属性与html中的属性是一样的,每个属性都有它自己的名字和数值,属性是标识的一部分。举例:

<author sex="female">ajie</author>

xml中属性也是自己定义的,我们建议你尽量不使用属性,而将属性改成子元素,例如上面的代码可以改成这样:

<author>ajie

<sex>female</sex>

</author>

原因是属性不易扩充和被程序操作。


4.declaration(声明)

在所有xml文档的第一行都有一个xml声明。这个声明表示这个文档是一个xml文档,它遵循的是哪个xml版本的规范。一个xml的声明语句就象这样:

<?xml version="1.0"?>


5.dtd(文件类型定义)

dtd是用来定义xml文档中元素,属性以及元素之间关系的。

通过dtd文件可以检测xml文档的结构是否正确。但建立xml文档并不一定需要dtd文件。关于dtd文件的详细说明我们将在下面单独列项。


6.well-formed xml(良好格式的xml)

一个遵守xml语法规则,并遵守xml规范的文档称之为"良好格式"。如果你所有的标识都严格遵守xml规范,那么你的xml文档就不一定需要dtd文件来定义它。

良好格式的文档必须以一个xml声明开始,例如:

<?xml version="1.0" standalone="yes" encoding="utf-8"?>

其中你必须说明文档遵守的xml版本,目前是1.0;其次说明文档是"独立的",它不需要dtd文件来验证其中的标识是否有效;第三,要说明文档所使用的语言编码。默认的是utf-8,如果使用中文,你需要设置为gb2312。

良好格式的xml文档必须有一个根元素,就是紧接着声明后面建立的第一个元素,其它元素都是这个根元素的子元素,属于根元素一组。

良好格式的xml文档的内容书写时必须遵守xml语法。(有关xml语法我们将在下一章仔细讲解)


7.valid xml(有效的xml)

一个遵守xml语法规则,并遵守相应dtd文件规范的xml文档称为有效的xml文档。注意我们比较"well-formed xml"和"valid
xml",它们最大的差别在于一个完全遵守xml规范,一个则有自己的"文件类型定义(dtd)"。

xml文档和它的dtd文件进行比较分析,看是否符合dtd规则的过程叫validation(确认)。这样的过程通常我们是通过一个名为parser的软件来处理的。

有效的xml文档也必须以一个xml声明开始,例如:

<?xml version="1.0" standalone="no" encode="utf-8"?>

和上面例子不同的,在standalone(独立)属性中,这里设置的是"no",因为它必须和相应的dtd一起使用,dtd文件的定义方法如下:

<!doctype type-of-doc system/public "dtd-name">

其中:

"!doctype"是指你要定义一个doctype;

"type-of-doc"是文档类型的名称,由你自己定义,通常于dtd文件名相同;

"system/public"这两个参数只用其一。system是指文档使用的私有dtd文件的网址,而public则指文档调用一个公用的dtd文件的网址。

"dtd-name" 就是dtd文件的网址和名称。所有dtd文件的后缀名为".dtd"。

我们还是用上面的例子,应该写成这样:

<?xml version="1.0" standalone="no" encode="utf-8"?>

<!doctype filelist system "filelist.dtd">


 


关键字 本文所属关键字

相关 与本文相关文章

分类 所有文章关键字导航

源码编程相关

Java   Asp   PHP   .Net   XML   C/C++   CGI   VB   Jsp   J2ee   J2se   J2me   EJB   Servlet   Tomcat   Resin   Struts   Weblogic   Eclipse   ANT   GUI   JMS   Web servise   IDEA   Webphere   Hibernate   Spring   Jboss   Applet   Swing   Socket   Javamail   Perl   Ajax   P2P   安全   模式   框架   测试   开源   游戏

SQL数据库相关

My-SQL   Ms-SQL   Access   DB2   Oracle   Sybase   SQLserver   索引   存储过程   加密   数据库   分页   视图  

手机无线相关

3G   Wap   CDMA   GRPS   GSM   IVR   彩信   短信   无线   增值业务

网页设计制作相关

HTML   CSS   网页配色   网页特效   Javascript   VBscript   Dreamweaver   Frontpage   JS   Web   网站设计

网站建设推广相关

建站经验   网站优化   网站排名   推广   Alexa

操作系统/服务器相关

Windows XP   Windows 2000   Windows 2003   Windows Me   Windows 9.x   Linux   UNIX   注册表   操作系统   服务器   应用服务器

图形图像多媒体相关

Photoshop   Fireworks   Flash   Coreldraw   Illustrator   Freehand   Photoimpact   多媒体   图形图像

标准 网站致力的规范

Valid CSS!

无不良内容,无不良广告,无恶意代码

Valid XHTML 1.0 Transitional

creativecommons