选择显示字体大小

xml入门的常见问题(四)

  在 xml 对象模型中如何处理空白字符?

  有些时候,xml 对象模型将显示包含空白字符的 text 节点。空白字符被截断后,多半会带来一些混乱。例如下面的 xml 例子:


   ]>
  smith
  john
 

  生成下列树:


   processing instruction: xml
  doctype: person
  element: person
  text:
  element: lastname
  text:
  element: firstname
  text: 


  名字和姓氏两边是只包含空白字符的 text 节点,因为“person”元素的内容模型是 mixed;它包含 #pcdata 关键字。mixed 内容模型指定元素之间可以有文本存在。因此,下面的内容也是正确的:


   my last name is smith and my first name is
  john


  结果是类似于下面的树:


   element: person
  text: my last name is
  element: lastname
  text: and my first name is
  element: firstname
  text: 


  如果没有单词“is”之后和 之前的空白字符,以及 之后和单词“and”之前的空白字符,那么句子便无法理解。因此,对于 mixed 内容模型来说,文字组合、空白字符和元素都是相关的。对于非 mixed 内容模型来说则不是这样。

  要使只有空白字符的 text 节点消失,请从“person”元素声明中删除 #pcdata 关键字:

  结果是下面清晰的树:


   processing instruction: xml
  doctype: person
  element: person
  element: lastname
  element: firstname

  xml 声明做什么?

  xml 声明必须列在 xml 文档的顶部:

  它指定下面的项目:

  该文档是 xml 文档。在丢失或者还没有指定 mime 类型时 mime 探测器可以用它来检测文件是否为类型 text/xml
  文档符合 xml 1.0 规范。在以后 xml 有其他版本时这一点很重要。
  文档字符编码。编码属性是可选的,默认为 utf-8。
  注意:xml 声明必须在 xml 文档的第一行,因此下面的 xml 文件:

  产生下面的分析错误:

  无效的 xml 声明。
  行 0000002:    
  位置  0000007: ------^
  注意:xml 声明是可选的。如果需要在顶部指定注释或者处理指令,那么请不要放入 xml 声明。但是,默认的编码将为 utf-8。

  如何以可读格式打印我的 xml 文档?

  在用 dom 从零开始构造文档以产生 xml 文件时,任何内容都在一行上,相互之间没有空格。这是默认的行为。

  构造在 inte.net explorer 5 中的默认 xsl 样式表,以可读格式显示和打印 xml 文档。例如,如果已经安装了 ie5,请尝试查看 nospace.xml 文件。浏览器中应该显示下面的树:

  -
  -
  xyz
  12.56

  在 xml 中没有插入空白字符。

  打印可读 xml 是非常有趣的,特别是有定义不同类型内容模型的 dtd 时。例如,在混合内容模型 (#pcdata) 下不能插入空格,因为它可能改变内容的含义。比如请考虑下面的 xml

  elephant
  这最好不输出为:

  e
  lephant
  因为单词边界不再正确。

  所有这些都使自动化打印成为问题。如果不需要打印可读 xml,那么可以使用 dom 在适当的位置插入空白字符作为文本节点。

  如何在 dtd 中使用名称空间? 要在 dtd 中使用名称空间,请在使用它的元素的 attlist 声明中声明它,如下所示:

  名称空间类型必须为 #fixed。属性的名称空间也是这样:

  名称空间和 xml 架构
  dtd 和 xml 架构不能混合。例如,下面的


   xmlns:x cdata #fixed "x-schema:myschema.xml"


  将不导致使用在 myschema.xml 中定义的架构定义。对 dtd 和 xml 架构的使用是互斥的。

  如何在 visual basic 中使用 xmldso?

  使用下面的 xml 作为例子:


   mark hanson
  206 765 4583
  
  jane smith
  425 808 1111 


  可以按如下方式绑定到 ado 记录集:

  创建新的 vb 6.0 项目。

  添加对 microsoft activex data objects 2.1 或更高版本、microsoft data adapter library 和 microsoft xml 2.0 版的引用。

  用下面的代码将 xml 数据加载到 xml dso 控件中:


   dim dso as new xmldsocontrol
  dim doc as ixmldomdocument
  set doc = dso.xmldocument
  doc.load ("d:\test.xml")

  用下面的代码将 dso 映射到使用 dataadapter 的新记录集对象中:


   dim da as new dataadapter
  set da.object = dso
  dim rs as new adodb.recordset
  set rs.datasource = da


  访问数据:


   msgbox rs.fields("name").value

  结果显示字符串“mark hanson”
  如何在 java 中使用 xml dom?

  必须已经安装 msxml.dll 的 ie5 版本。在 visual j++ 6.0 中,从项目菜单选择添加 com 包装程序,然后从 com 对象列表中选择“microsoft xml 1.0”。该操作将把所需的 java 包装程序构造到称为“msxml”的新软件包中。这些预先构造的 java 包装程序也可以下载。类可以按如下方法使用:


   import com.ms.com.*;
  import msxml.*;
  public class class1
  {
  public static void main (string[] args)
  {
  domdocument doc = new domdocument();
  doc.load(new variant("file://d:/samples/ot.xml"));
  system.out.println("loaded " + doc.getdocumentelement().getnodename());
  }
  }

 

  代码示例将从 sun religion 示例中加载 3.8mb 测试文件“ot.xml”。variant 类用于包装 win32 variant 基本类型。

  因为在每次检索节点时实际上都获得了新的包装程序,因此不能在节点上使用指针比较。因此,不要使用下面的代码,


   ixmldomnode root1 = doc.getdocumentelement();
  ixmldomnode root2 = doc.getdocumentelement();
  if (root1 == root2)...

 

  而要使用下面的代码:


   if (comlib.isequalunknown(root1, root2)) ....

 

  .class 包装程序的总大小大约为 160kb。但是,为了与 w3c 规范完全符合,应该只使用 ixmldom* 包装程序。下面的类是旧的 ie 4.0 xml 接口,可以从 msxml 文件夹中删除它们:


   ixmlattribute*,
  ixmldocument*, xmldocument*
  ixmlelement*,
  ixmlerror*,
  ixmlelementcollection*,
  tagxmlemem_type*
  _xml_error* 

 

  这使大小减少为 147kb。同时还可以删除下面的项目:


   domfreethreadeddocument
  在 java 应用程序中从多个线程访问 xml 文档。
  xmlhttprequest
  用 xml dav http 扩展与服务器通信。
  ixtlruntime
  定义 xsl 样式表脚本对象。
  xmldsocontrol
  绑定到 html 页面中的 xml 数据。
  xmldomdocumentevents
  在分析过程中返回回调。 

 

  这可以将大小减少到 116kb。要使它更小,请考虑 dom 本身有两层的事实:核心层包括:


   domdocument, ixmldomdocument
  ixmldomnode*
  ixmldomnodelist*
  ixmldomnamednodemap*
  ixmldomdocumentfragment*
  ixmldomimplementation
  ixmldomparseerror 


  和用户可能需要保留的 dtd 信息:


   ixmldomdocumenttype
  ixmldomentity
  ixmldomnotation 


  xml 文档中的所有节点类型都是 ixmldomnode,它提供全部功能,但是存在每种节点类型的更高级别的包装程序。因此,如果修改 domdocument 包装程序并将这些特定类型更改为使用 ixmldomnode,那么所有下面的接口都可以删除:


   ixmldomattribute
  ixmldomcdatasection
  ixmldomcharacterdata
  ixmldomcomment
  ixmldomelement
  ixmldomprocessinginstruction
  ixmldomentityreference
  ixmldomtext
 

  删除这些将使大小减少到 61kb。但是,对 ixmldomelement 来说,getattribute 和 setattribute 方法都是有用的。否则需要使用:


   ixmldomnode.getattributes().setnameditem(...)
 


 


关键字 本文所属关键字

相关 与本文相关文章

分类 所有文章关键字导航

源码编程相关

Java   Asp   PHP   .Net   XML   C/C++   CGI   VB   Jsp   J2ee   J2se   J2me   EJB   Servlet   Tomcat   Resin   Struts   Weblogic   Eclipse   ANT   GUI   JMS   Web servise   IDEA   Webphere   Hibernate   Spring   Jboss   Applet   Swing   Socket   Javamail   Perl   Ajax   P2P   安全   模式   框架   测试   开源   游戏

SQL数据库相关

My-SQL   Ms-SQL   Access   DB2   Oracle   Sybase   SQLserver   索引   存储过程   加密   数据库   分页   视图  

手机无线相关

3G   Wap   CDMA   GRPS   GSM   IVR   彩信   短信   无线   增值业务

网页设计制作相关

HTML   CSS   网页配色   网页特效   Javascript   VBscript   Dreamweaver   Frontpage   JS   Web   网站设计

网站建设推广相关

建站经验   网站优化   网站排名   推广   Alexa

操作系统/服务器相关

Windows XP   Windows 2000   Windows 2003   Windows Me   Windows 9.x   Linux   UNIX   注册表   操作系统   服务器   应用服务器

图形图像多媒体相关

Photoshop   Fireworks   Flash   Coreldraw   Illustrator   Freehand   Photoimpact   多媒体   图形图像

标准 网站致力的规范

Valid CSS!

无不良内容,无不良广告,无恶意代码

Valid XHTML 1.0 Transitional

creativecommons