选择显示字体大小

从字符文档到xml文档

    
  
  计算机世界尽管现在越来越多地试图使用unicode这一世界语来说话,但还是存在着gb2312,shift-jis这样的方言,使用msxml dom就会清楚地体会到方言的不便。
   我想将下面这个文本文档直接存为转换成xml,是否ok,答案是ng(no good)
  strxml="<?xml version=""1.0"" encoding=""gb2312""?><xml>这里是一些编码为gb2312的xml文档</xml>"
  set domxml = new domdocument
  domxml.loadxml strxml
  if domxml.parseerror then debug.print domxml.parseerror.reason else debug.print domxml.xml
   执行这段代码会返回switch from current encoding to specified encoding not supported.(不支持从当前编码转换到指定的编码)这样的错误信息。为什么会这样呢?chris lovett说:[loadxml 方法总是采用只在 ucs-2 或 utf-16 中编码的 unicode bstr。如果将非有效的 unicode bstr 的内容传递给 loadxml,则加载会失败。]
   因此我们不得不只加载没有用"方言"的文档给domdocument对象。将<?xml version="1.0" encoding="gb2312"?>去掉,这样的话strxml将作为unicode字符串交给dom处理。
  strxml="<xml>这里是一些编码为gb2312的xml文档</xml>"
   看到上面的用法,热爱自己语言的人们也许会大骂ms的。
   如果对这一问题深入研究一下,其实我们完全能做到将带有方言标志的文档直接加载到dom上,我编了一个小函数解决之一问题。
  private function str2xml(strori as string) as domdocument
  dim xmldoc as domdocument
  set xmldoc = new domdocument
  dim pi() as byte
  pi() = strconv(strori, vbfromunicode)
  xmldoc.load pi
  set str2xml = xmldoc
  end function
  我们用如下代码试一下
  set domxml = new domdocument
  set domxml = str2xml(strxml)
  if domxml.parseerror then debug.print domxml.parseerror.reason else debug.print domxml.xml
   就会发现正确输出了带<?xml version="1.0">标志的xml文档。但你如果用这个函数处理不带"方言"标志的文档可能会出现下面的错误
  an invalid character was found in text content.(在文本内容里存在非法字符)对于这个问题我也是在写这篇文章的时候才发现,我想在将一个text文档转换为xml文档的时候应该先检查一下语言标志吧。如果说方言交给我的函数去做,说世界语的就让他说吧。
  str2xml函数的原理是什么呢?
  从下面chris lovett的描述里我想大家不难作出解释。
  load 方法可将以下内容当作 variant
  1,(url):如果 variant 是 bstr,则将其理解为 url。
  2,(vt_array 或 vt_ui1): variant 也可以是包含原始编码字节的 safearray。
  3,(iunknown): 如果 variant 是 iunknown 接口,则 dom 文档为 istream、ipersiststream 和 ipersiststreaminit 调用 queryinterface。
   在msdn里没有提及load的非url应用,只是在ms的例子里能看到一些端倪,而且也是怪怪的。我的这篇文章也许可以称为msxml inside文章了吧。
   顺便提一下用xmlhttp发到server上的数据在转化为xml文档的时候就使用了load的这一用法。
  // load the posted xml data and save it to disk.
  xmldoc.load(request);
  
    


 


关键字 本文所属关键字

相关 与本文相关文章

分类 所有文章关键字导航

源码编程相关

Java   Asp   PHP   .Net   XML   C/C++   CGI   VB   Jsp   J2ee   J2se   J2me   EJB   Servlet   Tomcat   Resin   Struts   Weblogic   Eclipse   ANT   GUI   JMS   Web servise   IDEA   Webphere   Hibernate   Spring   Jboss   Applet   Swing   Socket   Javamail   Perl   Ajax   P2P   安全   模式   框架   测试   开源   游戏

SQL数据库相关

My-SQL   Ms-SQL   Access   DB2   Oracle   Sybase   SQLserver   索引   存储过程   加密   数据库   分页   视图  

手机无线相关

3G   Wap   CDMA   GRPS   GSM   IVR   彩信   短信   无线   增值业务

网页设计制作相关

HTML   CSS   网页配色   网页特效   Javascript   VBscript   Dreamweaver   Frontpage   JS   Web   网站设计

网站建设推广相关

建站经验   网站优化   网站排名   推广   Alexa

操作系统/服务器相关

Windows XP   Windows 2000   Windows 2003   Windows Me   Windows 9.x   Linux   UNIX   注册表   操作系统   服务器   应用服务器

图形图像多媒体相关

Photoshop   Fireworks   Flash   Coreldraw   Illustrator   Freehand   Photoimpact   多媒体   图形图像

标准 网站致力的规范

Valid CSS!

无不良内容,无不良广告,无恶意代码

Valid XHTML 1.0 Transitional

creativecommons