计算机世界尽管现在越来越多地试图使用unicode这一世界语来说话,但还是存在着gb2312,shift-jis这样的方言,使用msxml dom就会清楚地体会到方言的不便。
我想将下面这个文本文档直接存为转换成xml,是否ok,答案是ng(no good)
strxml="<?xml version=""1.0"" encoding=""gb2312""?><xml>这里是一些编码为gb2312的xml文档</xml>"
set domxml = new domdocument
domxml.loadxml strxml
if domxml.parseerror then debug.print domxml.parseerror.reason else debug.print domxml.xml
执行这段代码会返回switch from current encoding to specified encoding not supported.(不支持从当前编码转换到指定的编码)这样的错误信息。为什么会这样呢?chris lovett说:[loadxml 方法总是采用只在 ucs-2 或 utf-16 中编码的 unicode bstr。如果将非有效的 unicode bstr 的内容传递给 loadxml,则加载会失败。]
因此我们不得不只加载没有用"方言"的文档给domdocument对象。将<?xml version="1.0" encoding="gb2312"?>去掉,这样的话strxml将作为unicode字符串交给dom处理。
strxml="<xml>这里是一些编码为gb2312的xml文档</xml>"
看到上面的用法,热爱自己语言的人们也许会大骂ms的。
如果对这一问题深入研究一下,其实我们完全能做到将带有方言标志的文档直接加载到dom上,我编了一个小函数解决之一问题。
private function str2xml(strori as string) as domdocument
dim xmldoc as domdocument
set xmldoc = new domdocument
dim pi() as byte
pi() = strconv(strori, vbfromunicode)
xmldoc.load pi
set str2xml = xmldoc
end function
我们用如下代码试一下
set domxml = new domdocument
set domxml = str2xml(strxml)
if domxml.parseerror then debug.print domxml.parseerror.reason else debug.print domxml.xml
就会发现正确输出了带<?xml version="1.0">标志的xml文档。但你如果用这个函数处理不带"方言"标志的文档可能会出现下面的错误
an invalid character was found in text content.(在文本内容里存在非法字符)对于这个问题我也是在写这篇文章的时候才发现,我想在将一个text文档转换为xml文档的时候应该先检查一下语言标志吧。如果说方言交给我的函数去做,说世界语的就让他说吧。
str2xml函数的原理是什么呢?
从下面chris lovett的描述里我想大家不难作出解释。
load 方法可将以下内容当作 variant:
1,(url):如果 variant 是 bstr,则将其理解为 url。
2,(vt_array 或 vt_ui1): variant 也可以是包含原始编码字节的 safearray。
3,(iunknown): 如果 variant 是 iunknown 接口,则 dom 文档为 istream、ipersiststream 和 ipersiststreaminit 调用 queryinterface。
在msdn里没有提及load的非url应用,只是在ms的例子里能看到一些端倪,而且也是怪怪的。我的这篇文章也许可以称为msxml inside文章了吧。
顺便提一下用xmlhttp发到server上的数据在转化为xml文档的时候就使用了load的这一用法。
// load the posted xml data and save it to disk.
xmldoc.load(request);
Java Asp PHP .Net XML C/C++ CGI VB Jsp J2ee J2se J2me EJB Servlet Tomcat Resin Struts Weblogic Eclipse ANT GUI JMS Web servise IDEA Webphere Hibernate Spring Jboss Applet Swing Socket Javamail Perl Ajax P2P 安全 模式 框架 测试 开源 游戏
Windows XP Windows 2000 Windows 2003 Windows Me Windows 9.x Linux UNIX 注册表 操作系统 服务器 应用服务器