xerces-c是否有默认编码,是否可以修改?

Does xerces-c have a default encoding and can it be modified?

xerces-c 是否将所有字符解码为默认编码?如果可以的话,这个默认编码是否可以由用户指定。

解析 UTF-8 编码时 XML 回调的 chars 参数

DefaultHandler::characters( const XMLCh *const chars, const XMLSize_t length )

不再使用 UTF-8。例如,英镑符号 0xC2 0xA3 在 UTF-8 中显示为 0x00 0xA3。这使我得出结论,xerces-c 正在解码字符串,而我不希望它这样做。我想自己处理解码。

找到了。编码可以通过InputSource::setEncoding(const XMLCh* const encodingStr)

设置