使用 SQL Server 2012 嵌入 XSD 的 OPENXML

OPENXML with an embedded XSD using SQL Server 2012

我希望这个论坛能帮到我。我对 OpenXML 一无所知,我必须将几个文件加载到 SQL Server 2012。源更改了文件格式以包含嵌入式 xsd 模式,我遇到了麻烦。如果我修改它以开始并删除所有 xsd 东西,我可以调用这些值。大多数文件都非常大,无法全部编辑,所以我需要弄清楚如何在不编辑的情况下查询它。下面是我在文件上使用的查询,我从中删除了 xsd 行。可以在此处获得未经编辑的 xml 的副本 https://drive.google.com/file/d/1CIeDWTSAHFCIyz8F2zrtLCDpqe-uUeJv/view?usp=sharing

论坛上的这个 post 看起来像我需要的,但我不太明白它与我的文件一起使用。 OPENXML with xmlns:dt

DECLARE @fileData XML

SELECT @fileData = BulkColumn 
FROM OpenRowSet(BULK 'C:\ogrid - Copy.xml',Single_blob) x;

SELECT 
    xdata.value('ogrid_cde[1]','int') ogrid_cde,
    xData.value('ogrid_nam[1]','nvarchar(255)') ogrid_name,
    xData.value('ogrid_adr_nam[1]','nvarchar(255)') ogrid_adr_name,
    xData.value('mail_stop[1]','nvarchar(255)') mail_stop,
    xData.value('line1_adr[1]','nvarchar(255)') line1_adr,
    xData.value('line2_adr[1]','nvarchar(255)') line2_adr,
    xData.value('line3_adr[1]','nvarchar(255)') line3_adr,
    xData.value('city_nam[1]','nvarchar(255)') city_name,
    xData.value('st_nam[1]','nvarchar(255)') st_name,
    xData.value('zip_cde[1]','nvarchar(255)') zip_cde,
    xData.value('ctry_nam[1]','nvarchar(255)') ctry_name,
    xData.value('phone_num[1]','decimal(28,10)') phone_num,
    xData.value('fax_num[1]','decimal(28,10)') fax_num,
    xData.value('stat_eff_dte[1]','datetime') stat_eff_dte,
    xData.value('issng_ag_cde[1]','nvarchar(255)') issng_ag_cde,
    xData.value('lst_modified_dte[1]','datetime') last_modified_dte,
    xData.value('created_dte[1]','datetime') created_dte,
    xData.value('ogrid_stat_cde[1]','nvarchar(255)') ogrid_stat_cde
FROM 
    @fileData.nodes('root/ogrid') AS x(xData)

这是从源接收时包含 xsd 的文件示例。

<root xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
    <xsd:schema targetNamespace="urn:schemas-microsoft-com:sql:SqlRowSet1" 
         xmlns:schema="urn:schemas-microsoft-com:sql:SqlRowSet1" 
         xmlns:xsd="http://www.w3.org/2001/XMLSchema" 
         xmlns:sqltypes="http://schemas.microsoft.com/sqlserver/2004/sqltypes" 
         elementFormDefault="qualified">
        <xsd:import namespace="http://schemas.microsoft.com/sqlserver/2004/sqltypes" 
             schemaLocation="http://schemas.microsoft.com/sqlserver/2004/sqltypes/sqltypes.xsd"/>
        <xsd:element name="ogrid">
            <xsd:complexType>
                <xsd:sequence>
                    <xsd:element name="ogrid_cde" type="sqltypes:int" nillable="1"/>
                    <xsd:element name="ogrid_nam" nillable="1">
                        <xsd:simpleType>
                            <xsd:restriction base="sqltypes:char" sqltypes:localeId="1033" sqltypes:sqlCompareOptions="IgnoreCase IgnoreKanaType IgnoreWidth" sqltypes:sqlSortId="52">

您必须使用 WITH XMLNAMESPACES 声明命名空间,然后在查询名称时使用模式前缀(在我的示例中为 ns1)作为名称前缀。所以你的代码应该变成这样:

DECLARE @fileData XML

SELECT @fileData = BulkColumn 
FROM OpenRowSet(BULK 'E:\inbox\ogrid.xml',Single_blob) x;

WITH XMLNAMESPACES ('urn:schemas-microsoft-com:sql:SqlRowSet1' as ns1)  
SELECT 
    xdata.value('ns1:ogrid_cde[1]','int') ogrid_cde,
    xData.value('ns1:ogrid_nam[1]','nvarchar(255)') ogrid_name,
    xData.value('ns1:ogrid_adr_nam[1]','nvarchar(255)') ogrid_adr_name,
    xData.value('ns1:mail_stop[1]','nvarchar(255)') mail_stop,
    xData.value('ns1:line1_adr[1]','nvarchar(255)') line1_adr,
    xData.value('ns1:line2_adr[1]','nvarchar(255)') line2_adr,
    xData.value('ns1:line3_adr[1]','nvarchar(255)') line3_adr,
    xData.value('ns1:city_nam[1]','nvarchar(255)') city_name,
    xData.value('ns1:st_nam[1]','nvarchar(255)') st_name,
    xData.value('ns1:zip_cde[1]','nvarchar(255)') zip_cde,
    xData.value('ns1:ctry_nam[1]','nvarchar(255)') ctry_name,
    xData.value('ns1:phone_num[1]','decimal(28,10)') phone_num,
    xData.value('ns1:fax_num[1]','decimal(28,10)') fax_num,
    xData.value('ns1:stat_eff_dte[1]','datetime') stat_eff_dte,
    xData.value('ns1:issng_ag_cde[1]','nvarchar(255)') issng_ag_cde,
    xData.value('ns1:lst_modified_dte[1]','datetime') last_modified_dte,
    xData.value('ns1:created_dte[1]','datetime') created_dte,
    xData.value('ns1:ogrid_stat_cde[1]','nvarchar(255)') ogrid_stat_cde
FROM 
    @fileData.nodes('root/ns1:ogrid') AS x(xData)

此外,decimal(28,10) 类型对于 phone 和传真号码没有多大意义。

更重要的是,告诉你的主管你公布了所有数据——姓名、地址、phone 号码等。你的公司可能需要知道这些。下次您想这样做时,请修改 XML 以仅在其中保留几行并将数据匿名化。