Excel - 查询 CSV 缺失列

Excel - Query for CSV missing columns

所以我正在使用 Office 2016 的新查询功能从各种 CSV API 端点获取数据。我设法让它与 Yahoo Finance 一起工作,但我似乎无法让 Morningstar 工作。当我在浏览器中访问此 link 时,我下载了包含所有正确数据的完整 CSV:

Link: http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=MSFT&reportType=is&period=12&dataType=A&order=asc&columnYear=10&number=3

但是,当我使用查询功能时,它只加载第一行。我猜这是因为只有 CSV 中第一行的第一列有数据,导致它忽略了其余列。有谁知道如何忽略第一行并从第二行开始导入 CSV?

let
    Source = Csv.Document(Web.Contents("http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=MSFT&reportType=is&period=12&dataType=A&order=asc&columnYear=10&number=3"),[Delimiter=",",Encoding=1252])
in
    Source

提前致谢!

编辑:在 Csv.Document 中,看起来有一个 extraValues 参数;也许这会有所帮助?

https://msdn.microsoft.com/en-us/library/mt260840.aspx?f=255&MSPPError=-2147217396:

let

Source = Csv.Document(File.Contents("C:\Projects\Examples\SalesForceContacts.txt"),
    [Delimiter=",",Encoding=1252]),
    #"First Row as Header" = Table.PromoteHeaders(Source),
    ...

但如果 header 行已损坏,这可能不起作用。

extra values 参数可以检索额外的行(使用 ExtraValues.List),但是 table 的形状将很难处理。

这是获取值的一种方法:

let
    Source = Table.FromColumns({Lines.FromBinary((Web.Contents("http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=MSFT&reportType=is&period=12&dataType=A&order=asc&columnYear=10&number=3")),null,null,1252)}),
    #"Removed Top Rows" = Table.Skip(Source,1),
    #"Split Column by Delimiter" = Table.SplitColumn(#"Removed Top Rows","Column1",Splitter.SplitTextByDelimiter(",", QuoteStyle.Csv),{"Column1.1", "Column1.2", "Column1.3", "Column1.4", "Column1.5", "Column1.6", "Column1.7"}),
    #"Changed Type" = Table.TransformColumnTypes(#"Split Column by Delimiter",{{"Column1.1", type text}, {"Column1.2", type text}, {"Column1.3", type text}, {"Column1.4", type text}, {"Column1.5", type text}, {"Column1.6", type text}, {"Column1.7", type text}}),
    #"Promoted Headers" = Table.PromoteHeaders(#"Changed Type")
in
    #"Promoted Headers"

此查询将 CSV 文件视为多行文本文档。它删除了第一行,这是一些 header 导致解析器认为 CSV 文件只有一列的语句。然后根据逗号位置将行拆分为列,然后将第一行作为列名。

除非您明确指定列数,否则使用第一行确定。 由于示例的第一行仅包含第一列中的值,因此结果 table 也仅包含一个。

这段代码returns 7列:

let
    Source = Web.Contents("http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=MSFT&reportType=is&period=12&dataType=A&order=asc&columnYear=10&number=3"),
    Csv = Csv.Document(Source,[Delimiter=",", Columns=7, Encoding=1252, QuoteStyle=QuoteStyle.None])
in
    Csv