Excel - 查询 CSV 缺失列
Excel - Query for CSV missing columns
所以我正在使用 Office 2016 的新查询功能从各种 CSV API 端点获取数据。我设法让它与 Yahoo Finance 一起工作,但我似乎无法让 Morningstar 工作。当我在浏览器中访问此 link 时,我下载了包含所有正确数据的完整 CSV:
但是,当我使用查询功能时,它只加载第一行。我猜这是因为只有 CSV 中第一行的第一列有数据,导致它忽略了其余列。有谁知道如何忽略第一行并从第二行开始导入 CSV?
let
Source = Csv.Document(Web.Contents("http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=MSFT&reportType=is&period=12&dataType=A&order=asc&columnYear=10&number=3"),[Delimiter=",",Encoding=1252])
in
Source
提前致谢!
编辑:在 Csv.Document 中,看起来有一个 extraValues 参数;也许这会有所帮助?
见https://msdn.microsoft.com/en-us/library/mt260840.aspx?f=255&MSPPError=-2147217396:
let
Source = Csv.Document(File.Contents("C:\Projects\Examples\SalesForceContacts.txt"),
[Delimiter=",",Encoding=1252]),
#"First Row as Header" = Table.PromoteHeaders(Source),
...
但如果 header 行已损坏,这可能不起作用。
extra values 参数可以检索额外的行(使用 ExtraValues.List),但是 table 的形状将很难处理。
这是获取值的一种方法:
let
Source = Table.FromColumns({Lines.FromBinary((Web.Contents("http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=MSFT&reportType=is&period=12&dataType=A&order=asc&columnYear=10&number=3")),null,null,1252)}),
#"Removed Top Rows" = Table.Skip(Source,1),
#"Split Column by Delimiter" = Table.SplitColumn(#"Removed Top Rows","Column1",Splitter.SplitTextByDelimiter(",", QuoteStyle.Csv),{"Column1.1", "Column1.2", "Column1.3", "Column1.4", "Column1.5", "Column1.6", "Column1.7"}),
#"Changed Type" = Table.TransformColumnTypes(#"Split Column by Delimiter",{{"Column1.1", type text}, {"Column1.2", type text}, {"Column1.3", type text}, {"Column1.4", type text}, {"Column1.5", type text}, {"Column1.6", type text}, {"Column1.7", type text}}),
#"Promoted Headers" = Table.PromoteHeaders(#"Changed Type")
in
#"Promoted Headers"
此查询将 CSV 文件视为多行文本文档。它删除了第一行,这是一些 header 导致解析器认为 CSV 文件只有一列的语句。然后根据逗号位置将行拆分为列,然后将第一行作为列名。
除非您明确指定列数,否则使用第一行确定。
由于示例的第一行仅包含第一列中的值,因此结果 table 也仅包含一个。
这段代码returns 7列:
let
Source = Web.Contents("http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=MSFT&reportType=is&period=12&dataType=A&order=asc&columnYear=10&number=3"),
Csv = Csv.Document(Source,[Delimiter=",", Columns=7, Encoding=1252, QuoteStyle=QuoteStyle.None])
in
Csv
所以我正在使用 Office 2016 的新查询功能从各种 CSV API 端点获取数据。我设法让它与 Yahoo Finance 一起工作,但我似乎无法让 Morningstar 工作。当我在浏览器中访问此 link 时,我下载了包含所有正确数据的完整 CSV:
但是,当我使用查询功能时,它只加载第一行。我猜这是因为只有 CSV 中第一行的第一列有数据,导致它忽略了其余列。有谁知道如何忽略第一行并从第二行开始导入 CSV?
let
Source = Csv.Document(Web.Contents("http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=MSFT&reportType=is&period=12&dataType=A&order=asc&columnYear=10&number=3"),[Delimiter=",",Encoding=1252])
in
Source
提前致谢!
编辑:在 Csv.Document 中,看起来有一个 extraValues 参数;也许这会有所帮助?
见https://msdn.microsoft.com/en-us/library/mt260840.aspx?f=255&MSPPError=-2147217396:
let
Source = Csv.Document(File.Contents("C:\Projects\Examples\SalesForceContacts.txt"),
[Delimiter=",",Encoding=1252]),
#"First Row as Header" = Table.PromoteHeaders(Source),
...
但如果 header 行已损坏,这可能不起作用。
extra values 参数可以检索额外的行(使用 ExtraValues.List),但是 table 的形状将很难处理。
这是获取值的一种方法:
let
Source = Table.FromColumns({Lines.FromBinary((Web.Contents("http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=MSFT&reportType=is&period=12&dataType=A&order=asc&columnYear=10&number=3")),null,null,1252)}),
#"Removed Top Rows" = Table.Skip(Source,1),
#"Split Column by Delimiter" = Table.SplitColumn(#"Removed Top Rows","Column1",Splitter.SplitTextByDelimiter(",", QuoteStyle.Csv),{"Column1.1", "Column1.2", "Column1.3", "Column1.4", "Column1.5", "Column1.6", "Column1.7"}),
#"Changed Type" = Table.TransformColumnTypes(#"Split Column by Delimiter",{{"Column1.1", type text}, {"Column1.2", type text}, {"Column1.3", type text}, {"Column1.4", type text}, {"Column1.5", type text}, {"Column1.6", type text}, {"Column1.7", type text}}),
#"Promoted Headers" = Table.PromoteHeaders(#"Changed Type")
in
#"Promoted Headers"
此查询将 CSV 文件视为多行文本文档。它删除了第一行,这是一些 header 导致解析器认为 CSV 文件只有一列的语句。然后根据逗号位置将行拆分为列,然后将第一行作为列名。
除非您明确指定列数,否则使用第一行确定。 由于示例的第一行仅包含第一列中的值,因此结果 table 也仅包含一个。
这段代码returns 7列:
let
Source = Web.Contents("http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=MSFT&reportType=is&period=12&dataType=A&order=asc&columnYear=10&number=3"),
Csv = Csv.Document(Source,[Delimiter=",", Columns=7, Encoding=1252, QuoteStyle=QuoteStyle.None])
in
Csv