Rails 4: 如何直接从 URL 导入 Excel 文件?
Rails 4: How can I import an Excel file directly from a URL?
导航 here and search for "Download All Holdings" and you will arrive at the link 到我要抓取的文件(headers 和单元格内容)。
当我传入 table link(不是 table 内容)时,使用 open-uri 或 Roo returns 页面源。
使用Ruby,如何读取这个文件的内容?理想情况下,我想提取内容并将原始文件保存为 read-only 格式。
注意:我已经在使用 Mechanize/Nokogiri 进行抓取,并希望 supplement/validate 使用 linked Excel 文件进行抓取,例如上面的文件。
请确保使用 Roo::Spreadsheet
而不是 Roo::Excelx
,因为只有 Roo::Spreadsheet
可以直接打开远程 URL:
url = 'https://www.spdrs.com/site-content/xls/TOTL_All_Holdings.xls?fund=TOTL&docname=All+Holdings&onyx_code1=1286&onyx_code2='
sheet = Roo::Spreadsheet.open(url)
导航 here and search for "Download All Holdings" and you will arrive at the link 到我要抓取的文件(headers 和单元格内容)。
当我传入 table link(不是 table 内容)时,使用 open-uri 或 Roo returns 页面源。
使用Ruby,如何读取这个文件的内容?理想情况下,我想提取内容并将原始文件保存为 read-only 格式。
注意:我已经在使用 Mechanize/Nokogiri 进行抓取,并希望 supplement/validate 使用 linked Excel 文件进行抓取,例如上面的文件。
请确保使用 Roo::Spreadsheet
而不是 Roo::Excelx
,因为只有 Roo::Spreadsheet
可以直接打开远程 URL:
url = 'https://www.spdrs.com/site-content/xls/TOTL_All_Holdings.xls?fund=TOTL&docname=All+Holdings&onyx_code1=1286&onyx_code2='
sheet = Roo::Spreadsheet.open(url)