为什么并行代码不会写入 Excel 电子表格?
Why parallelized code will not write in an Excel spreadsheet?
在 Excel
电子表格中编写许多工作表可能需要一段时间。并行化它会很有帮助。
此代码运行良好,它在屏幕上弹出一个 Excel
电子表格,其中包含四个名为 Sheet1
、1
、2
和 [=18= 的工作表].
open Microsoft.Office.Interop.Excel
open FSharp.Collections.ParallelSeq
let backtestWorksheets = [1..3]
let app = new ApplicationClass(Visible = true)
let workbook = app.Workbooks.Add(XlWBATemplate.xlWBATWorksheet)
let writeInfoSheet (worksheet: Worksheet) : unit =
let foo i =
let si = string i
worksheet.Range("A" + si, "A" + si).Value2 <- "Hello " + si
List.iter foo [1..10]
let wfm = [1, writeInfoSheet; 2, writeInfoSheet; 3, writeInfoSheet]
|> Map.ofList
let adder (workbook : Workbook)
(i : int)
: unit =
let sheet = workbook.Worksheets.Add() :?> Worksheet
sheet.Name <- string i
wfm.[i] sheet
List.iter (adder workbook) backtestWorksheets
//PSeq.iter (adder workbook) backtestWorksheets
[<EntryPoint>]
let main argv =
printfn "%A" argv
0 // return an integer exit code
但是,将以 List.iter
开头的行替换为其正下方的注释行会弹出一个包含相同四个工作表的电子表格,但所有工作表都是空白的。
所以我的问题是:为什么不能使用 PSeq 并行化的代码写入 Excel?
备注:
最初我有一个不同的问题。可能是因为在我的应用程序中,当我尝试使用 运行 与上面类似的 PSeq
代码时,工作表较重,但有一个异常显示
Unhandled Exception: System.TypeInitializationException: The type initializer for '<StartupCode$Fractal13>.$Program' threw an exception. ---> System.AggregateException: One or more errors occurred. ---> System.Runtime.InteropServices.COMException: The message filter indicated that the application is busy. (Exception from HRESULT: 0x8001010A (RPC_E_SERVERCALL_RETRYLATER))
用 List.iter
替换 PSeq.iter
不会发生这种情况。
我无法在足够简单的上下文中复制此异常以成为一个适当的 SO 问题,但我仍然对处理它的任何建议感兴趣。
看起来 Microsoft.Office.Interop.Excel
代码从未设计为同时从多个线程调用。 Here's a question someone asked 在 MS Office 论坛中关于在多线程中进行更新(在 C# 中)。我将在这里引用该答案的相关部分:
Using multi-threading to search in multiple worksheets ends up with using the heart of Excel – the Excel.Application object, which means threads need to be queued to run one-at a time, depriving you of the desired performance improvement for the application.
[...]
All of this is because the Office object model isn't thread safe.
如果您在 Microsoft.Office.Interop
命名空间中调用任何东西,您似乎无法使用非并行设计。
编辑: Aaron M. Eshbach 在评论中有一个很好的建议:在多个线程上完成所有后台工作,并使用 MailboxProcessor
来完成电子表格的实际更新。 MailboxProcessor 的消息队列将自动为您序列化更新操作,您无需额外的工作。
在 Excel
电子表格中编写许多工作表可能需要一段时间。并行化它会很有帮助。
此代码运行良好,它在屏幕上弹出一个 Excel
电子表格,其中包含四个名为 Sheet1
、1
、2
和 [=18= 的工作表].
open Microsoft.Office.Interop.Excel
open FSharp.Collections.ParallelSeq
let backtestWorksheets = [1..3]
let app = new ApplicationClass(Visible = true)
let workbook = app.Workbooks.Add(XlWBATemplate.xlWBATWorksheet)
let writeInfoSheet (worksheet: Worksheet) : unit =
let foo i =
let si = string i
worksheet.Range("A" + si, "A" + si).Value2 <- "Hello " + si
List.iter foo [1..10]
let wfm = [1, writeInfoSheet; 2, writeInfoSheet; 3, writeInfoSheet]
|> Map.ofList
let adder (workbook : Workbook)
(i : int)
: unit =
let sheet = workbook.Worksheets.Add() :?> Worksheet
sheet.Name <- string i
wfm.[i] sheet
List.iter (adder workbook) backtestWorksheets
//PSeq.iter (adder workbook) backtestWorksheets
[<EntryPoint>]
let main argv =
printfn "%A" argv
0 // return an integer exit code
但是,将以 List.iter
开头的行替换为其正下方的注释行会弹出一个包含相同四个工作表的电子表格,但所有工作表都是空白的。
所以我的问题是:为什么不能使用 PSeq 并行化的代码写入 Excel?
备注:
最初我有一个不同的问题。可能是因为在我的应用程序中,当我尝试使用 运行 与上面类似的 PSeq
代码时,工作表较重,但有一个异常显示
Unhandled Exception: System.TypeInitializationException: The type initializer for '<StartupCode$Fractal13>.$Program' threw an exception. ---> System.AggregateException: One or more errors occurred. ---> System.Runtime.InteropServices.COMException: The message filter indicated that the application is busy. (Exception from HRESULT: 0x8001010A (RPC_E_SERVERCALL_RETRYLATER))
用 List.iter
替换 PSeq.iter
不会发生这种情况。
我无法在足够简单的上下文中复制此异常以成为一个适当的 SO 问题,但我仍然对处理它的任何建议感兴趣。
看起来 Microsoft.Office.Interop.Excel
代码从未设计为同时从多个线程调用。 Here's a question someone asked 在 MS Office 论坛中关于在多线程中进行更新(在 C# 中)。我将在这里引用该答案的相关部分:
Using multi-threading to search in multiple worksheets ends up with using the heart of Excel – the Excel.Application object, which means threads need to be queued to run one-at a time, depriving you of the desired performance improvement for the application.
[...]
All of this is because the Office object model isn't thread safe.
如果您在 Microsoft.Office.Interop
命名空间中调用任何东西,您似乎无法使用非并行设计。
编辑: Aaron M. Eshbach 在评论中有一个很好的建议:在多个线程上完成所有后台工作,并使用 MailboxProcessor
来完成电子表格的实际更新。 MailboxProcessor 的消息队列将自动为您序列化更新操作,您无需额外的工作。