C++ pause/resume system on large operation

Question

我有一个 C++ 程序加载一个几百万行的文件并开始处理，同样的操作是由 php 脚本完成的，但为了减少执行时间我切换到 C++。

在旧脚本中，我检查了"pause"文件夹中是否有当前操作id的文件，该文件为空只是为了检查是否请求暂停，然后脚本检查每 5 次迭代后，如果有这样的文件，如果有，它会卡在一个空循环中，直到文件被删除（a.k.a 恢复）：

foreach($lines as $line)
    {
        $isFinished = $index >= $countData - 1;
        if($index % 5 == 0)
        {
            do
            {
                $isPaused = file_exists("/home/pauses/".$content->{'drop-id'});
            }while($isPaused);
        }
        // Starts processing the line here 
}

但由于磁盘访问相对较慢，我不想采用相同的方法，所以我在考虑某种模拟此操作的命令:

$ kill cpp_program // C++ program returns the last index checked e.g: 37710
$ ./main 37710
$ // cpp_program escapes the first 37709 lines and continues its job

您如何看待这种做法？可行吗？不费时吗？有没有更好的方法？谢谢

编辑：澄清一下，因为这看起来有点模棱两可，这个任务在后台运行，有另一个应用程序启动这个，我希望能够从管理应用程序发送命令（通过 Linux 命令）到后台任务到 pause/resume.

Answer 1

遗憾的是，在大多数操作系统上，跳转到文本文件的第 37710 行需要阅读它之前的所有 37710 行。

在大多数操作系统上，文本文件是二进制文件，具有关于换行符的约定。但是 OS 不会缓存换行符所在的位置。

所以要找到换行符，您必须读取每个字节。

如果您的程序保存了它到达的文件的 字节偏移量，它可以搜索到那个位置，但是。

您可以在关闭时将程序状态保存到某个配置文件中，并将其设置为在再次启动时默认恢复。这将需要捕获您用来关闭的信号，让您的主逻辑注意到信号标志被设置，然后干净地关闭。这是一个非常C语言的操作。

现在，另一种使程序可远程控制的传统方法是让它侦听 TCP 端口（and/or stdin）并在那里执行命令行命令。

要做到这一点，您需要编写一个 REPL 组件，然后将其连接到任何输入和输出。

要么在处理文件之间以类似协程的方式执行 REPL，要么生成一个单独的线程来执行 REPL 并让它与处理线程异步通信。

但是，这可能超出了您的技能范围。这其中的每一步（编写一个 REPL 系统，使其不阻塞主要工作，响应命令，然后将其附加到 TCP 端口）都需要您付出一些努力和学习。

C++ pause/resume system on large operation

C++ pause/resume system on large operation

c++

performance

resume

pause