使用 babeltrace 计算流中的所有事件 API

count all events in stream with babeltrace API

我有一个 LTTNg 跟踪,我正在使用 babeltrace API 对其进行解析。所以我想知道我是否可以在不迭代它们的情况下计算跟踪(或流)中的所有事件。我可以使用 publilc API 的哪些功能来做到这一点?

CTF的本质使得无法在恒定时间内统计给定数据包的事件记录。数据包的上下文可能以某种方式包含事件记录计数字段,但未指定,因此通用工具不会使用它。

因此,不幸的是,计算事件的唯一方法是迭代事件记录。最简单的方法是统计babeltrace(1)工具的text格式打印的行数:

babeltrace /path/to/ctf/trace/directory | wc --lines

只要每个打印的事件记录有一行,情况就是如此,除非事件记录包含一个带有换行符的字符串字段(当前在文本输出中未转义)。

您可能还希望考虑丢弃的事件记录。 babeltrace(1) 不会将它们打印到标准输出,但该工具会在检测到它们时打印一条消息,其中包括对标准错误的计数。

当前的 babeltrace(1) 工具无法只打印属于给定数据流数据包的事件记录。如果你需要这个,我建议你删除所有的数据流文件,除了你需要事件记录计数的那个,然后再次运行上面的命令。

还要考虑 Babeltrace Python 绑定,例如( 测试):

import babeltrace


def count_ctf_event_records(path):
    trace_collection = babeltrace.TraceCollection()
    trace_collection.add_trace(path, 'ctf')
    return sum(1 for event in trace_collection.events)


if __name__ == '__main__':
    import sys

    print(count_ctf_event_records(sys.argv[1]))

另存为count.py,你可以试试这个:

python3 count.py /path/to/ctf/trace/directory

使用 Python 绑定计算特定数据流的事件记录留作 reader.

的练习

话虽如此,我不知道 Python 绑定方法是否比 babeltrace(1) 方法更快。