如何编辑现有的 Tensorboard 训练损失摘要?

How do you edit an existing Tensorboard Training Loss summary?

我训练了我的网络并产生了一些 training/validation 损失,我通过以下代码示例保存了这些损失(仅训练损失示例,验证完全等效):

valid_summary_writer = tf.summary.create_file_writer("/path/to/logs/")
with train_summary_writer.as_default():
    tf.summary.scalar('Training Loss', data=epoch_loss, step=current_step)

训练结束后,我想使用 Tensorboard 查看损失曲线。但是,因为我将损失曲线保存在名称 'Training Loss' 和 'Validation Loss' 下,所以这些曲线绘制在单独的图表上。我知道我应该将名称简单地更改为 'loss' 以解决此问题,以便将来写入日志目录。但是,如何编辑我现有的日志文件以解决 training/validation 的损失?

我试图修改以下 post 的解决方案: 编辑日志文件的步骤并重新写入文件;我的版本涉及更改文件中的标签。但我在这方面没有成功。它还需要通过 'tf.compat.v1' 导入旧的 Tensorflow 代码。有没有办法实现这个(也许在 TF 2.X 中)?

本来想通过之前的工作方式简单的从每个包含loss的log目录中获取loss和step值写入新的log文件,结果只获取了step,并没有获取到loss值本身。有人在这里成功过吗?

---=== 编辑 ===---

我使用来自@jhedesa

的代码设法解决了这个问题

我不得不稍微改变函数 "rename_events_dir" 的调用方式,因为我在 Google Colab Notebook 中协同使用 Tensorflow。为此,我更改了代码的最后一部分:

if __name__ == '__main__':
    if len(sys.argv) != 5:
        print(f'{sys.argv[0]} <input dir> <output dir> <old tags> <new tag>',
              file=sys.stderr)
        sys.exit(1)
    input_dir, output_dir, old_tags, new_tag = sys.argv[1:]
    old_tags = old_tags.split(';')
    rename_events_dir(input_dir, output_dir, old_tags, new_tag)
    print('Done')

要阅读此内容:

rootpath = '/path/to/model/'
dirlist = [dirname for dirname in os.listdir(rootpath) if dirname not in ['train', 'valid']]
for dirname in dirlist:
  rename_events_dir(rootpath + dirname + '/train', rootpath + '/train', 'Training Loss', 'loss')
  rename_events_dir(rootpath + dirname + '/valid', rootpath + '/valid', 'Validation Loss', 'loss')

请注意,我调用了 "rename_events_dir" 两次,一次用于编辑训练损失标签,一次用于验证损失标签。我本可以通过设置 "old_tags = 'Training Loss;Validation Loss'" 并使用 "old_tags = old_tags.split(';')" 来拆分标签来使用之前调用代码的方法。我使用我的方法只是为了了解代码及其处理数据的方式。

中所述,TensorBoard事件实际上是存储的记录文件,因此您可以读取它们并对其进行处理。这是一个类似于此处发布的脚本,但用于重命名事件,并更新为在 TF 2.x.

中工作
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

# rename_events.py

import sys
from pathlib import Path
import os
# Use this if you want to avoid using the GPU
os.environ['CUDA_VISIBLE_DEVICES'] = '-1'
import tensorflow as tf
from tensorflow.core.util.event_pb2 import Event

def rename_events(input_path, output_path, old_tags, new_tag):
    # Make a record writer
    with tf.io.TFRecordWriter(str(output_path)) as writer:
        # Iterate event records
        for rec in tf.data.TFRecordDataset([str(input_path)]):
            # Read event
            ev = Event()
            ev.MergeFromString(rec.numpy())
            # Check if it is a summary
            if ev.summary:
                # Iterate summary values
                for v in ev.summary.value:
                    # Check if the tag should be renamed
                    if v.tag in old_tags:
                        # Rename with new tag name
                        v.tag = new_tag
            writer.write(ev.SerializeToString())

def rename_events_dir(input_dir, output_dir, old_tags, new_tag):
    input_dir = Path(input_dir)
    output_dir = Path(output_dir)
    # Make output directory
    output_dir.mkdir(parents=True, exist_ok=True)
    # Iterate event files
    for ev_file in input_dir.glob('**/*.tfevents*'):
        # Make directory for output event file
        out_file = Path(output_dir, ev_file.relative_to(input_dir))
        out_file.parent.mkdir(parents=True, exist_ok=True)
        # Write renamed events
        rename_events(ev_file, out_file, old_tags, new_tag)

if __name__ == '__main__':
    if len(sys.argv) != 5:
        print(f'{sys.argv[0]} <input dir> <output dir> <old tags> <new tag>',
              file=sys.stderr)
        sys.exit(1)
    input_dir, output_dir, old_tags, new_tag = sys.argv[1:]
    old_tags = old_tags.split(';')
    rename_events_dir(input_dir, output_dir, old_tags, new_tag)
    print('Done')

你会这样使用它:

> python rename_events.py my_log_dir renamed_log_dir "Training Loss;Validation Loss" loss