如何准备我的数据集(不是图像)以在 Tensorflow Federated 上实施 FedAVG?

How to prepare my dataset(Not Images) to implement FedAVG on Tensorflow Federated?

我想使用时帧长度为 128 的 3 通道(X、Y、Z)加速度计数据集在 TFF (Tensorflow Federated) 上使用 FedAvg 算法训练联合模型。

我的目标是使用

训练联合模型
tff.learning.from_keras_model

TensorFlow Federated 网站上的指南主要处理已经采用模型所需格式的数据集

tensorflow_federated.python.simulation.hdf5_client_data.HDF5ClientData

我完全不知道如何将我的原始数据集转换为 TFF 所需的格式。

我使用的数据集具有以下形状:

X: (-1, 128, 3) and Y: (-1)

X: 是浮点数 Y:是我的数据集的整数标签,范围从 0-6

任何人都可以 pointers/examples 告诉我如何解决这个问题吗?

首先,对于联合学习,数据集需要按 user/participant 进行分区。数据集是否按用户对加速度计读数和标签进行了分区?如果不是,这可能是一个适合标准集中学习而不是联邦学习的任务。

如果有用户分区,下面的问题解释了如何设置一个 tff.simulation.ClientData 来为这个分布式数据集建模。数据是不是图像这一事实并不重要,这些技术适用于 X、Y 数据集的任何监督学习:

  • How define tff.simulation.ClientData.from_clients_and_fn Function?
  • convert my own image dataset into tff simulation Clientdata