Mobilenet SSD 输入形状

Mobilenet SSD input shape

我已经针对单个对象检测任务在自定义数据集上训练了移动 SSD V2 模型,并将其转换为 tflite。当我使用解释器加载 .tflite 模型进行测试,并使用 input_details = model.get_input_details() 获取输入详细信息时,它输出

[{'name': 'normalized_input_image_tensor',
'index': 272,
'shape': array([  1, 300, 300,   3], dtype=int32),
'dtype': numpy.uint8,
'quantization': (0.0078125, 128)}]

我知道“300x300”是图像的高度和宽度,“3”是 RGB 通道,但第一个元素(“1”)指的是什么?

形状:[Batch_size、高度、宽度、通道]

如果你想改变那个大小,你需要在转换成pb文件之前设置它,例如使用export_inference_graph