MediaPipe TensorflowLite 虹膜模型
MediaPipe TensorflowLite Iris Model
我正在尝试了解可从 mediapipe 获得的 tflite Iris landmarks model 的输出。
model card
将输出描述为 71 个 2D 地标和 5 个 2D 地标。检查模型时如下:
interpreter = tf.lite.Interpreter(model_path='iris_landmark.tflite')
interpreter.allocate_tensors()
output_details = interpreter.get_output_details()
print(output_details)
[{'dtype': numpy.float32,
'index': 384,
'name': 'output_eyes_contours_and_brows',
'quantization': (0.0, 0),
'quantization_parameters': {'quantized_dimension': 0,
'scales': array([], dtype=float32),
'zero_points': array([], dtype=int32)},
'shape': array([ 1, 213], dtype=int32),
'shape_signature': array([ 1, 213], dtype=int32),
'sparsity_parameters': {}},
{'dtype': numpy.float32,
'index': 385,
'name': 'output_iris',
'quantization': (0.0, 0),
'quantization_parameters': {'quantized_dimension': 0,
'scales': array([], dtype=float32),
'zero_points': array([], dtype=int32)},
'shape': array([ 1, 15], dtype=int32),
'shape_signature': array([ 1, 15], dtype=int32),
'sparsity_parameters': {}}]
我在模型输出中看到 213 个值和 15 个值 - 所以我假设我得到每个点的 x/y/z 坐标。在 运行 图像上的模型之后,我得到 -7000 到 +7000 范围内的值。我的输入是一张 64x64 的图像,知道这些点如何与原始图像对应吗?
我想要眼睛关键点的像素坐标,这些坐标在 mediapipe 示例中呈现。
我正在尝试了解可从 mediapipe 获得的 tflite Iris landmarks model 的输出。
model card 将输出描述为 71 个 2D 地标和 5 个 2D 地标。检查模型时如下:
interpreter = tf.lite.Interpreter(model_path='iris_landmark.tflite')
interpreter.allocate_tensors()
output_details = interpreter.get_output_details()
print(output_details)
[{'dtype': numpy.float32,
'index': 384,
'name': 'output_eyes_contours_and_brows',
'quantization': (0.0, 0),
'quantization_parameters': {'quantized_dimension': 0,
'scales': array([], dtype=float32),
'zero_points': array([], dtype=int32)},
'shape': array([ 1, 213], dtype=int32),
'shape_signature': array([ 1, 213], dtype=int32),
'sparsity_parameters': {}},
{'dtype': numpy.float32,
'index': 385,
'name': 'output_iris',
'quantization': (0.0, 0),
'quantization_parameters': {'quantized_dimension': 0,
'scales': array([], dtype=float32),
'zero_points': array([], dtype=int32)},
'shape': array([ 1, 15], dtype=int32),
'shape_signature': array([ 1, 15], dtype=int32),
'sparsity_parameters': {}}]
我在模型输出中看到 213 个值和 15 个值 - 所以我假设我得到每个点的 x/y/z 坐标。在 运行 图像上的模型之后,我得到 -7000 到 +7000 范围内的值。我的输入是一张 64x64 的图像,知道这些点如何与原始图像对应吗?
我想要眼睛关键点的像素坐标,这些坐标在 mediapipe 示例中呈现。