如何根据张量流中的某些谓词从队列中过滤张量?

How to filter tensor from queue based on some predicate in tensorflow?

如何使用谓词函数过滤存储在队列中的数据?例如,假设我们有一个存储特征和标签张量的队列,我们​​只需要满足谓词的那些。我尝试了以下实现但没有成功:

feature, label = queue.dequeue()
if (predicate(feature, label)):
    enqueue_op = another_queue.enqueue(feature, label)

最直接的方法是使一批出列,运行 通过谓词测试,使用 tf.where to produce a dense vector of the ones that match the predicate, and use tf.gather 收集结果,然后将该批放入队列。如果您希望它自动发生,您可以在第二个队列上启动一个队列 运行ner - 最简单的方法是使用 tf.train.batch:

示例:

import numpy as np
import tensorflow as tf

a = tf.constant(np.array([5, 1, 9, 4, 7, 0], dtype=np.int32))

q = tf.FIFOQueue(6, dtypes=[tf.int32], shapes=[])
enqueue = q.enqueue_many([a])
dequeue = q.dequeue_many(6)
predmatch = tf.less(dequeue, [5])
selected_items = tf.reshape(tf.where(predmatch), [-1])
found = tf.gather(dequeue, selected_items)

secondqueue = tf.FIFOQueue(6, dtypes=[tf.int32], shapes=[])
enqueue2 = secondqueue.enqueue_many([found])
dequeue2 = secondqueue.dequeue_many(3) # XXX, hardcoded

with tf.Session() as sess:
  sess.run(tf.global_variables_initializer())
  sess.run(enqueue)  # Fill the first queue
  sess.run(enqueue2) # Filter, push into queue 2
  print sess.run(dequeue2) # Pop items off of queue2

谓词产生一个布尔向量; tf.where 生成真实值索引的密集向量,tf.gather 根据这些索引从原始张量中收集项目。

很多东西在这个例子中是硬编码的,当然,你需要在现实中进行非硬编码,但希望它能显示你正在尝试做的事情的结构(创建一个过滤管道) .实际上,您希望 QueueRunners 在那里保持自动搅动。使用 tf.train.batch 对于自动处理该问题非常有用——有关详细信息,请参阅 Threading and Queues