faiss:如何通过 id 从 python 检索向量
faiss: How to retrieve vector by id from python
我有一个 faiss 索引,想在我的 python 脚本中使用一些嵌入。 Embeddings的选择应该通过id来完成。由于 faiss 是用 C++ 编写的,swig 用作 API.
我想我需要的功能是reconstruct :
/** Reconstruct a stored vector (or an approximation if lossy coding)
*
* this function may not be defined for some indexes
* @param key id of the vector to reconstruct
* @param recons reconstucted vector (size d)
*/
virtual void reconstruct(idx_t key, float* recons) const;
因此,我在python中调用了这个方法,例如:
vector = index.reconstruct(0)
但这会导致以下错误:
vector = index.reconstruct(0)
File
"lib/python3.8/site-packages/faiss/init.py",
line 406, in replacement_reconstruct
self.reconstruct_c(key, swig_ptr(x)) File "lib/python3.8/site-packages/faiss/swigfaiss.py",
line 1897, in reconstruct
return _swigfaiss.IndexFlat_reconstruct(self, key, recons)
TypeError: in method 'IndexFlat_reconstruct', argument 2 of type
'faiss::Index::idx_t' python-BaseException
有人知道我的方法有什么问题吗?
这是我手动找到的唯一方法。
import faiss
import numpy as np
a = np.random.uniform(size=30)
a = a.reshape(-1,10).astype(np.float32)
d = 10
index = faiss.index_factory(d,'Flat', faiss.METRIC_L2)
index.add(a)
xb = index.xb
print(xb.at(0) == a[0][0])
输出:
True
你可以用循环得到任何向量
required_vector_id = 1
vector = np.array([xb.at(required_vector_id*index.d + i) for i in range(index.d)])
print(np.all(vector== a[1]))
输出:
True
我有一个 faiss 索引,想在我的 python 脚本中使用一些嵌入。 Embeddings的选择应该通过id来完成。由于 faiss 是用 C++ 编写的,swig 用作 API.
我想我需要的功能是reconstruct :
/** Reconstruct a stored vector (or an approximation if lossy coding)
*
* this function may not be defined for some indexes
* @param key id of the vector to reconstruct
* @param recons reconstucted vector (size d)
*/
virtual void reconstruct(idx_t key, float* recons) const;
因此,我在python中调用了这个方法,例如:
vector = index.reconstruct(0)
但这会导致以下错误:
vector = index.reconstruct(0) File "lib/python3.8/site-packages/faiss/init.py", line 406, in replacement_reconstruct self.reconstruct_c(key, swig_ptr(x)) File "lib/python3.8/site-packages/faiss/swigfaiss.py", line 1897, in reconstruct return _swigfaiss.IndexFlat_reconstruct(self, key, recons)
TypeError: in method 'IndexFlat_reconstruct', argument 2 of type 'faiss::Index::idx_t' python-BaseException
有人知道我的方法有什么问题吗?
这是我手动找到的唯一方法。
import faiss
import numpy as np
a = np.random.uniform(size=30)
a = a.reshape(-1,10).astype(np.float32)
d = 10
index = faiss.index_factory(d,'Flat', faiss.METRIC_L2)
index.add(a)
xb = index.xb
print(xb.at(0) == a[0][0])
输出:
True
你可以用循环得到任何向量
required_vector_id = 1
vector = np.array([xb.at(required_vector_id*index.d + i) for i in range(index.d)])
print(np.all(vector== a[1]))
输出:
True