基于其他向量生成全新的向量
generating completely new vector based on other vectors
假设我有四个向量 (v1,v2,v3,v4),我想创建一个新的向量 (vec_new),它与这四个向量中的任何一个都不接近。我在考虑插值和外推。你觉得他们合适吗?他们是否也申请矢量并生成一个比方说 300 维的矢量?另一种可能的选择是转换矩阵。但我不确定它是否符合我的顾虑。我认为平均和连接不是很好,因为我可能接近其中一些四个向量。
根据我的问题,假设我将向量分为两类。我需要找到一个不属于这些类别的向量。
还有其他想法吗?
根据我的评论,我不希望创建合成的“遥远”示例对实现现实目标有用。
甚至单词反义词 也不是 最大程度地 cosine-dissimilar 彼此,因为在所有 word-meaning-possibilities 的领域中,反义词与每个词都非常相似其他。例如,'hot' 和 'cold' 被认为是相反的,但它们是同一种词,描述相同的 temperature-property,并且通常可以 drop-in 在相同的句子。因此,虽然它们可能在 word-vector space 中显示出有趣的对比,但“差异方向”不会通过原点——因为会创建最大 cosine-dissimilarity。
在分类上下文中,即使是简单的 2 类分类器也需要实际的 'negative' 示例。只有正面示例,'vector space' 不一定会对 hypothesized-but-not-actually-present 负面示例建模。 (如果没有显示真实“边界”的训练示例,几乎不可能将 space 分为两类。)
不过,有一种简单的方法可以使一个向量与另一个向量完全不同:取反。这会创建一个与原始方向完全相反的向量,因此 cosine-similarity 为 -1.0
。
如果你有许多向量,你想找到一个 maximally-dissimilar 向量,我怀疑你不能做得比 否定所有向量的平均值更好 。也就是说,对向量进行平均,然后取反 average-vector,找到指向 exactly-opposite 平均值的向量。
祝你好运!
假设我有四个向量 (v1,v2,v3,v4),我想创建一个新的向量 (vec_new),它与这四个向量中的任何一个都不接近。我在考虑插值和外推。你觉得他们合适吗?他们是否也申请矢量并生成一个比方说 300 维的矢量?另一种可能的选择是转换矩阵。但我不确定它是否符合我的顾虑。我认为平均和连接不是很好,因为我可能接近其中一些四个向量。
根据我的问题,假设我将向量分为两类。我需要找到一个不属于这些类别的向量。
还有其他想法吗?
根据我的评论,我不希望创建合成的“遥远”示例对实现现实目标有用。
甚至单词反义词 也不是 最大程度地 cosine-dissimilar 彼此,因为在所有 word-meaning-possibilities 的领域中,反义词与每个词都非常相似其他。例如,'hot' 和 'cold' 被认为是相反的,但它们是同一种词,描述相同的 temperature-property,并且通常可以 drop-in 在相同的句子。因此,虽然它们可能在 word-vector space 中显示出有趣的对比,但“差异方向”不会通过原点——因为会创建最大 cosine-dissimilarity。
在分类上下文中,即使是简单的 2 类分类器也需要实际的 'negative' 示例。只有正面示例,'vector space' 不一定会对 hypothesized-but-not-actually-present 负面示例建模。 (如果没有显示真实“边界”的训练示例,几乎不可能将 space 分为两类。)
不过,有一种简单的方法可以使一个向量与另一个向量完全不同:取反。这会创建一个与原始方向完全相反的向量,因此 cosine-similarity 为 -1.0
。
如果你有许多向量,你想找到一个 maximally-dissimilar 向量,我怀疑你不能做得比 否定所有向量的平均值更好 。也就是说,对向量进行平均,然后取反 average-vector,找到指向 exactly-opposite 平均值的向量。
祝你好运!