语义 video/image 搜索是否可以在 google 照片以外的任何地方使用?

Is semantic video/image search available anywhere other than google photo?

我正在寻找可以理解自然语言语义(当然在某种程度上)以找到相应图像的搜索引擎,或者只是技术。

反之亦然。

例如:一个可以区分两个男人拥抱和两个男人摔跤的软件。 或者 - 输入:一张桌子和一台笔记本电脑、一杯咖啡、魔方和一个星球大战玩具的照片,会产生输出:程序员桌。

我遇到了 Metamind.io 我的工作,它使用一些深度神经网络魔法来以正确的方式识别和标记图像。

您可能会从他们训练的分类器中获得不错的结果,或者训练您自己的分类器。

来晚了,但我认为这可能有助于其他人搜索同样的东西。

就基本图像分析而言,该领域最近取得了突飞猛进的发展,并且有很多人提供此功能。质量差异很大,取决于训练有素的程度以及提供者拥有的语料库有多大。我合作过的几个例子是 IBM 和 Clarifai,但这是一个蓬勃发展的领域。

他们不会提供您所追求的上下文类型。反正还没有。他们不太可能区分两个男人拥抱和两个男人摔跤(嘿,有时谁能分辨出人类的区别?)。然而,他们可能会挑选一张桌子、一杯咖啡、一本书等。

视频搜索和语境化完全是另一个挑战,而且还处于起步阶段。至少有一家公司在这一领域取得了重大进展(完全免责声明,我在那里工作)。 Movida Labs 分析和索引视频中的许多因素以提供大量上下文,因此在您的示例中,它很可能表明这是一个有两个男人摔跤的视频。我不得不承认,这不是因为技术上的某种突破(虽然它非常先进),而是因为整个视频提供了这种背景。