Google 自定义搜索 API 有问题
Trouble with Google Custom Search API
需要:通过 API 搜索 google 并得到一个 json 结果,该结果模仿我在 webapi
上搜索时找到的结果
我的Custom Search
设置是搜索整个网络
我的搜索结果:
搜索词:072745546181
(这是一些鸡胸肉的 UPC 标签)
https://www.googleapis.com/customsearch/v1?key=AIzaSyBaPxycT3gj82T5qm66XGgIvtSEP31LISo&cx=015261035819156121642:qj7jmhlymjw&q=072745546181
网络搜索returns(查看结果)
搜索词:072745546181
(这是一些鸡胸肉的 UPC 标签)
示例 1:https://www.google.de/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=072745546181
注意最后的q=
是一样的q=072745546181
必须有一个简单的答案,我在这里做错了什么?
相反,使用 "Donald Trump President" 这样的字词进行搜索
https://www.googleapis.com/customsearch/v1?key=AIzaSyBaPxycT3gj82T5qm66XGgIvtSEP31LISo&cx=015261035819156121642:qj7jmhlymjw&q=donald trump president
returns 不错的结果我可以做点什么。这里没问题,但为什么在搜索 UPC 时失败了?
我该怎么办?
更新 1.26.17 - 添加了 50 点赏金,我可以赚更多。什么是正常利率?需要一些帮助!
这是一个有趣的问题。我只是 运行 一系列测试,确认如果关键字包含超过 8 个数字(即使由空格或连字符分隔),它们会被奇怪地对待。它们不会被简单地忽略——因为找到了这个 SO 页面——但大多数网站都不会被返回。我对这种行为的最佳猜测是它是 google 故意设置的过滤器,用于将数字搜索限制在 "trusted" 网站以防止 phone 数字查找。限制 UPC、政府记录和专利查询甚至可能是更激进的举措,因此自动化工具无法与当前或计划中的 Google 服务竞争。
我尝试了各种测试,包括 inurl%3A072745546181
、allintitle%3A0727+4554+6181
等高级运算符以及 url%3Abuycott.com+072745546181
等出现在常规搜索中的定位站点,并且行为是一致的。如此一致,不得不深思熟虑。
我有 95% 的把握说,您无法使用自定义搜索做您想做的事,而且 Google 极不可能为您提供解决方法。
我建议尝试其他搜索 API 提供商,可能是 Bing 网页搜索 API 或 Faroo or one of these product search APIs
这是旧的,但仍然相关。您必须创建自定义搜索引擎才能在此处查找 UPC:https://cse.google.com/all
完成后,您需要添加要搜索的网站(例如 https://www.barcodespider.com, https://www.upcitemdb.com)
从那里开始,您的 cURL 看起来像这样:
curl -X GET \
'https://www.googleapis.com/customsearch/v1?key={{googleApiKey}}&cx={{googleUpcSearchEngineCode}}&q=034449787178' \
-H 'Accept: */*' \
-H 'Cache-Control: no-cache' \
该请求将通过在指定站点内搜索 UPC 来过滤结果。
需要:通过 API 搜索 google 并得到一个 json 结果,该结果模仿我在 webapi
上搜索时找到的结果我的Custom Search
设置是搜索整个网络
我的搜索结果:
搜索词:072745546181
(这是一些鸡胸肉的 UPC 标签)
https://www.googleapis.com/customsearch/v1?key=AIzaSyBaPxycT3gj82T5qm66XGgIvtSEP31LISo&cx=015261035819156121642:qj7jmhlymjw&q=072745546181
网络搜索returns(查看结果)
搜索词:072745546181
(这是一些鸡胸肉的 UPC 标签)
示例 1:https://www.google.de/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=072745546181
注意最后的q=
是一样的q=072745546181
必须有一个简单的答案,我在这里做错了什么?
相反,使用 "Donald Trump President" 这样的字词进行搜索
https://www.googleapis.com/customsearch/v1?key=AIzaSyBaPxycT3gj82T5qm66XGgIvtSEP31LISo&cx=015261035819156121642:qj7jmhlymjw&q=donald trump president
returns 不错的结果我可以做点什么。这里没问题,但为什么在搜索 UPC 时失败了?
我该怎么办?
更新 1.26.17 - 添加了 50 点赏金,我可以赚更多。什么是正常利率?需要一些帮助!
这是一个有趣的问题。我只是 运行 一系列测试,确认如果关键字包含超过 8 个数字(即使由空格或连字符分隔),它们会被奇怪地对待。它们不会被简单地忽略——因为找到了这个 SO 页面——但大多数网站都不会被返回。我对这种行为的最佳猜测是它是 google 故意设置的过滤器,用于将数字搜索限制在 "trusted" 网站以防止 phone 数字查找。限制 UPC、政府记录和专利查询甚至可能是更激进的举措,因此自动化工具无法与当前或计划中的 Google 服务竞争。
我尝试了各种测试,包括 inurl%3A072745546181
、allintitle%3A0727+4554+6181
等高级运算符以及 url%3Abuycott.com+072745546181
等出现在常规搜索中的定位站点,并且行为是一致的。如此一致,不得不深思熟虑。
我有 95% 的把握说,您无法使用自定义搜索做您想做的事,而且 Google 极不可能为您提供解决方法。
我建议尝试其他搜索 API 提供商,可能是 Bing 网页搜索 API 或 Faroo or one of these product search APIs
这是旧的,但仍然相关。您必须创建自定义搜索引擎才能在此处查找 UPC:https://cse.google.com/all
完成后,您需要添加要搜索的网站(例如 https://www.barcodespider.com, https://www.upcitemdb.com)
从那里开始,您的 cURL 看起来像这样:
curl -X GET \
'https://www.googleapis.com/customsearch/v1?key={{googleApiKey}}&cx={{googleUpcSearchEngineCode}}&q=034449787178' \
-H 'Accept: */*' \
-H 'Cache-Control: no-cache' \
该请求将通过在指定站点内搜索 UPC 来过滤结果。