Rss 提要更改 url 项

Rss feed changes url to items

我正在实施类似 rss 提要 reader 的系统,但我遇到了一些提要问题,这些提要会在一段时间后更改项目的 urls。 当我构建系统时,我使用 url 的 md5 作为 ID,以便轻松快速地检测重复项,人们不会将 url 更改为文章,因为它对 SEO 不利,但如果他们使用 feedproxy 或其他动态提要生成器,文章的 urls 使用重定向并且 urls 也会改变,例如,我将同一篇文章的这 3 个条目放入我的数据库

http://feedproxy.google.com/~r/itsallaboutrevenue/~3/AElJBdzy2nY/your-story-is-not-about-you-content-pros-podcast-episode-2-with-ann-handley

http://feedproxy.google.com/~r/itsallaboutrevenue/~3/YIa4EeZgkJs/your-story-is-not-about-you-content-pros-podcast-episode-2-with-ann-handley

https://blogs.oracle.com/marketingcloud/your-story-is-not-about-you-content-pros-podcast-episode-2-with-ann-handley

我的问题是正确的方法是什么,如果你知道一些可以在服务器端使用的稳定的开源代码,我可以替换我的 php 代码现在使用(它可以是任何语言)(我正在使用 picofeed)

你不使用项目的 id 作为唯一标识符吗?

// Item object
$feed->items[0]->getId();                      // Item unique id (hash)

Picofeed 可能会根据 RSS item's guid or if guid is missing they use the link url like you do. Usually feed creators add guids and those should remain unchanged even after the link changes. Here is some more info about how rss readers detect duplicates.

创建唯一 ID 的哈希值