具有少量动态 HTML 文件和许多可能的 URL 的站点的站点地图

Sitemap for site with few dynamic HTML files and many possible URLs

我的第一个 Web 开发项目即将结束,我希望为我们的网站构建一个站点地图,作为搜索引擎优化的一部分。如果我理解正确的话,站点地图在正确完成后是一个文件,显示我网站所有 public 页面的内容树(类似于 windows 资源管理器中的路径)。

就我的问题而言,您需要了解有关网站及其运作方式的一些背景信息。该站点是关于鸟类迁徙的,用户在包含搜索框的主页上输入该站点,他或她能够搜索一种鸟类,如果我们有关于它的数据,则用户能够转到一个单独的页面关于这只鸟的信息。用户可以从那里访问有关该物种的统计数据。该页面将如下所示,其中填充了我们从数据库中获取的内容。

信息页面的 URL 看起来像 http://domain.com/searchbird.html?bird=Sedge%20Warbler?lang=1,统计页面的 http://domain.com/statistics.html?bird=Sedge%20Warbler?lang=1

每种鸟类都使用相同的基础 HTML 文件 (searchbird.html),该文件根据 ?bird="" 参数填充了数据。我的 webroot 中有大约四个 HTML 文件(我们称它们为:index.html、searchbird.html、statistics.html、about.html)。

因此,当我使用某种站点地图生成工具创建站点地图时,我得到了一个包含这 4 个 .html 文件的站点地图,这太棒了!然而,我错过了用户将能够找到的 500 种鸟类。

有没有办法让我在站点地图中自动包含所有可能的 URL,我将如何做这样的事情?我过去使用过 HTML、CSS 和 Javascript。但我只是一个初学者。如果存在一个可执行工具,那就太好了,但我的 Google 搜索还没有成功。

您可以使用站点地图生成器。你可以使用 https://www.xml-sitemaps.com/。你只需要放 url 索引。该网站将搜索所有 link 并自动生成站点地图。

如果你使用 wordpress,你可以使用插件 wordpress,例如 https://wordpress.org/plugins/google-sitemap-generator/

希望有所帮助

您必须为现有页面生成 URL 列表。

因此深入研究您的数据源(数据库或任何您使用的),找到所有现有的鸟类,并为每个物种生成两个 URLs。

users/bots

的目录

在您的网站上也输出这些链接可能是个好主意(对于访问者和机器人)。访问者可以通过两种方式找到一个物种(搜索它或浏览目录),并且由于大多数机器人不使用搜索功能,否则他们将无法在您的网站上找到链接(他们必须使用您的站点地图,并非所有机器人都这样做,否则他们将不得不希望从其他外部网站找到链接。

(如果这样做,您也可以使用站点地图生成服务;但通常最好自己生成。)

URL设计

顺便说一句,您可能要考虑将 URL 设计更改为更 human-friendly 的设计。而不是

http://example.com/searchbird.html?bird=Sedge%20Warbler?lang=1

http://example.com/statistics.html?bird=Sedge%20Warbler?lang=1

你可以使用像

这样的东西
http://example.com/en/birds/sedge-warbler

http://example.com/en/birds/sedge-warbler/statistics

其中 en 是 "English" 的语言代码(这些是 standardized,用户有机会理解它们,与 lang=1 相反),并且在哪里http://example.com/en/birds 可能会导致页面列出所有物种。对于其他语言,您当然最好翻译 "birds" 和 "statistics".

可以使用 URL rewriting 更改 URL 设计。