如何从 HTML 中识别静态资产

how to identify static assets from an HTML

我的任务是列出网页中的所有静态资产。我知道静态资产是那些在运行时永远不会改变的文件。

是否有系统的方法来区分这些与动态文件?

如果我必须列出所有静态资产。最好的起点是什么?

从客户端的角度来看,没有系统的方法来确定 html 响应的哪一部分来自静态文件或由服务器在运行时生成。 html 标准没有区别。

也就是说,大多数时候您可以猜出响应的哪一部分来自静态文件。当 html 以指向 .css、.js、.gif 等文件的链接响应时,很有可能来自静态文件。

但是无法确定哪个 html 元素来自磁盘上的文件以及哪个在运行时构建。

系统的方法是分析形成 html 响应的代码,并从那里确定哪些资源是静态的,哪些是动态的。

编辑 你补充说你不需要 100%。如果你不需要那个,那么也许你可以使用 cloudflare's list of file extentions。 cloudflare 默认缓存这些扩展的原因是它们通常是静态的。