在网页上反转 minificiation/obfuscation 的 CSS 样式

Reversing minificiation/obfuscation of CSS styles on web page

网页有时有obfuscated/minified CSS class是正常的。由于随机 class 名称,这具有(可能是故意的)防止页面抓取的副作用。

页面是 well-defined - 虽然 html 在每个页面加载时都不同,但呈现的页面看起来总是一样的。例如,标题总是在 font-size: 20px; color: black;,或者描述总是在 font-size: 15px; line-height: 1.5; 等等...

是否有 un-randomize class 名称的流程? 或者一种基于呈现样式的 select 元素的方法(例如 font-size: 20px; color: black;)?

<div tabindex="0" class="styles__Header-sc-120s71t-1 bVobsP">
    <h6 class="jss85xpic jsspbfkgl jssfrl2gs" style="max-width: 100%;">Title</h6>
    <div class="styles__Description-sc-120s71t-2 cilEqp">
        <p class="jss85xpic jsspbfkgl jssou361l" style="max-width: 100%;">Description</p>
    </div>
    <div class="styles__ItemsList-sc-120s71t-3 gyRIpM">
        <div itemscope="" itemtype="http://schema.org/Product" role="button" tabindex="0" class="styles__Wrapper-sc-1xl58bi-2 gKTcIQ" style="max-width: 100%;">
            <div class="styles__FlexContainer-sc-1xl58bi-4 bLvOGI">
                <div class="styles__TextWrapper-sc-1xl58bi-9 liomPZ">
                    <div class="styles__Title-sc-1xl58bi-5 eqysaj">
                        <h3 class="jss85xpic jsspbfkgl jssws5ijf" style="max-width: 100%;"><span itemprop="name">Item 1</span></h3>
                    </div>
               </div>
           </div>
       </div>
   </div>
</div>

如果 类 每次都真正随机化,我不确定您可以在那里做什么。按样式搜索需要 brute-force 检查每个元素的计算样式。

如果您正在寻找一种遍历此方法的方法HTML:形状是否始终一致?您可以组合使用标签选择器、"immediate child" 选择器 [>] 和 "begins with" 选择器 [^](对于那些 styles__*** 类 ) 尝试找到您要查找的元素。

例如:标题为 [class^="styles__Header"] > h6。描述将是 [class^="styles__Description"] > p.