使用 cheerio 从 html 元素中提取两个文本值

extracting two text value from html elements with cheerio

使用 cheerio,$ 被定义为 cheerio 对象,我试图从一些只有 class 没有在 html 中定义 id 的元素中获取两个文本(当前价格和原始价格) .任何线索如何实现这一目标?

这是包含这两个值的 html 内容的片段,

<div class="buy-box__element">
   <div class="clp-component-render">
      <div class="clp-component-render">
         <div class="ud-component--course-landing-page-udlite--price-text" ng-non-bindable="">
            <div>
               <div class="price-text--container--Ws-fP udlite-clp-price-text" data-purpose="price-text-container">
                  <div class="price-text--price-part--Tu6MH udlite-clp-discount-price udlite-heading-xl" data-purpose="course-price-text"><span class="udlite-sr-only">Current price</span><span><span>₹700</span></span></div>
                  <div class="price-text--price-part--Tu6MH price-text--original-price--2e-F5 udlite-clp-list-price udlite-text-sm" data-purpose="original-price-container">
                     <div data-purpose="course-old-price-text"><span class="udlite-sr-only">Original Price</span><span><s><span>₹1,280</span></s></span></div>
                  </div>
                  <div class="price-text--price-part--Tu6MH udlite-clp-percent-discount udlite-text-sm" data-purpose="discount-percentage"><span class="udlite-sr-only">Discount</span><span>45% off</span></div>
               </div>
            </div>
         </div>
      </div>
   </div>
</div>

使用 X-path 它可以工作,但我想用 cheerio 实现它。还尝试了以下

#(".price-text--price-part--Tu6MH udlite-clp-discount-price udlite-heading-xl udlite-sr-only")[0].innerText
#(".price-text--price-part--Tu6MH udlite-clp-discount-price udlite-heading-xl udlite-sr-only")

你能试试这个吗?

html应该是内层的html,你可以像libraries.Something一样使用puppeteer像let html = await page.evaluate(() => document.body.innerHTML);

$('span:contains("Current price")', html).each(function() {
        let CurrentPrice1 = $(this).next().text();
        let CurrentPrice2 = Number(CurrentPrice1.replace(/[^0-9.-]+/g,""));
        console.log(CurrentPrice1); //this with symbol
        console.log(CurrentPrice2); //this for only fetching the numeric value
    });

对于原价,将当前价格替换为原价

您可以这样做:

$('span:contains("Current price") + span span').text()