Jsoup绝对路径
Jsoup Absolute Path
我正在努力获取从我的网站上抓取的图像的绝对路径。我查看了 jsoup.org 上的文档,但我无法让 abs:src 工作。我不知道如何实施 abs:src 或在哪里添加它。
<cfhttp method="get" url="https://theculturecook.com/recipe-slowroasted-pork-belly.html" result="theresult">
<cfscript>
Jsoup = createObject("java", "org.jsoup.Jsoup");
html = "#theresult.filecontent#";
doc = Jsoup.parse(html);
tags = doc.select("img[src$=.jpg]");
</cfscript>
<cfset images = "">
<cfloop index="e" array="#tags#">
<cfoutput>
<cfset images = ListAppend(images,#e.attr("src")#)>
</cfoutput>
</cfloop>
<cfloop list="#images#" index="a">
<cfoutput>#a#<br></cfoutput>
</cfloop>
您面临的问题是您正在将 html 内容传递给 JSOUP。如果需要绝对路径,则需要使用to following来连接。
Jsoup.connect("https://theculturecook.com/recipe-slowroasted-pork-belly.html").get();
最后,
<cfscript>
Jsoup = createObject("java", "org.jsoup.Jsoup");
doc = Jsoup.connect("https://theculturecook.com/recipe-slowroasted-pork-belly.html").get();
tags = doc.select("img[src$=.jpg]");
</cfscript>
<!--- <cfdump var="#a.attr()#" abort> --->
<cfset images = "">
<cfloop index="e" array="#tags#">
<cfoutput>
<cfset images = ListAppend(images, e.attr("abs:src"))>
</cfoutput>
</cfloop>
<cfloop list="#images#" index="a">
<cfoutput>#a#<br></cfoutput>
</cfloop>
我正在努力获取从我的网站上抓取的图像的绝对路径。我查看了 jsoup.org 上的文档,但我无法让 abs:src 工作。我不知道如何实施 abs:src 或在哪里添加它。
<cfhttp method="get" url="https://theculturecook.com/recipe-slowroasted-pork-belly.html" result="theresult">
<cfscript>
Jsoup = createObject("java", "org.jsoup.Jsoup");
html = "#theresult.filecontent#";
doc = Jsoup.parse(html);
tags = doc.select("img[src$=.jpg]");
</cfscript>
<cfset images = "">
<cfloop index="e" array="#tags#">
<cfoutput>
<cfset images = ListAppend(images,#e.attr("src")#)>
</cfoutput>
</cfloop>
<cfloop list="#images#" index="a">
<cfoutput>#a#<br></cfoutput>
</cfloop>
您面临的问题是您正在将 html 内容传递给 JSOUP。如果需要绝对路径,则需要使用to following来连接。
Jsoup.connect("https://theculturecook.com/recipe-slowroasted-pork-belly.html").get();
最后,
<cfscript>
Jsoup = createObject("java", "org.jsoup.Jsoup");
doc = Jsoup.connect("https://theculturecook.com/recipe-slowroasted-pork-belly.html").get();
tags = doc.select("img[src$=.jpg]");
</cfscript>
<!--- <cfdump var="#a.attr()#" abort> --->
<cfset images = "">
<cfloop index="e" array="#tags#">
<cfoutput>
<cfset images = ListAppend(images, e.attr("abs:src"))>
</cfoutput>
</cfloop>
<cfloop list="#images#" index="a">
<cfoutput>#a#<br></cfoutput>
</cfloop>