从网页中提取特定数据

Extract specific data from webpage

基本上这是我的代码:

int main()
{

CURL *curl;
FILE *fp;
CURLcode res; 
std::string readBuffer;
curl = curl_easy_init(); 
char outfilename[FILENAME_MAX] = "C:\Users\admin\desktop\test.txt";
if(curl) { 
     fp = fopen(outfilename,"wb");

    curl_easy_setopt(curl, CURLOPT_URL, "http://www.example.com"); 
    curl_easy_setopt(curl, CURLOPT_POSTFIELDS, "user=123&pass=123"); 
    curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1); 
    curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data);
    curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);  

    res = curl_easy_perform(curl); 
    Sleep(1000); 
    curl_easy_cleanup(curl); 
    fclose(fp);
} 

return EXIT_SUCCESS; 
}

输出成功保存到文本文件中。

我关心的是如何提取特定标签之间的特定内容。

例如我只想要 ............... < /bla> 之间的内容。

什么是最简单的方法,谢谢。

在您的示例中,您将网站的响应转储到文件中,libcURL 将您点击的网页返回的数据原样写入,不需要对返回数据进行重构。

可以通过定义write_data函数获取内存中的数据,只需要如下格式:

size_t write_data(char *ptr, size_t size, size_t nmemb, void *userdata);

在内存中获取数据后,您可以根据需要对其进行解析和重组。 See Example Here 用于使用 write_data 函数。

对于XML解析你可以使用This sample code