从网页中提取特定数据
Extract specific data from webpage
基本上这是我的代码:
int main()
{
CURL *curl;
FILE *fp;
CURLcode res;
std::string readBuffer;
curl = curl_easy_init();
char outfilename[FILENAME_MAX] = "C:\Users\admin\desktop\test.txt";
if(curl) {
fp = fopen(outfilename,"wb");
curl_easy_setopt(curl, CURLOPT_URL, "http://www.example.com");
curl_easy_setopt(curl, CURLOPT_POSTFIELDS, "user=123&pass=123");
curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1);
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data);
curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);
res = curl_easy_perform(curl);
Sleep(1000);
curl_easy_cleanup(curl);
fclose(fp);
}
return EXIT_SUCCESS;
}
输出成功保存到文本文件中。
我关心的是如何提取特定标签之间的特定内容。
例如我只想要 ............... < /bla> 之间的内容。
什么是最简单的方法,谢谢。
在您的示例中,您将网站的响应转储到文件中,libcURL 将您点击的网页返回的数据原样写入,不需要对返回数据进行重构。
可以通过定义write_data
函数获取内存中的数据,只需要如下格式:
size_t write_data(char *ptr, size_t size, size_t nmemb, void *userdata);
在内存中获取数据后,您可以根据需要对其进行解析和重组。
See Example Here 用于使用 write_data
函数。
对于XML解析你可以使用This sample code
基本上这是我的代码:
int main()
{
CURL *curl;
FILE *fp;
CURLcode res;
std::string readBuffer;
curl = curl_easy_init();
char outfilename[FILENAME_MAX] = "C:\Users\admin\desktop\test.txt";
if(curl) {
fp = fopen(outfilename,"wb");
curl_easy_setopt(curl, CURLOPT_URL, "http://www.example.com");
curl_easy_setopt(curl, CURLOPT_POSTFIELDS, "user=123&pass=123");
curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1);
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data);
curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);
res = curl_easy_perform(curl);
Sleep(1000);
curl_easy_cleanup(curl);
fclose(fp);
}
return EXIT_SUCCESS;
}
输出成功保存到文本文件中。
我关心的是如何提取特定标签之间的特定内容。
例如我只想要
什么是最简单的方法,谢谢。
在您的示例中,您将网站的响应转储到文件中,libcURL 将您点击的网页返回的数据原样写入,不需要对返回数据进行重构。
可以通过定义write_data
函数获取内存中的数据,只需要如下格式:
size_t write_data(char *ptr, size_t size, size_t nmemb, void *userdata);
在内存中获取数据后,您可以根据需要对其进行解析和重组。
See Example Here 用于使用 write_data
函数。
对于XML解析你可以使用This sample code