将 libcurl 中的 HTML 与文件中的文本进行比较

Compare HTML from libcurl with text from file

我正在使用 libcurl 连接到网站,并获取 HTML,我也在使用 LibTidy 提取文本。我的目的是验证文本文件中的句子是否在 HTML.

感谢 LibTidy,我将所有文本文件都作为一个字符 *。 我正在使用 : char *strstr(const char *one, const char *two) 来比较两个字符串。 第一个是libcurl和libTidy解析出来的字符串,第二个是文本文件中的字符串

当我使用函数 strstr(..) 时,结果为 NULL。 使用调试器显示这两个字符串不是以相同的方式 'encode'。

我试图找到因特网连接产生的字符串的问题所在。我尝试了不同的代码示例来修复它。

libcurl网站给出的代码,给我同样的问题,char *memory编码不好,无法正确比较。 https://curl.haxx.se/libcurl/c/getinmemory.html

我也试过这里的代码:,char *ptr 也有同样的问题。

我希望能够比较来自 libcurl 的字符串和来自文本文件的字符串。

不需要转换。任何 ASCII 文本 都是 UTF-8 文本,因此您只需使用 strstr 搜索它 as-is。这几乎就是 UTF-8 的全部要点。