Matlab 抓取和编码
Matlab scraping and encoding
我尝试使用 urlread2 函数抓取一个站点。在定义 headers 和所有内容后,我得到了一个我不知道如何阅读的结果:
' lA®·E÷Òc?£$êoÅð
$qàxdï¿»ÅKÞDDõa²n_K?~~ÿùËo¿ûí׿ÿ{è}|züùý¯o?¿}ÿãYúòåÑïÏËl>ë·Ïª¯¾<ÆõùºPZ(5\µJc¼KýóWéå¥W9¾ká`5tÁjè8ÕÐq«¡ã
wbyG .......
我尝试使用 unicode2native 和 ISO-8859-1 进行一些解码。但是我得到的是从0到255的数字,我不知道下一步该怎么做...
期待您的建议。
谢谢
我找到了奇怪输出的原因:
其中一个 header 是
Accept-Encoding: gzip, deflate, sdch
因此默认选项是 gzip。一旦我取出这个 header 结果以通常且可读的方式返回。
我尝试使用 urlread2 函数抓取一个站点。在定义 headers 和所有内容后,我得到了一个我不知道如何阅读的结果:
' lA®·E÷Òc?£$êoÅð $qàxdï¿»ÅKÞDDõa²n_K?~~ÿùËo¿ûí׿ÿ{è}|züùý¯o?¿}ÿãYúòåÑïÏËl>ë·Ïª¯¾<ÆõùºPZ(5\µJc¼KýóWéå¥W9¾ká`5tÁjè8ÕÐq«¡ã wbyG .......
我尝试使用 unicode2native 和 ISO-8859-1 进行一些解码。但是我得到的是从0到255的数字,我不知道下一步该怎么做...
期待您的建议。 谢谢
我找到了奇怪输出的原因:
其中一个 header 是
Accept-Encoding: gzip, deflate, sdch
因此默认选项是 gzip。一旦我取出这个 header 结果以通常且可读的方式返回。