如何使用Python报库?

How to use Python newspaper library?

我正在尝试制作网络解析器并保存了它。我找到了 newspaper 图书馆。我正在使用 Eclipse。但是我得不到好结果。请帮助我。

import newspaper

cnn_paper = newspaper.build('http://cnn.com')

for article in cnn_paper.articles:
    print(article.url)

这是一条错误消息:

Traceback (most recent call last):
  File "D:\workspace2\JesElaSearchSys\NespaperScraper_01.py", line 2, in <module>
    import newspaper
  File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\__init__.py", line 10, i
n <module>
    from .article import Article, ArticleException
  File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\article.py", line 12, in
 <module>
    from . import images
  File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\images.py", line 15, in 
<module>
    import urllib.request
ImportError: No module named request

您的代码没有任何问题。您将需要安装或找到 newspaperrequest 库。您的开发机器上似乎缺少 newspaper / request 库。

$ pip install newspaper
$ pip install urllib3

上面的命令将帮助您安装它。

虽然已经有了答案,但 Python2 的报纸库已被弃用,应避免使用。

Newspaper 已被弃用 Python2,根据他们的 official documentation,它是一个有缺陷的版本。您应该切换到 Python3 版本。

安装于 Python 3:

pip3 install newspaper3k

报纸是Python3图书馆!或者,查看我们已弃用和错误的 Python2 分支。 运行:pip3 安装 newspaper3k 而不是 pip3 安装报纸。在 python3 上,您必须安装 newspaper3k,而不是报纸。报纸是我们的 python2 图书馆。虽然使用 pip 安装报纸很简单,但如果您尝试在 ubuntu.

上安装,您将 运行 遇到可修复的问题