使用Boilerpipe时如何解决ConnectException错误?
How to solve ConnectException error when using Boilerpipe?
我想使用 Boilerpipe 从几个网站的新闻页面中提取文本,问题是每次尝试时,我都会收到 ConnectionException 错误。
我只是使用了 boilerpipe quickstart guide 中的示例语法:
URL url = new URL("http://www.telegraph.co.uk/news/health/11523739/Nine-in-10-GPs-say-no-to-seven-day-opening.html");
String text = ArticleExtractor.INSTANCE.getText(url);
这是连接错误:
de.l3s.boilerpipe.BoilerpipeProcessingException: java.net.ConnectException: Connection refused: connect
at de.l3s.boilerpipe.extractors.ExtractorBase.getText(ExtractorBase.java:89)
at extract.Test.main(Test.java:14)
Caused by: java.net.ConnectException: Connection refused: connect
我尝试了很多网站,但都出现了同样的错误。
我该如何解决这个问题,或者至少看看问题出在哪里? (可能是防火墙,或端口配置...)
经过进一步研究,我发现是企业中的防火墙阻止了这些请求。
我想使用 Boilerpipe 从几个网站的新闻页面中提取文本,问题是每次尝试时,我都会收到 ConnectionException 错误。 我只是使用了 boilerpipe quickstart guide 中的示例语法:
URL url = new URL("http://www.telegraph.co.uk/news/health/11523739/Nine-in-10-GPs-say-no-to-seven-day-opening.html");
String text = ArticleExtractor.INSTANCE.getText(url);
这是连接错误:
de.l3s.boilerpipe.BoilerpipeProcessingException: java.net.ConnectException: Connection refused: connect
at de.l3s.boilerpipe.extractors.ExtractorBase.getText(ExtractorBase.java:89)
at extract.Test.main(Test.java:14)
Caused by: java.net.ConnectException: Connection refused: connect
我尝试了很多网站,但都出现了同样的错误。
我该如何解决这个问题,或者至少看看问题出在哪里? (可能是防火墙,或端口配置...)
经过进一步研究,我发现是企业中的防火墙阻止了这些请求。