打开 uri 抛出错误 => (URI::InvalidURIError)
Open-uri throwing error => (URI::InvalidURIError)
我有一个用于测试目的的程序,我正在做的是抓取网络上的开放代理,并记录它们的信息,但是这是一种非常不同类型的代理抓取器,因为它创建在执行之前在文件内部之前的一堆随机代理例如:
def create_possibles
puts "Creating random possible proxies..".green.bold
1.times do
port = rand(2000..8080)
1.times do
ip = Array.new(4){rand(256)}.join('.')
possible_proxy = "#{ip}:#{port}"
File.open("possible_proxies.txt", "a") {|s| s.puts(possible_proxy)}
end
end
end
#<= 189.96.49.87:7990
我想用那个 "possible proxy" 做的是打开它并查看它是否有效,但是当我使用以下代码时它只会抛出该错误:
def check_possibles
IO.read("possible_proxies.txt").each_line do |proxy|
puts open('http://google.com', :proxy => "http://#{proxy}")
end
end
我有两个问题:
- 这是否意味着代理无效,如果无效,是否有办法跳过文件中的该行?可能通过使用
next
或 skip
?
- 如果这并不意味着代理无效,那是什么意思,我是不是在我的代码中做错了什么导致它读取 url 错误?
完整错误:
C:/Ruby22/lib/ruby/2.2.0/uri/rfc3986_parser.rb:66:in `split': bad URI(is not URI
?): http://189.96.49.87:7990 (URI::InvalidURIError)
编辑:
有人告诉我尝试 URI.parse
,但我得到了同样的错误:
C:/Ruby22/lib/ruby/2.2.0/uri/rfc3986_parser.rb:66:in `split': bad URI(is not URI
?): http://195.239.61.210:4365 (URI::InvalidURIError) #<= Different IP
当您使用 #each_line
遍历 ruby 中的每一行时,它会为您提供每一行 ,包括换行符 。 Ruby 的 URI 库不喜欢换行符。只需替换
:proxy => "http://#{proxy}"
和
:proxy => "http://#{proxy.chomp}"
String#chomp
将切断字符串末尾的所有换行符。
我有一个用于测试目的的程序,我正在做的是抓取网络上的开放代理,并记录它们的信息,但是这是一种非常不同类型的代理抓取器,因为它创建在执行之前在文件内部之前的一堆随机代理例如:
def create_possibles
puts "Creating random possible proxies..".green.bold
1.times do
port = rand(2000..8080)
1.times do
ip = Array.new(4){rand(256)}.join('.')
possible_proxy = "#{ip}:#{port}"
File.open("possible_proxies.txt", "a") {|s| s.puts(possible_proxy)}
end
end
end
#<= 189.96.49.87:7990
我想用那个 "possible proxy" 做的是打开它并查看它是否有效,但是当我使用以下代码时它只会抛出该错误:
def check_possibles
IO.read("possible_proxies.txt").each_line do |proxy|
puts open('http://google.com', :proxy => "http://#{proxy}")
end
end
我有两个问题:
- 这是否意味着代理无效,如果无效,是否有办法跳过文件中的该行?可能通过使用
next
或skip
? - 如果这并不意味着代理无效,那是什么意思,我是不是在我的代码中做错了什么导致它读取 url 错误?
完整错误:
C:/Ruby22/lib/ruby/2.2.0/uri/rfc3986_parser.rb:66:in `split': bad URI(is not URI
?): http://189.96.49.87:7990 (URI::InvalidURIError)
编辑:
有人告诉我尝试 URI.parse
,但我得到了同样的错误:
C:/Ruby22/lib/ruby/2.2.0/uri/rfc3986_parser.rb:66:in `split': bad URI(is not URI
?): http://195.239.61.210:4365 (URI::InvalidURIError) #<= Different IP
当您使用 #each_line
遍历 ruby 中的每一行时,它会为您提供每一行 ,包括换行符 。 Ruby 的 URI 库不喜欢换行符。只需替换
:proxy => "http://#{proxy}"
和
:proxy => "http://#{proxy.chomp}"
String#chomp
将切断字符串末尾的所有换行符。