"Infinite loop" 导致无法访问代码
"Infinite loop" causing unreachable code
我目前正在尝试使用 html 分词器 https://godoc.org/golang.org/x/net/html。
所以我想做的是:从 url 获取所有链接,如果 url 包含某个字符串 -> 添加到 url-列表。
resp, err = client.Get("someurl")
var urls []string
if err != nil {
log.Fatal(err)
}
z := html.NewTokenizer(resp.Body)
for {
tt := z.Next()
switch {
case tt == html.ErrorToken:
return
case tt == html.StartTagToken:
t := z.Token()
isAnchor := t.Data == "a"
if !isAnchor {
continue
}
ok, url := getHref(t)
if !ok {
continue
}
if strings.Contains(url, "somestring") {
urls = append(urls, url)
}
}
}
fmt.Println(urls)
这不起作用,因为 "fmt.Println(urls)" 无法访问。循环 ofc 在某个时候结束......但这不会编译。如何获取循环后的代码才能访问?
此致
循环中没有 break
。它结束的唯一方法是通过 return
将控制发送出此函数。这意味着 fmt.Println(urls)
不可访问。
试试这个:
L:
for {
tt := z.Next()
switch {
case tt == html.ErrorToken:
break L
case tt == html.StartTagToken:
t := z.Token()
isAnchor := t.Data == "a"
if !isAnchor {
continue
}
ok, url := getHref(t)
if !ok {
continue
}
if strings.Contains(url, "somestring") {
urls = append(urls, url)
}
}
}
使用他们在此处提供的示例:https://godoc.org/golang.org/x/net/html#example-Parse
修改您的代码以适应此:
resp, err = client.Get("someurl")
var urls []string
if err != nil {
log.Fatal(err)
}
doc, err := html.Parse(strings.NewReader(resp.Body))
if err != nil {
log.Fatal(err)
}
var f func(*html.Node)
f = func(n *html.Node) {
if n.Type == html.ElementNode && n.Data == "a" {
for _, a := range n.Attr {
if a.Key == "href" {
fmt.Println(a.Val)
if strings.Contains(a.Val, "somestring") {
urls = append(urls, a.Val)
}
break
}
}
}
for c := n.FirstChild; c != nil; c = c.NextSibling {
f(c)
}
}
f(doc)
在函数中添加循环并退出并返回。
我目前正在尝试使用 html 分词器 https://godoc.org/golang.org/x/net/html。
所以我想做的是:从 url 获取所有链接,如果 url 包含某个字符串 -> 添加到 url-列表。
resp, err = client.Get("someurl")
var urls []string
if err != nil {
log.Fatal(err)
}
z := html.NewTokenizer(resp.Body)
for {
tt := z.Next()
switch {
case tt == html.ErrorToken:
return
case tt == html.StartTagToken:
t := z.Token()
isAnchor := t.Data == "a"
if !isAnchor {
continue
}
ok, url := getHref(t)
if !ok {
continue
}
if strings.Contains(url, "somestring") {
urls = append(urls, url)
}
}
}
fmt.Println(urls)
这不起作用,因为 "fmt.Println(urls)" 无法访问。循环 ofc 在某个时候结束......但这不会编译。如何获取循环后的代码才能访问?
此致
循环中没有 break
。它结束的唯一方法是通过 return
将控制发送出此函数。这意味着 fmt.Println(urls)
不可访问。
试试这个:
L:
for {
tt := z.Next()
switch {
case tt == html.ErrorToken:
break L
case tt == html.StartTagToken:
t := z.Token()
isAnchor := t.Data == "a"
if !isAnchor {
continue
}
ok, url := getHref(t)
if !ok {
continue
}
if strings.Contains(url, "somestring") {
urls = append(urls, url)
}
}
}
使用他们在此处提供的示例:https://godoc.org/golang.org/x/net/html#example-Parse
修改您的代码以适应此:
resp, err = client.Get("someurl")
var urls []string
if err != nil {
log.Fatal(err)
}
doc, err := html.Parse(strings.NewReader(resp.Body))
if err != nil {
log.Fatal(err)
}
var f func(*html.Node)
f = func(n *html.Node) {
if n.Type == html.ElementNode && n.Data == "a" {
for _, a := range n.Attr {
if a.Key == "href" {
fmt.Println(a.Val)
if strings.Contains(a.Val, "somestring") {
urls = append(urls, a.Val)
}
break
}
}
}
for c := n.FirstChild; c != nil; c = c.NextSibling {
f(c)
}
}
f(doc)
在函数中添加循环并退出并返回。