有没有办法从 publicsuffix 库中只提取有效域?
Is there a way to extract only valid domains from the publicsuffix library?
我查看了 Go 中的 publicsuffix
库,发现它在从字符串中提取域时非常有用。这是我的:
package main
import (
"fmt"
"golang.org/x/net/publicsuffix"
)
func main() {
url := "a.very.complex-domain.co.uk"
u, _ := publicsuffix.EffectiveTLDPlusOne(url)
fmt.Printf(u)
}
这很好地将 complex-domain.co.uk
作为有效域。然而,我面临的问题是当任何随机字符串被传递给函数(包含一个点)时,库无论如何都会给出一个有效的域名(即使公共后缀列表中不存在 TLD)。
package main
import (
"fmt"
"golang.org/x/net/publicsuffix"
)
func main() {
url := "a.very.complex-domain.someinvalidtld"
u, _ := publicsuffix.EffectiveTLDPlusOne(url)
fmt.Printf(u)
}
给出:complex-domain.someinvalidtld
我的理解是 publicsuffix
包假设它是一个本地域并无论如何解析它。有没有办法避免这种行为并只提取有效的?
我明白了,你可以使用同一个库轻松地做到这一点:
func checkForValidTLD(str string) bool {
etld, im := publicsuffix.PublicSuffix(str)
var validtld = false
if im { // ICANN managed
validtld = true
} else if strings.IndexByte(etld, '.') >= 0 { // privately managed
validtld = true
}
return validtld
}
所以像这样调用函数:
if checkForValidTLD("a.very.complex-domain.someinvalidtld") {
fmt.Println("Valid")
} else {
fmt.Println("Invalid")
}
Returns: Invalid
.
这背后的逻辑是:对于所有非 ICANN 管理的 TLD,如果它们中有 .
,则表示它们是私人管理的(例如 blogspot.co.uk
),否则它是无效的 TLD。
我查看了 Go 中的 publicsuffix
库,发现它在从字符串中提取域时非常有用。这是我的:
package main
import (
"fmt"
"golang.org/x/net/publicsuffix"
)
func main() {
url := "a.very.complex-domain.co.uk"
u, _ := publicsuffix.EffectiveTLDPlusOne(url)
fmt.Printf(u)
}
这很好地将 complex-domain.co.uk
作为有效域。然而,我面临的问题是当任何随机字符串被传递给函数(包含一个点)时,库无论如何都会给出一个有效的域名(即使公共后缀列表中不存在 TLD)。
package main
import (
"fmt"
"golang.org/x/net/publicsuffix"
)
func main() {
url := "a.very.complex-domain.someinvalidtld"
u, _ := publicsuffix.EffectiveTLDPlusOne(url)
fmt.Printf(u)
}
给出:complex-domain.someinvalidtld
我的理解是 publicsuffix
包假设它是一个本地域并无论如何解析它。有没有办法避免这种行为并只提取有效的?
我明白了,你可以使用同一个库轻松地做到这一点:
func checkForValidTLD(str string) bool {
etld, im := publicsuffix.PublicSuffix(str)
var validtld = false
if im { // ICANN managed
validtld = true
} else if strings.IndexByte(etld, '.') >= 0 { // privately managed
validtld = true
}
return validtld
}
所以像这样调用函数:
if checkForValidTLD("a.very.complex-domain.someinvalidtld") {
fmt.Println("Valid")
} else {
fmt.Println("Invalid")
}
Returns: Invalid
.
这背后的逻辑是:对于所有非 ICANN 管理的 TLD,如果它们中有 .
,则表示它们是私人管理的(例如 blogspot.co.uk
),否则它是无效的 TLD。