我应该在哪里关闭这个特定示例的频道?

Where should I close channel on this specific example?

我正在编写一个简单的 Go 管道,目标是获取 url 和打印状态。

在fetchUrl上,我需要关闭通道通知main,不会有数据来所以释放main go例程。但是我不能在循环后真正关闭 fetchurl 函数的通道,因为它太快了。我不想在应用程序中添加等待组,因为目前我的整个目标都是了解渠道。

在 fetchurl 函数上,调用两个通道只是为了确保一次只有 2 个作业。

package main

import (
    "fmt"
    "net/http"
    "os"
)

func gen(val []string) <-chan string {
    out := make(chan string, len(val))
    for _, val := range val {
        out <- val
    }
    close(out)
    return out
}

func fetchUrl(in <-chan string) <-chan string {
    out := make(chan string)
    two := make(chan struct{}, 2)
    fmt.Println("blocked")
    for url := range in {
        two <- struct{}{}
        go fetchWorker(url, two, out)
    }

    return out
}

func fetchWorker(url string, two chan struct{}, out chan string) {
    res, err := http.Get("https://" + url)
    if err != nil {
        panic(err)
    }
    <-two
    out <- fmt.Sprintf("[%d] %s\n", res.StatusCode, url)
}

func main() {
    for val := range fetchUrl(gen(os.Args[1:])) {
        fmt.Println(val)
    }
}

您需要在写入每个结果后关闭 out 通道。最简单的判断方法是当所有的 worker goroutines 退出时,最简单的判断方法是使用 sync.WaitGroup。 (在 Go 中,channels 和 goroutines 是密切相关的概念,因此 goroutine 管理是使用 channels 的一部分。)

在现有代码中,您可以将其绑定到 fetchUrl 函数中:

var wg sync.WaitGroup
for url := range in {
    two <- struct{}{}
    wg.Add(1)
    go func() {
        defer wg.Done()
        fetchWorker(url, two, out)
    }()
}
wg.Wait()
close(out)

您编写的代码会遇到的另一个结构性问题是 genfetchUrl 都会创建通道,运行 所有应该写入的代码频道,以及 return 只有在这些作者完成后才会出现的频道;由于在函数 returns 之前无法从通道读取任何内容,这将导致死锁。您可以通过在顶层创建所有通道并将它们传递给生成器函数来解决这个问题。

如果您希望两个工作人员从同一个 URL 队列中读取数据,标准模式是只启动两个 goroutines 从相同的通道读取和写入。例如,您可以将 fetchWorker 重写为

func fetchWorker(urls <-chan string, out chan<- string) {
    for url := range urls {
        res, err := http.Get("https://" + url)
        if err != nil {
            panic(err)
        }
        out <- fmt.Sprintf("[%d] %s\n", res.StatusCode, url)
    }
}

在顶层,创建通道、创建工作人员、提供输入并使用输出。

func main() {
    urls := make(chan string)
    out := make(chan string)

    // Launch a goroutine to feed data into urls, then
    // close(urls), then stop
    go gen(os.Args[1:], urls)

    // Launch worker goroutines
    workerCount := 2
    var wg sync.WaitGroup
    for i := 0; i < workerCount; i++ {
        wg.Add(1)
        go func() {
            defer wg.Done()
            fetchWorker(urls, out)
        }()
    }

    // Launch a dedicated goroutine to close the channel
    go func() {
        wg.Wait()
        close(out)
    }()

    // Read the results
    for result := range(out) {
        fmt.Println(result)
    }
}