fasthttp.Client 结合 goroutines 的正确使用

Correct use of fasthttp.Client combined with goroutines

我是 Go 的新手,正在寻找将 net/httpfasthttp 与 goroutines 一起使用的正确方法。不幸的是,那里没有很多 fasthttp 客户端示例。

我找到了以下代码:(Example1)

package main

import (
    "bufio"
    "fmt"
    "github.com/valyala/fasthttp"
    "log"
    "net"
    "os"
    "sync"
    "time"
)

func grabPage(fastClient *fasthttp.Client, i int, wg *sync.WaitGroup) {
    defer wg.Done()
    _, body, err := fastClient.GetTimeout(nil, "https://en.wikipedia.org/wiki/Immanuel_Kant", time.Duration(time.Second*20))
    if err != nil {
        log.Fatal(err)
    }
    f, err := os.Create(fmt.Sprintf("./data/%d.txt", i))
    if err != nil {
        log.Fatal(err)
    }
    defer f.Close()
    w := bufio.NewWriter(f)
    w.Write(body)
}

func main() {
    var wg sync.WaitGroup
    total := 500

    c := &fasthttp.Client{
        Dial: func(addr string) (net.Conn, error) {
            return fasthttp.DialTimeout(addr, time.Second*10)
        },
        MaxConnsPerHost: total,
    }

    wg.Add(total)
    for index := 0; index < total; index++ {
        go grabPage(c, index, &wg)
    }
    wg.Wait()
}

在这段代码中,开发人员在 main() 函数中创建了一个 fasthttp.Client 实例,并使用 go grabPage(c, ...) 将其传递给 goroutine。根据我的理解,您可以通过这种方式创建一个实例,所有请求都使用这个实例来完成这项工作。

在另一个页面上,开发人员使用类似的东西:(Example2)

func grabPage(i int, wg *sync.WaitGroup) {
    defer wg.Done()

    fastClient := &fasthttp.Client{
        Dial: func(addr string) (net.Conn, error) {
            return fasthttp.DialTimeout(addr, time.Second*10)
        },
        MaxConnsPerHost: 500,
    }

    _, body, err := fastClient.GetTimeout(nil, "https://en.wikipedia.org/wiki/Immanuel_Kant", time.Duration(time.Second*20))
    if err != nil {
        log.Fatal(err)
    }
    f, err := os.Create(fmt.Sprintf("./data/%d.txt", i))
    if err != nil {
        log.Fatal(err)
    }
    defer f.Close()
    w := bufio.NewWriter(f)
    w.Write(body)
}

最大的问题是,这两种解决方案都正确吗? 或者 Example2 的解决方案是否真的创建了一个新实例并为每个 goroutine 使用大量内存?

我用我的问题的片段制作了示例,在 Example2 中肯定缺少 defer。这不是问题的一部分。

一个小问题: (fastClient *fasthttp.Client, i int, wg *sync.WaitGroup) -> fastClient 和 wg 是指针,所以为什么调用 grabPage(c, index, &wg) 而不是 grabPage(&c, index, &wg)

主要答案:两者都是正确的(因为它们工作得很好),只是不同。

根据 the docs,一个 fasthttp.Client 对于并发使用是安全的,因此共享一个实例是可以的。它可能 运行 进入并发连接限制,但这可能不是问题。

第二个例子确实有一些开销,将无法重用连接或参数,但这可能是一个无关紧要的用例(如果我只执行两个操作,节省开销可能不会值得优化)。

对于问题的第二部分:

  • c 已经是一个 *fasthttp.Client,所以不需要获取它的地址(&fasthttp.Client returns 一个指向新 fasthttp.Client 的指针)
  • wg是一个普通的sync.WaitGroup所以必须取地址