记忆有效的方式
memory efficient way
我有两个用 Go 编写的类似程序的例子。该代码的主要目的是使用结构中的值对结构映射进行排序。
带指针的示例
package main
import (
"fmt"
"sort"
)
type payload struct {
data string
value float64
}
type container struct {
counter int
storage map[int]*payload
}
type payloadSlice []*payload
// Len is part of sort.Interface.
func (p payloadSlice) Len() int {
return len(p)
}
// Swap is part of sort.Interface.
func (p payloadSlice) Swap(i, j int) {
p[i], p[j] = p[j], p[i]
}
// Less is part of sort.Interface. We use count as the value to sort by
func (p payloadSlice) Less(i, j int) bool {
return p[i].value < p[j].value
}
func main() {
name := "special_unique_name"
var m = map[string]container{
name: {counter: 10, storage: map[int]*payload{
5: {data: "epsilon", value: 55},8: {data: "theta", value: 85},4: {data: "delta", value: 48},1: {data: "alpha", value: 14},10: {data: "kappa", value: 101},
3: {data: "gamma", value: 31},6: {data: "zeta", value: 63},2: {data: "beta", value: 26},9: {data: "iota", value: 92},7: {data: "eta", value: 79},
}},
}
s := make(payloadSlice, 0, len(m[name].storage))
for _, v := range m[name].storage {
s = append(s, v)
}
sort.Sort(s)
for _, v := range s {
fmt.Println(name, v)
}
}
具有值的示例
package main
import (
"fmt"
"sort"
)
type payload struct {
data string
value float64
}
type container struct {
counter int
storage map[int]payload
}
type payloadSlice []payload
// Len is part of sort.Interface.
func (p payloadSlice) Len() int {
return len(p)
}
// Swap is part of sort.Interface.
func (p payloadSlice) Swap(i, j int) {
p[i], p[j] = p[j], p[i]
}
// Less is part of sort.Interface. We use count as the value to sort by
func (p payloadSlice) Less(i, j int) bool {
return p[i].value < p[j].value
}
func main() {
name := "special_unique_name"
var m = map[string]container{
name: {counter: 10, storage: map[int]payload{
5: {data: "epsilon", value: 55},8: {data: "theta", value: 85},4: {data: "delta", value: 48},1: {data: "alpha", value: 14},10: {data: "kappa", value: 101},
3: {data: "gamma", value: 31},6: {data: "zeta", value: 63},2: {data: "beta", value: 26},9: {data: "iota", value: 92},7: {data: "eta", value: 79},
}},
}
s := make(payloadSlice, 0, len(m[name].storage))
for _, v := range m[name].storage {
s = append(s, v)
}
sort.Sort(s)
for _, v := range s {
fmt.Println(name, v)
}
}
我想知道 2 个时刻:
哪个示例内存效率高? (我想这是一个指针方式)
如何使用具有不同数量结构的测试数据来衡量这些示例的性能?你能帮我创建基准吗?
我想映射中每个结构的大小平均在 1-2kB 之间变化。
"Memory-efficient" 是一个非常宽泛的术语,在像 Go 这样具有独立堆和堆栈的垃圾收集语言中可能意味着几个非常不同的东西:
- 什么占用的内存最少?
- 什么产生最小的 GC 压力?
如果您想尽量减少应用程序的占用空间,您可能希望在多个范围(例如多个函数)中使用一个值时随时使用指针。这减少了复制,但增加了等于指针大小的开销(64 位系统上为 8 个字节)。
如果你想最小化 GC 压力,你 可能 只想在需要指针语义或基础值非常大时才使用指针。指针强制将值压入堆,这是垃圾回收的对象,而值可以保留在堆栈上,而不是(当函数returns时,堆栈被整体销毁,这是线程-安全且不需要参考跟踪)。
"GC pressure" 的想法是,在堆上创建和销毁的东西越多,垃圾收集器必须做的工作就越多,这会占用处理器时间,而不是应用程序正在做的实际工作。每次在堆上分配时,如果新值不存在 space,垃圾收集器将尝试通过在堆上查找不再需要的值来释放 space。您在堆上分配的越多,GC 必须 运行 的频率就越高,这些 运行 花费的时间也就越长。
对于您的第二个问题,您可以(并且应该!)使用 benchmarking facility of the testing
package 衡量针对您的特定情况的各种方法的性能。确保使用真实的数据和操作进行测试;使用 "dummy" 数据类型的微基准测试或基准测试不太可能产生任何值的数据。该包的文档,以及通过网络搜索很容易找到的无数博客文章和教程,应该可以指导您正确地了解如何在 Go 中编写和使用基准测试。
在您的具体情况下,请记住您的数据类型 - 就此问题而言 - 比您想象的要小:在 64 位系统上为 24 字节,无论长度如何字符串。为什么?因为 string
在内部是一个包含 int
长度和指向底层字节的指针的结构。当您尝试优化内存使用时,请记住字符串、切片(但不是数组!)和映射都是非常小的结构,包含指向其基础数据的指针。
最重要的是:过早的优化是万恶之源。您应该为两件事编写代码:功能和可读性。当它们提供您需要的功能时使用指针语义,并且使用起来具有直观意义。如果您测量资源问题(CPU或内存),那么您应该分析您的应用程序以找到问题的根源,优先考虑并优化它们。
在您测量和分析性能问题之前,您不会遇到性能问题。
我有两个用 Go 编写的类似程序的例子。该代码的主要目的是使用结构中的值对结构映射进行排序。
带指针的示例
package main
import (
"fmt"
"sort"
)
type payload struct {
data string
value float64
}
type container struct {
counter int
storage map[int]*payload
}
type payloadSlice []*payload
// Len is part of sort.Interface.
func (p payloadSlice) Len() int {
return len(p)
}
// Swap is part of sort.Interface.
func (p payloadSlice) Swap(i, j int) {
p[i], p[j] = p[j], p[i]
}
// Less is part of sort.Interface. We use count as the value to sort by
func (p payloadSlice) Less(i, j int) bool {
return p[i].value < p[j].value
}
func main() {
name := "special_unique_name"
var m = map[string]container{
name: {counter: 10, storage: map[int]*payload{
5: {data: "epsilon", value: 55},8: {data: "theta", value: 85},4: {data: "delta", value: 48},1: {data: "alpha", value: 14},10: {data: "kappa", value: 101},
3: {data: "gamma", value: 31},6: {data: "zeta", value: 63},2: {data: "beta", value: 26},9: {data: "iota", value: 92},7: {data: "eta", value: 79},
}},
}
s := make(payloadSlice, 0, len(m[name].storage))
for _, v := range m[name].storage {
s = append(s, v)
}
sort.Sort(s)
for _, v := range s {
fmt.Println(name, v)
}
}
具有值的示例
package main
import (
"fmt"
"sort"
)
type payload struct {
data string
value float64
}
type container struct {
counter int
storage map[int]payload
}
type payloadSlice []payload
// Len is part of sort.Interface.
func (p payloadSlice) Len() int {
return len(p)
}
// Swap is part of sort.Interface.
func (p payloadSlice) Swap(i, j int) {
p[i], p[j] = p[j], p[i]
}
// Less is part of sort.Interface. We use count as the value to sort by
func (p payloadSlice) Less(i, j int) bool {
return p[i].value < p[j].value
}
func main() {
name := "special_unique_name"
var m = map[string]container{
name: {counter: 10, storage: map[int]payload{
5: {data: "epsilon", value: 55},8: {data: "theta", value: 85},4: {data: "delta", value: 48},1: {data: "alpha", value: 14},10: {data: "kappa", value: 101},
3: {data: "gamma", value: 31},6: {data: "zeta", value: 63},2: {data: "beta", value: 26},9: {data: "iota", value: 92},7: {data: "eta", value: 79},
}},
}
s := make(payloadSlice, 0, len(m[name].storage))
for _, v := range m[name].storage {
s = append(s, v)
}
sort.Sort(s)
for _, v := range s {
fmt.Println(name, v)
}
}
我想知道 2 个时刻:
哪个示例内存效率高? (我想这是一个指针方式)
如何使用具有不同数量结构的测试数据来衡量这些示例的性能?你能帮我创建基准吗?
我想映射中每个结构的大小平均在 1-2kB 之间变化。
"Memory-efficient" 是一个非常宽泛的术语,在像 Go 这样具有独立堆和堆栈的垃圾收集语言中可能意味着几个非常不同的东西:
- 什么占用的内存最少?
- 什么产生最小的 GC 压力?
如果您想尽量减少应用程序的占用空间,您可能希望在多个范围(例如多个函数)中使用一个值时随时使用指针。这减少了复制,但增加了等于指针大小的开销(64 位系统上为 8 个字节)。
如果你想最小化 GC 压力,你 可能 只想在需要指针语义或基础值非常大时才使用指针。指针强制将值压入堆,这是垃圾回收的对象,而值可以保留在堆栈上,而不是(当函数returns时,堆栈被整体销毁,这是线程-安全且不需要参考跟踪)。
"GC pressure" 的想法是,在堆上创建和销毁的东西越多,垃圾收集器必须做的工作就越多,这会占用处理器时间,而不是应用程序正在做的实际工作。每次在堆上分配时,如果新值不存在 space,垃圾收集器将尝试通过在堆上查找不再需要的值来释放 space。您在堆上分配的越多,GC 必须 运行 的频率就越高,这些 运行 花费的时间也就越长。
对于您的第二个问题,您可以(并且应该!)使用 benchmarking facility of the testing
package 衡量针对您的特定情况的各种方法的性能。确保使用真实的数据和操作进行测试;使用 "dummy" 数据类型的微基准测试或基准测试不太可能产生任何值的数据。该包的文档,以及通过网络搜索很容易找到的无数博客文章和教程,应该可以指导您正确地了解如何在 Go 中编写和使用基准测试。
在您的具体情况下,请记住您的数据类型 - 就此问题而言 - 比您想象的要小:在 64 位系统上为 24 字节,无论长度如何字符串。为什么?因为 string
在内部是一个包含 int
长度和指向底层字节的指针的结构。当您尝试优化内存使用时,请记住字符串、切片(但不是数组!)和映射都是非常小的结构,包含指向其基础数据的指针。
最重要的是:过早的优化是万恶之源。您应该为两件事编写代码:功能和可读性。当它们提供您需要的功能时使用指针语义,并且使用起来具有直观意义。如果您测量资源问题(CPU或内存),那么您应该分析您的应用程序以找到问题的根源,优先考虑并优化它们。
在您测量和分析性能问题之前,您不会遇到性能问题。