Swift 的异构值类型数组是如何工作的?
How do Swift's heterogenous value type arrays work?
我是一名刚开始使用 Swift 的 C++ 程序员。我观看了 Dave Abrahams 的 WWCD 演讲 "Protocol Orientated Programming in Swift",我对创建受协议约束的异构值类型数组的方式很感兴趣。
要使用视频中的示例,给定协议 Drawable
和实现它的两个结构:
protocol Drawable {
func draw(renderer: Renderer) // Renderer is another protocol
}
struct Circle : Drawable {
func draw(renderer: Renderer) {
// Implementation
}
}
struct Rectangle : Drawable {
func draw(renderer: Renderer) {
// Implementation
}
}
可以将 Diagram
定义为包含 Drawable
s
的数组
struct Diagram : Drawable {
var elements: [Drawable] = []
func draw(renderer: Renderer) {
for e in elements {
e.draw(renderer);
}
}
}
我的问题是,这个异构 elements
数组到底是如何工作的?由于 Drawable
的各种实现的大小可能不同,我看不出如何将它们布置在内存中的有效数组中。这是否意味着这样的 "protocol array" 实际上是在表面下使用按元素堆分配和 dynamic/virtual 函数调用?
我也很好奇,虽然我没有足够的时间来彻底弄清楚它。我仍然认为我已经得到了一些近似值作为答案放在这里。
首先,这是 Jason Bell 的 article,它提供了一些关于幕后工作原理的提示(不仅适用于 Swift,也适用于 Objective-C 和其他语言)。
其次,如果我采用这个简单的程序:
protocol Foo { }
struct Bar: Foo { }
var fooArray = [Foo]()
fooArray.append(Bar())
fooArray.append(Bar())
fooArray.append(Bar())
let arrayElement = fooArray[0]
print(arrayElement)
... 并通过 swiftc -emit-ir unveil.swift > unveil.ir
将其编译成 LLVM IR
然后我可以找出以下 IR
代码对应于一个简单的 fooArray.append(Bar())
:
%15 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 1
store %swift.type* bitcast (i64* getelementptr inbounds ({ i8**, i64, { i64, i8*, i32, i32, i8*, %swift.type** (%swift.type*)*, %swift.type_pattern*, i32, i32, i32 }*, %swift.type* }* @_TMfV6unveil3Bar, i32 0, i32 1) to %swift.type*), %swift.type** %15, align 8
%16 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 2
store i8** getelementptr inbounds ([0 x i8*]* @_TWPV6unveil3BarS_3FooS_, i32 0, i32 0), i8*** %16, align 8
%17 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 0
call void @_TFV6unveil3BarCfMS0_FT_S0_()
%18 = bitcast %P6unveil3Foo_* %3 to %swift.opaque*
call void @_TFSa6appendurfRGSaq__Fq_T_(%swift.opaque* noalias nocapture %18, %swift.type* %14, %Sa* nocapture dereferenceable(8) @_Tv6unveil8fooArrayGSaPS_3Foo__)
Here 你可以找到 LLVM IR 语法,但对我来说上面的意思是 Swift 数组实际上是指针数组。
此外,与 IR
类似,我可以进入相同 Swift 行的程序集,即:
leaq __TWPV6unveil3BarS_3FooS_(%rip), %rax
leaq __TMfV6unveil3Bar(%rip), %rcx
addq , %rcx
movq %rcx, -56(%rbp)
movq %rax, -48(%rbp)
callq __TFV6unveil3BarCfMS0_FT_S0_
leaq __Tv6unveil8fooArrayGSaPS_3Foo__(%rip), %rdx
leaq -80(%rbp), %rax
movq %rax, %rdi
movq -160(%rbp), %rsi
callq __TFSa6appendurfRGSaq__Fq_T_
...再次,上面操纵了指针,从而证实了理论。
最后,swift.org 中的 SIL headers SILWitnessTable.h
和 SILWitnessVisitor.h
可以在 swift/include/swift/SIL/
找到同样的建议。
实际上,我猜测(我希望真正知道他在说什么的人在这里权衡)value-types(例如struct
s) 和 reference-types(阅读 class
es)在 Swift 的本质上并没有太大区别。可能主要区别在于 copy-on-write 是否强制执行。
我是一名刚开始使用 Swift 的 C++ 程序员。我观看了 Dave Abrahams 的 WWCD 演讲 "Protocol Orientated Programming in Swift",我对创建受协议约束的异构值类型数组的方式很感兴趣。
要使用视频中的示例,给定协议 Drawable
和实现它的两个结构:
protocol Drawable {
func draw(renderer: Renderer) // Renderer is another protocol
}
struct Circle : Drawable {
func draw(renderer: Renderer) {
// Implementation
}
}
struct Rectangle : Drawable {
func draw(renderer: Renderer) {
// Implementation
}
}
可以将 Diagram
定义为包含 Drawable
s
struct Diagram : Drawable {
var elements: [Drawable] = []
func draw(renderer: Renderer) {
for e in elements {
e.draw(renderer);
}
}
}
我的问题是,这个异构 elements
数组到底是如何工作的?由于 Drawable
的各种实现的大小可能不同,我看不出如何将它们布置在内存中的有效数组中。这是否意味着这样的 "protocol array" 实际上是在表面下使用按元素堆分配和 dynamic/virtual 函数调用?
我也很好奇,虽然我没有足够的时间来彻底弄清楚它。我仍然认为我已经得到了一些近似值作为答案放在这里。
首先,这是 Jason Bell 的 article,它提供了一些关于幕后工作原理的提示(不仅适用于 Swift,也适用于 Objective-C 和其他语言)。
其次,如果我采用这个简单的程序:
protocol Foo { }
struct Bar: Foo { }
var fooArray = [Foo]()
fooArray.append(Bar())
fooArray.append(Bar())
fooArray.append(Bar())
let arrayElement = fooArray[0]
print(arrayElement)
... 并通过 swiftc -emit-ir unveil.swift > unveil.ir
将其编译成 LLVM IR
然后我可以找出以下 IR
代码对应于一个简单的 fooArray.append(Bar())
:
%15 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 1
store %swift.type* bitcast (i64* getelementptr inbounds ({ i8**, i64, { i64, i8*, i32, i32, i8*, %swift.type** (%swift.type*)*, %swift.type_pattern*, i32, i32, i32 }*, %swift.type* }* @_TMfV6unveil3Bar, i32 0, i32 1) to %swift.type*), %swift.type** %15, align 8
%16 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 2
store i8** getelementptr inbounds ([0 x i8*]* @_TWPV6unveil3BarS_3FooS_, i32 0, i32 0), i8*** %16, align 8
%17 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 0
call void @_TFV6unveil3BarCfMS0_FT_S0_()
%18 = bitcast %P6unveil3Foo_* %3 to %swift.opaque*
call void @_TFSa6appendurfRGSaq__Fq_T_(%swift.opaque* noalias nocapture %18, %swift.type* %14, %Sa* nocapture dereferenceable(8) @_Tv6unveil8fooArrayGSaPS_3Foo__)
Here 你可以找到 LLVM IR 语法,但对我来说上面的意思是 Swift 数组实际上是指针数组。
此外,与 IR
类似,我可以进入相同 Swift 行的程序集,即:
leaq __TWPV6unveil3BarS_3FooS_(%rip), %rax
leaq __TMfV6unveil3Bar(%rip), %rcx
addq , %rcx
movq %rcx, -56(%rbp)
movq %rax, -48(%rbp)
callq __TFV6unveil3BarCfMS0_FT_S0_
leaq __Tv6unveil8fooArrayGSaPS_3Foo__(%rip), %rdx
leaq -80(%rbp), %rax
movq %rax, %rdi
movq -160(%rbp), %rsi
callq __TFSa6appendurfRGSaq__Fq_T_
...再次,上面操纵了指针,从而证实了理论。
最后,swift.org 中的 SIL headers SILWitnessTable.h
和 SILWitnessVisitor.h
可以在 swift/include/swift/SIL/
找到同样的建议。
实际上,我猜测(我希望真正知道他在说什么的人在这里权衡)value-types(例如struct
s) 和 reference-types(阅读 class
es)在 Swift 的本质上并没有太大区别。可能主要区别在于 copy-on-write 是否强制执行。