Swift 的异构值类型数组是如何工作的?

How do Swift's heterogenous value type arrays work?

我是一名刚开始使用 Swift 的 C++ 程序员。我观看了 Dave Abrahams 的 WWCD 演讲 "Protocol Orientated Programming in Swift",我对创建受协议约束的异构值类型数组的方式很感兴趣。

要使用视频中的示例,给定协议 Drawable 和实现它的两个结构:

protocol Drawable {
    func draw(renderer: Renderer) // Renderer is another protocol
}

struct Circle : Drawable {
    func draw(renderer: Renderer) {
        // Implementation
    }
}

struct Rectangle : Drawable {
    func draw(renderer: Renderer) {
        // Implementation
    }
}

可以将 Diagram 定义为包含 Drawables

的数组
struct Diagram : Drawable {
    var elements: [Drawable] = []

    func draw(renderer: Renderer) {
        for e in elements {
            e.draw(renderer);
        }
    }
}

我的问题是,这个异构 elements 数组到底是如何工作的?由于 Drawable 的各种实现的大小可能不同,我看不出如何将它们布置在内存中的有效数组中。这是否意味着这样的 "protocol array" 实际上是在表面下使用按元素堆分配和 dynamic/virtual 函数调用?

我也很好奇,虽然我没有足够的时间来彻底弄清楚它。我仍然认为我已经得到了一些近似值作为答案放在这里。

首先,这是 Jason Bell 的 article,它提供了一些关于幕后工作原理的提示(不仅适用于 Swift,也适用于 Objective-C 和其他语言)。

其次,如果我采用这个简单的程序:

protocol Foo { }

struct Bar: Foo { }

var fooArray = [Foo]()

fooArray.append(Bar())
fooArray.append(Bar())
fooArray.append(Bar())

let arrayElement = fooArray[0]

print(arrayElement)

... 并通过 swiftc -emit-ir unveil.swift > unveil.ir 将其编译成 LLVM IR 然后我可以找出以下 IR 代码对应于一个简单的 fooArray.append(Bar()):

%15 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 1
store %swift.type* bitcast (i64* getelementptr inbounds ({ i8**, i64, { i64, i8*, i32, i32, i8*, %swift.type** (%swift.type*)*, %swift.type_pattern*, i32, i32, i32 }*, %swift.type* }* @_TMfV6unveil3Bar, i32 0, i32 1) to %swift.type*), %swift.type** %15, align 8
%16 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 2
store i8** getelementptr inbounds ([0 x i8*]* @_TWPV6unveil3BarS_3FooS_, i32 0, i32 0), i8*** %16, align 8
%17 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 0
call void @_TFV6unveil3BarCfMS0_FT_S0_()
%18 = bitcast %P6unveil3Foo_* %3 to %swift.opaque*
call void @_TFSa6appendurfRGSaq__Fq_T_(%swift.opaque* noalias nocapture %18, %swift.type* %14, %Sa* nocapture dereferenceable(8) @_Tv6unveil8fooArrayGSaPS_3Foo__)

Here 你可以找到 LLVM IR 语法,但对我来说上面的意思是 Swift 数组实际上是指针数组。

此外,与 IR 类似,我可以进入相同 Swift 行的程序集,即:

leaq    __TWPV6unveil3BarS_3FooS_(%rip), %rax
leaq    __TMfV6unveil3Bar(%rip), %rcx
addq    , %rcx
movq    %rcx, -56(%rbp)
movq    %rax, -48(%rbp)
callq   __TFV6unveil3BarCfMS0_FT_S0_
leaq    __Tv6unveil8fooArrayGSaPS_3Foo__(%rip), %rdx
leaq    -80(%rbp), %rax
movq    %rax, %rdi
movq    -160(%rbp), %rsi
callq   __TFSa6appendurfRGSaq__Fq_T_

...再次,上面操纵了指针,从而证实了理论。

最后,swift.org 中的 SIL headers SILWitnessTable.hSILWitnessVisitor.h 可以在 swift/include/swift/SIL/ 找到同样的建议。

实际上,我猜测(我希望真正知道他在说什么的人在这里权衡)value-types(例如struct s) 和 reference-types(阅读 classes)在 Swift 的本质上并没有太大区别。可能主要区别在于 copy-on-write 是否强制执行。