Swift 的异构值类型数组是如何工作的？

Question

我是一名刚开始使用 Swift 的 C++ 程序员。我观看了 Dave Abrahams 的 WWCD 演讲 "Protocol Orientated Programming in Swift"，我对创建受协议约束的异构值类型数组的方式很感兴趣。

要使用视频中的示例，给定协议 Drawable 和实现它的两个结构：

protocol Drawable {
    func draw(renderer: Renderer) // Renderer is another protocol
}

struct Circle : Drawable {
    func draw(renderer: Renderer) {
        // Implementation
    }
}

struct Rectangle : Drawable {
    func draw(renderer: Renderer) {
        // Implementation
    }
}

可以将 Diagram 定义为包含 Drawables

的数组

struct Diagram : Drawable {
    var elements: [Drawable] = []

    func draw(renderer: Renderer) {
        for e in elements {
            e.draw(renderer);
        }
    }
}

我的问题是，这个异构 elements 数组到底是如何工作的？由于 Drawable 的各种实现的大小可能不同，我看不出如何将它们布置在内存中的有效数组中。这是否意味着这样的 "protocol array" 实际上是在表面下使用按元素堆分配和 dynamic/virtual 函数调用？

Answer 1

我也很好奇，虽然我没有足够的时间来彻底弄清楚它。我仍然认为我已经得到了一些近似值作为答案放在这里。

首先，这是 Jason Bell 的 article，它提供了一些关于幕后工作原理的提示（不仅适用于 Swift，也适用于 Objective-C 和其他语言）。

其次，如果我采用这个简单的程序：

protocol Foo { }

struct Bar: Foo { }

var fooArray = [Foo]()

fooArray.append(Bar())
fooArray.append(Bar())
fooArray.append(Bar())

let arrayElement = fooArray[0]

print(arrayElement)

... 并通过 swiftc -emit-ir unveil.swift > unveil.ir 将其编译成 LLVM IR 然后我可以找出以下 IR 代码对应于一个简单的 fooArray.append(Bar()):

%15 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 1
store %swift.type* bitcast (i64* getelementptr inbounds ({ i8**, i64, { i64, i8*, i32, i32, i8*, %swift.type** (%swift.type*)*, %swift.type_pattern*, i32, i32, i32 }*, %swift.type* }* @_TMfV6unveil3Bar, i32 0, i32 1) to %swift.type*), %swift.type** %15, align 8
%16 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 2
store i8** getelementptr inbounds ([0 x i8*]* @_TWPV6unveil3BarS_3FooS_, i32 0, i32 0), i8*** %16, align 8
%17 = getelementptr inbounds %P6unveil3Foo_* %3, i32 0, i32 0
call void @_TFV6unveil3BarCfMS0_FT_S0_()
%18 = bitcast %P6unveil3Foo_* %3 to %swift.opaque*
call void @_TFSa6appendurfRGSaq__Fq_T_(%swift.opaque* noalias nocapture %18, %swift.type* %14, %Sa* nocapture dereferenceable(8) @_Tv6unveil8fooArrayGSaPS_3Foo__)

Here 你可以找到 LLVM IR 语法，但对我来说上面的意思是 Swift 数组实际上是指针数组。

此外，与 IR 类似，我可以进入相同 Swift 行的程序集，即：

leaq    __TWPV6unveil3BarS_3FooS_(%rip), %rax
leaq    __TMfV6unveil3Bar(%rip), %rcx
addq    , %rcx
movq    %rcx, -56(%rbp)
movq    %rax, -48(%rbp)
callq   __TFV6unveil3BarCfMS0_FT_S0_
leaq    __Tv6unveil8fooArrayGSaPS_3Foo__(%rip), %rdx
leaq    -80(%rbp), %rax
movq    %rax, %rdi
movq    -160(%rbp), %rsi
callq   __TFSa6appendurfRGSaq__Fq_T_

...再次，上面操纵了指针，从而证实了理论。

最后，swift.org 中的 SIL headers SILWitnessTable.h 和 SILWitnessVisitor.h 可以在 swift/include/swift/SIL/ 找到同样的建议。

实际上，我猜测（我希望真正知道他在说什么的人在这里权衡）value-types（例如struct s) 和 reference-types（阅读 classes）在 Swift 的本质上并没有太大区别。可能主要区别在于 copy-on-write 是否强制执行。

Swift 的异构值类型数组是如何工作的？

How do Swift's heterogenous value type arrays work?

interface

value-type

swift