使用 SSIS 读取二进制文件

Reading a binary file with SSIS

我们有一个二进制文件(来自电信系统)。 SSIS 可以读取吗?

据我了解 Raw File Source,它只能读取由 Raw File Destination 创建的文件。对吗?

原始文件来源

来自Raw file source official documentation:

The Raw File source reads raw data from a file. Because the representation of the data is native to the source, the data requires no translation and almost no parsing. This means that the Raw File source can read data more quickly than other sources such as the Flat File and the OLE DB sources.

The Raw File source is used to retrieve raw data that was previously written by the Raw File destination. You can also point the Raw File source to an empty raw file that contains only the columns (metadata-only file). You use the Raw File destination to generate the metadata-only file without having to run the package

您可以在下面的 link 查看 Raw 文件的使用示例:

读取二进制数据

我认为在 SSIS 中,您应该使用脚本组件作为源(在数据流任务中)来反序列化二进制文件并实现您自己的逻辑以生成输出列。

您可以查看以下 link 以获得更多见解:

脚本组件作为源代码

使用 C# 将二进制转换为字符串

是的,SSIS 用语中的 Raw File 是一种专有二进制格式,主要旨在降低加载速度、便携性和大小,只能由 SSIS 引擎生成和使用。

为了能够在 SSIS 中读取二进制文件,需要对其进行预处理。我的意思是您需要获取有关从中提取数据的正确程序的文档。

此时的答案是 SSIS 无法读取与 Raw File Destination 生成的文件格式不同的二进制文件。

您可以创建一个自定义 SSIS 组件 Class 并注册它以便在 SSIS 中使用。
Developing a Custom SSIS Source Component 胆小者勿入。

另一种方法是编写程序将二进制文件转换为 SSIS 可以读取的文件或将输出加载到数据库中 table。 SSIS 能为您做的就这么多。