良性 ELF 数据集

Benign ELF dataset

我正在使用机器学习进行物联网恶意软件分类,目前我有一个包含 1137 个恶意 ELF 样本的数据集,它们支持不同的 CPU 架构(即英特尔、MIPS、ARM、SPARC、摩托罗拉) .所以现在试图找出一组良性的 ELF 样本以进行分类。我找到了 .deb、.bin 和 .RPM,但我认为我无法使用它们进行分类。 我还发现了良性 ELF,但问题是它们中的大多数都支持 ARM arch,很少有样本支持 Intel。 你能否告诉我是否可以继续分析其他文件扩展名,以及你是否了解 ELF 存储库。

Can you please advise me whether I can proceed with analyzing the other file extensions, and if you are aware of ELF repositories.

您可以.deb.rpm包中提取 ELF文件:

mkdir aa && dpkg -x foo.deb aa
mkdir bb && rpm2cpio bar.rpm | (cd bb; cpio -idm; )

直接分析 .debs 和 .rpms 可能会告诉你的分类器任何 ELF 都是恶意的,而任何不是 ELF 的都不是;这不是一个非常有用的分类器。