检测 base64 dataURL 图像中的恶意代码或文本
Detect malicious code or text inside base64 dataURL image
我有以下 3 个 "dataURL image",如果您通过 "URL" 打开它们,它们都是 returns 相同的图像,但是下面的两个 dataURL 代码具有 "PHP code" 和 "JavaScript code" 嵌入最后。
如何从我的 base64 dataURL 图像中删除那些来自我不信任的用户的恶意代码。
base64 dataURL 图片(安全):

base64 dataURL 2 图片(PHP代码注入):

base64 dataURL 3 图片(Javascript代码注入):

您可以 "decoding online" 使用这些工具查看文本代码 - https://www.base64decode.org/
我允许用户上传图片到我的服务器,我"convert image"到base64 dataURL图片
从上面的所有3张base64 dataURL图片中,可以看到都是returns相同的图片,但是由于图片中嵌入了文本代码,它们的base64编码不同。
我在后端使用 Go 来保存图像。我正在使用以下 HTML 代码将图像转换为 dataURL base64 文本。
<input type='file' onchange="readURL(this);" />
<img id="blah" src="#" alt="your image" />
<script>
function readURL(input) {
if (input.files && input.files[0]) {
var reader = new FileReader();
reader.onload = function (e) {
document.getElementById("blah").src = e.target.result;
};
reader.readAsDataURL(input.files[0]);
}
}
</script>
我担心的是 "text" 不应该在图像内部,不应该在那里。
上面的 dataURL returns 相同的图像,但由于内部有额外数据,它们具有不同的 base64 代码。
我想从上面的2个恶意代码中获取实际的图片base64代码。
假设,用户 B 上传了我得到 "base64 dataURL 3" 图片的图片,但我想要来自用户上传图片的 base64 dataURL 原始图片。
如何做到这一点?
ImageMagick convert -strip <in> <out>
会做。它还会删除其他无关数据(EXIF、嵌入式缩略图等),因此请确保该行为符合您的要求。
$ xxd img.jpg | tail -n 3
00000280: 647f ffd9 3c73 6372 6970 743e 616c 6572 d...<script>aler
00000290: 7428 2768 656c 6c6f 2729 3b3c 2f73 6372 t('hello');</scr
000002a0: 6970 743e 0a ipt>.
$ convert -strip img.jpg img2.jpg
$ xxd img2.jpg | tail -n 3
00000260: 383a 2ebd 4c00 32c8 1ba4 0064 6d3f 229f 8:..L.2....dm?".
00000270: 9001 90a7 e4c8 a1d3 eff9 0019 1800 0647 ...............G
00000280: ffd9
无论如何,如果您不尝试执行图像,就不会发生任何事情。但如果不出意外,它会浪费在您的图像文件中 space。
要从 Go 执行此操作,请使用 Go ImageMagick bindings and call StripImage
是的,有一个世界 'Hacking with Pictures'(通常称为 Stegosploits)。这里的行业方法是使用 Content Disarm & Reconstruction (CDR) 软件。引自维基百科:
[CDR] is a computer security technology for removing potentially
malicious code from files. Unlike malware analysis, CDR technology
does not determine or detect malware's functionality but removes all
file components that are not approved within the system's definitions
and policies.
如果这对您来说是关键任务,您可能想研究一些可用的商业解决方案(文章还列出了其中的一些,我无法在这里给出推荐)。
对于自行开发的解决方案,重新编码图像可能就足够了。
- 您可能想试试 Go 的原生 image 库,另请参阅
- 有一个 ImageMagick
MagickWand API 具有上述条带功能的 Go 绑定。
我有以下 3 个 "dataURL image",如果您通过 "URL" 打开它们,它们都是 returns 相同的图像,但是下面的两个 dataURL 代码具有 "PHP code" 和 "JavaScript code" 嵌入最后。
如何从我的 base64 dataURL 图像中删除那些来自我不信任的用户的恶意代码。
base64 dataURL 图片(安全):

base64 dataURL 2 图片(PHP代码注入):

base64 dataURL 3 图片(Javascript代码注入):

您可以 "decoding online" 使用这些工具查看文本代码 - https://www.base64decode.org/
我允许用户上传图片到我的服务器,我"convert image"到base64 dataURL图片
从上面的所有3张base64 dataURL图片中,可以看到都是returns相同的图片,但是由于图片中嵌入了文本代码,它们的base64编码不同。
我在后端使用 Go 来保存图像。我正在使用以下 HTML 代码将图像转换为 dataURL base64 文本。
<input type='file' onchange="readURL(this);" />
<img id="blah" src="#" alt="your image" />
<script>
function readURL(input) {
if (input.files && input.files[0]) {
var reader = new FileReader();
reader.onload = function (e) {
document.getElementById("blah").src = e.target.result;
};
reader.readAsDataURL(input.files[0]);
}
}
</script>
我担心的是 "text" 不应该在图像内部,不应该在那里。
上面的 dataURL returns 相同的图像,但由于内部有额外数据,它们具有不同的 base64 代码。
我想从上面的2个恶意代码中获取实际的图片base64代码。
假设,用户 B 上传了我得到 "base64 dataURL 3" 图片的图片,但我想要来自用户上传图片的 base64 dataURL 原始图片。
如何做到这一点?
ImageMagick convert -strip <in> <out>
会做。它还会删除其他无关数据(EXIF、嵌入式缩略图等),因此请确保该行为符合您的要求。
$ xxd img.jpg | tail -n 3
00000280: 647f ffd9 3c73 6372 6970 743e 616c 6572 d...<script>aler
00000290: 7428 2768 656c 6c6f 2729 3b3c 2f73 6372 t('hello');</scr
000002a0: 6970 743e 0a ipt>.
$ convert -strip img.jpg img2.jpg
$ xxd img2.jpg | tail -n 3
00000260: 383a 2ebd 4c00 32c8 1ba4 0064 6d3f 229f 8:..L.2....dm?".
00000270: 9001 90a7 e4c8 a1d3 eff9 0019 1800 0647 ...............G
00000280: ffd9
无论如何,如果您不尝试执行图像,就不会发生任何事情。但如果不出意外,它会浪费在您的图像文件中 space。
要从 Go 执行此操作,请使用 Go ImageMagick bindings and call StripImage
是的,有一个世界 'Hacking with Pictures'(通常称为 Stegosploits)。这里的行业方法是使用 Content Disarm & Reconstruction (CDR) 软件。引自维基百科:
[CDR] is a computer security technology for removing potentially malicious code from files. Unlike malware analysis, CDR technology does not determine or detect malware's functionality but removes all file components that are not approved within the system's definitions and policies.
如果这对您来说是关键任务,您可能想研究一些可用的商业解决方案(文章还列出了其中的一些,我无法在这里给出推荐)。
对于自行开发的解决方案,重新编码图像可能就足够了。
- 您可能想试试 Go 的原生 image 库,另请参阅
- 有一个 ImageMagick MagickWand API 具有上述条带功能的 Go 绑定。