如何从 MIME 内容创建图像?
How to create a image from MIME content?
我正在尝试使用 C#
在 .NET Core 2.2 框架之上编写一个小型控制台应用程序。
控制台应用程序将向外部 API 发出 HTTP 请求以获取多张图片。我能够向服务器发出请求并获得响应。但是,服务器使用 MIMI 消息以多部分响应进行响应。
我能够解析请求并获取每条消息的 MIME 正文。但是,我不知道如何根据正文内容创建文件。
这是原始 MIMI 消息如何以开头的示例
我尝试将正文作为字符串写入文件,但没有成功
string body = GetMimeBody(message);
File.WriteAllText("image_from_string" + MimeTypeMap.GetExtension(contentType), bytes);
我也试过像这样将字符串转换为 byte[]
但还是不行
byte[] bytes = Encoding.ASCII.GetBytes(body);
File.WriteAllBytes("image_from_ascii_bytes" + MimeTypeMap.GetExtension(contentType), bytes);
byte[] bytes = Encoding.Default.GetBytes(body);
File.WriteAllBytes("image_from_default_bytes" + MimeTypeMap.GetExtension(contentType), bytes);
byte[] bytes = Encoding.UTF8.GetBytes(body);
File.WriteAllBytes("image_from_utf8_bytes" + MimeTypeMap.GetExtension(contentType), bytes);
"not working" 我的意思是图像无法正确打开。照片查看器显示 "the image appears to be damaged or corrupted."
如何正确地从消息中制作出好的图像?
已更新
这是代码和解析部分
var responseContentType = response.Content.Headers.GetValues("Content-Type").FirstOrDefault();
string splitter = string.Format("--{0}", GetBoundary(responseContentType));
string content = await response.Content.ReadAsStringAsync();
var messages = content.Split(splitter, StringSplitOptions.RemoveEmptyEntries);
foreach (var message in messages)
{
var mimiParts = message.Split(Environment.NewLine, StringSplitOptions.RemoveEmptyEntries);
if (mimiParts.Length == 0)
{
continue;
}
string contentId = Str.GetValue("Content-ID", mimiParts, ':');
string objectId = Str.GetValue("Object-ID", mimiParts, ':');
string contentType = Str.GetValue("Content-Type", mimiParts, ':');
if (string.IsNullOrWhiteSpace(contentId) || string.IsNullOrWhiteSpace(objectId) || string.IsNullOrWhiteSpace(contentType))
{
continue;
}
string body = mimiParts[mimiParts.Length - 1];
var filename = string.Format("{0}_{1}{2}", contentId, objectId, MimeTypeMap.GetExtension(contentType));
var decoded = System.Net.WebUtility.HtmlDecode(data);
File.WriteAllText("image_from_html_decoded_bytes" + filename, decoded);
}
这里是解析消息的方法
public class Str
{
public static string GetValue(string startWith, string[] lines, char splitter = '=')
{
foreach (var line in lines)
{
var value = line.Trim();
if (!value.StartsWith(startWith, StringComparison.CurrentCultureIgnoreCase) || !line.Contains(splitter))
{
continue;
}
return value.Split(splitter)[1].Trim();
}
return string.Empty;
}
}
这是显示 mimiParts
变量内容的屏幕截图
已更新 2
根据下面的反馈,我尝试使用 MimeKit 包而不是尝试自己解析响应。以下是我尝试使用响应的方式。但是,我仍然遇到与上述相同的错误。写入图像文件时,出现图像损坏错误。
var responseContentType = response.Content.Headers.GetValues("Content-Type").FirstOrDefault();
if (!ContentType.TryParse(responseContentType, out ContentType documentContentType))
{
return;
}
var stream = await response.Content.ReadAsStreamAsync();
MimeEntity entity = MimeEntity.Load(documentContentType, stream);
Multipart messages = entity as Multipart;
if (messages == null)
{
throw new Exception("Unable to cast entity to Multipart");
}
foreach (MimeEntity message in messages)
{
string contentId = message.Headers["Content-ID"];
string objectId = message.Headers["Object-ID"];
string contentType = message.Headers["Content-Type"];
if (string.IsNullOrWhiteSpace(contentId) || string.IsNullOrWhiteSpace(objectId) || string.IsNullOrWhiteSpace(contentType))
{
continue;
}
var filename = string.Format("{0}_{1}{2}", contentId, objectId, MimeTypeMap.GetExtension(contentType));
message.WriteTo(filename);
}
MIME 编码很难,将服务器发送的字节视为字符串已经是一个错误。在换行处拆分它会产生更多问题。二进制意味着 0x00 和 0xff 之间的每个值都是有效的。但是 Unicode 和 ASCII 有不同的有效字节范围,尤其是转换它们是有问题的。 .NET 内部字符串 class 将每个字符解释为两个字节。 HttpContent.ReadAsStringAsync 运行时,它会尝试将从服务器接收到的每个单个字节解释为一个两字节的 Unicode 字符。我很确定您将无法从数据丢失中恢复。
- 使用像 HxD 这样的十六进制编辑器将图像的良好副本与您从应用程序中写出的图像进行比较,并寻找差异。至少如果您想坚持使用自己的代码。但我相信您仍然需要从字符串操作切换到流操作。
- 使用已经制作好的 MIME 解析库。一个例子是 MimeKit。这将大大减少您的开发时间。
仅供参考,JPG 的前 10 个字节应如下所示:
FF D8 FF E0 00 10 4A 46 49 46 ÿØÿà..JFIF
不幸的是,MimeEntity.WriteTo (file)
将包含导致损坏错误的 MIME headers。
您需要做的是将 MimeEntity 转换为 MimePart,然后使用 MimePart.Content.DecodeTo (stream)
:
保存 解码的 内容
var responseContentType = response.Content.Headers.GetValues("Content-Type").FirstOrDefault();
if (!ContentType.TryParse(responseContentType, out ContentType documentContentType))
{
return;
}
var stream = await response.Content.ReadAsStreamAsync();
MimeEntity entity = MimeEntity.Load(documentContentType, stream);
Multipart multipart = entity as Multipart;
if (multipart == null)
{
throw new Exception("Unable to cast entity to Multipart");
}
foreach (MimePart part in multipart.OfType<MimePart> ())
{
string contentType = part.ContentType.MimeType;
string contentId = part.ContentId;
string objectId = part.Headers["Object-ID"];
if (string.IsNullOrWhiteSpace(contentId) || string.IsNullOrWhiteSpace(objectId) || string.IsNullOrWhiteSpace(contentType))
{
continue;
}
var filename = string.Format("{0}_{1}{2}", contentId, objectId, MimeTypeMap.GetExtension(contentType));
using (var output = File.Create (filename))
part.Content.DecodeTo (output);
}
我正在尝试使用 C#
在 .NET Core 2.2 框架之上编写一个小型控制台应用程序。
控制台应用程序将向外部 API 发出 HTTP 请求以获取多张图片。我能够向服务器发出请求并获得响应。但是,服务器使用 MIMI 消息以多部分响应进行响应。
我能够解析请求并获取每条消息的 MIME 正文。但是,我不知道如何根据正文内容创建文件。
这是原始 MIMI 消息如何以开头的示例
我尝试将正文作为字符串写入文件,但没有成功
string body = GetMimeBody(message);
File.WriteAllText("image_from_string" + MimeTypeMap.GetExtension(contentType), bytes);
我也试过像这样将字符串转换为 byte[]
但还是不行
byte[] bytes = Encoding.ASCII.GetBytes(body);
File.WriteAllBytes("image_from_ascii_bytes" + MimeTypeMap.GetExtension(contentType), bytes);
byte[] bytes = Encoding.Default.GetBytes(body);
File.WriteAllBytes("image_from_default_bytes" + MimeTypeMap.GetExtension(contentType), bytes);
byte[] bytes = Encoding.UTF8.GetBytes(body);
File.WriteAllBytes("image_from_utf8_bytes" + MimeTypeMap.GetExtension(contentType), bytes);
"not working" 我的意思是图像无法正确打开。照片查看器显示 "the image appears to be damaged or corrupted."
如何正确地从消息中制作出好的图像?
已更新
这是代码和解析部分
var responseContentType = response.Content.Headers.GetValues("Content-Type").FirstOrDefault();
string splitter = string.Format("--{0}", GetBoundary(responseContentType));
string content = await response.Content.ReadAsStringAsync();
var messages = content.Split(splitter, StringSplitOptions.RemoveEmptyEntries);
foreach (var message in messages)
{
var mimiParts = message.Split(Environment.NewLine, StringSplitOptions.RemoveEmptyEntries);
if (mimiParts.Length == 0)
{
continue;
}
string contentId = Str.GetValue("Content-ID", mimiParts, ':');
string objectId = Str.GetValue("Object-ID", mimiParts, ':');
string contentType = Str.GetValue("Content-Type", mimiParts, ':');
if (string.IsNullOrWhiteSpace(contentId) || string.IsNullOrWhiteSpace(objectId) || string.IsNullOrWhiteSpace(contentType))
{
continue;
}
string body = mimiParts[mimiParts.Length - 1];
var filename = string.Format("{0}_{1}{2}", contentId, objectId, MimeTypeMap.GetExtension(contentType));
var decoded = System.Net.WebUtility.HtmlDecode(data);
File.WriteAllText("image_from_html_decoded_bytes" + filename, decoded);
}
这里是解析消息的方法
public class Str
{
public static string GetValue(string startWith, string[] lines, char splitter = '=')
{
foreach (var line in lines)
{
var value = line.Trim();
if (!value.StartsWith(startWith, StringComparison.CurrentCultureIgnoreCase) || !line.Contains(splitter))
{
continue;
}
return value.Split(splitter)[1].Trim();
}
return string.Empty;
}
}
这是显示 mimiParts
变量内容的屏幕截图
已更新 2
根据下面的反馈,我尝试使用 MimeKit 包而不是尝试自己解析响应。以下是我尝试使用响应的方式。但是,我仍然遇到与上述相同的错误。写入图像文件时,出现图像损坏错误。
var responseContentType = response.Content.Headers.GetValues("Content-Type").FirstOrDefault();
if (!ContentType.TryParse(responseContentType, out ContentType documentContentType))
{
return;
}
var stream = await response.Content.ReadAsStreamAsync();
MimeEntity entity = MimeEntity.Load(documentContentType, stream);
Multipart messages = entity as Multipart;
if (messages == null)
{
throw new Exception("Unable to cast entity to Multipart");
}
foreach (MimeEntity message in messages)
{
string contentId = message.Headers["Content-ID"];
string objectId = message.Headers["Object-ID"];
string contentType = message.Headers["Content-Type"];
if (string.IsNullOrWhiteSpace(contentId) || string.IsNullOrWhiteSpace(objectId) || string.IsNullOrWhiteSpace(contentType))
{
continue;
}
var filename = string.Format("{0}_{1}{2}", contentId, objectId, MimeTypeMap.GetExtension(contentType));
message.WriteTo(filename);
}
MIME 编码很难,将服务器发送的字节视为字符串已经是一个错误。在换行处拆分它会产生更多问题。二进制意味着 0x00 和 0xff 之间的每个值都是有效的。但是 Unicode 和 ASCII 有不同的有效字节范围,尤其是转换它们是有问题的。 .NET 内部字符串 class 将每个字符解释为两个字节。 HttpContent.ReadAsStringAsync 运行时,它会尝试将从服务器接收到的每个单个字节解释为一个两字节的 Unicode 字符。我很确定您将无法从数据丢失中恢复。
- 使用像 HxD 这样的十六进制编辑器将图像的良好副本与您从应用程序中写出的图像进行比较,并寻找差异。至少如果您想坚持使用自己的代码。但我相信您仍然需要从字符串操作切换到流操作。
- 使用已经制作好的 MIME 解析库。一个例子是 MimeKit。这将大大减少您的开发时间。
仅供参考,JPG 的前 10 个字节应如下所示:
FF D8 FF E0 00 10 4A 46 49 46 ÿØÿà..JFIF
MimeEntity.WriteTo (file)
将包含导致损坏错误的 MIME headers。
您需要做的是将 MimeEntity 转换为 MimePart,然后使用 MimePart.Content.DecodeTo (stream)
:
var responseContentType = response.Content.Headers.GetValues("Content-Type").FirstOrDefault();
if (!ContentType.TryParse(responseContentType, out ContentType documentContentType))
{
return;
}
var stream = await response.Content.ReadAsStreamAsync();
MimeEntity entity = MimeEntity.Load(documentContentType, stream);
Multipart multipart = entity as Multipart;
if (multipart == null)
{
throw new Exception("Unable to cast entity to Multipart");
}
foreach (MimePart part in multipart.OfType<MimePart> ())
{
string contentType = part.ContentType.MimeType;
string contentId = part.ContentId;
string objectId = part.Headers["Object-ID"];
if (string.IsNullOrWhiteSpace(contentId) || string.IsNullOrWhiteSpace(objectId) || string.IsNullOrWhiteSpace(contentType))
{
continue;
}
var filename = string.Format("{0}_{1}{2}", contentId, objectId, MimeTypeMap.GetExtension(contentType));
using (var output = File.Create (filename))
part.Content.DecodeTo (output);
}