如何使用 MailKit 获取非文本、非附件内容?

How to get nontext, non-attachment content with MailKit?

我们有一个系统,我们通过发送到 OutLook365 地址的电子邮件接收数据,我们有一个 POP3/IMAP 客户端读取这些电子邮件并处理内容。

我们在 .NET 中工作,我们使用 MailKit 来检索电子邮件。

我们正在做的事情的症结所在:

MailKit.Net.Pop3.Pop3Client client = constructClient();

for (var i = 0; i < client?.Count ?? 0; i++)
{
    MimeMessage message = client.GetMessage(i);

    var attachments = new List<OurAttachmentObject>();

    foreach (MimeEntity mimeEntity in message.Attachments)
    {
        attachments.Add(constructOurAttachmentObj(mimeEntity);
    }

    var messageMessageId = message.MessageId;
    var messageHtmlBody = message.HtmlBody;
    var messageTextBody = message.TextBody;

    doSomething(messageMessageId, messageHtmlBody, messageTextBody, attachments);
}

事情是这样的——我们有一位客户的电子邮件最终是空的:

我们的代码将处理附件。或 TextBody 或 HtmlBody。但我们希望其中至少有一个存在。

奇怪的是,这仅在 他们 向我们发送电子邮件时发生。当我们在 Outlook 中复制电子邮件以便再次发送时,它起作用了。当我们发送一封内容相同的电子邮件时,它就起作用了。只有当他们发送电子邮件时,我们才会遇到这个问题。

他们发送的内容:

Received: from [...]
From:  [...]
To:  [...]
Date:  [...]
Subject:  [...]
Message-ID:  [...]
X-Mailer: [...]
Content-Type: Text/XML; name=theirfilename.xml; charset=ISO-8859-1
Content-Transfer-Encoding: 8bit
[...]
MIME-Version: 1.0

<?xml version="1.0"?>
<TheirXmlElement>
  [...]
</TheirXmlElement>

.

是的,邮件正文是XML。

当我们在 Outlook365 中查看时,XML 显示为附件,当我们在 Outlook 中复制电子邮件时,它作为附件出现:

Received: [...]
From: [...]
To: [...]
Subject: [...]
Thread-Topic: [...]
Thread-Index: [...]
[...]
Content-Type: multipart/mixed;
  boundary="_002_20201109124249401C297454xxxxx_"
MIME-Version: 1.0

--_002_20201109124249401C297454xxxxx_--
Content-Type: text/plain; charset="us-ascii"


--_002_20201109124249401C297454xxxxx_--
Content-Type: text/xml; name="theirfilename.xml"
Content-Description: theirfilename.xml
Content-Disposition: attachment;
  filename="theirfilename.xml"; size=11788;
  creation-date="Mon, 09 Nov 2020 19:42:56 GMT";
  modification-date="Mon, 09 Nov 2020 19:42:56 GMT"
Content-ID: <F4B1CA23B7E98F49BCD9AC9B82024AF1@namprd17.prod.outlook.com>
Content-Transfer-Encoding: base64

PD94bWwgdmVyc2lvbj0iMS4wIj8+DQo8TmV3RGF0YVNldD4NCiAgPGRlbGl2ZXJ5Pg0KICAgIDxj
[...]
M24NCiAgICA8L3ByaW50YWJsZV90ZXh0Pg0KICA8L3RpY2tldHM+DQo8L05ld0RhdGFTZXQ+DQoN
Cg==

--_002_20201109124249401C297454xxxxx_--
.

而且我们的代码可以很好地处理附件。

当我们通过将XML内容粘贴到普通电子邮件中进行测试时,收到的是:

Received: [...]
From: [...]
To: [...]
Subject: [...]
Thread-Topic: [...]
Thread-Index: [...]
[...]
Content-Type: text/plain; charset="us-ascii"
MIME-Version: 1.0

<?xml version="1.0"?>
<TheirXmlElement>
  [...]
</TheirXmlElement>

.

这显示在 MimeMessage.TextBody 中,我们的代码也可以很好地处理它。

问题似乎是因为 Content-Type 是 Text/XML,正文没有被放入 MimeMessage.TextBody,但它也没有被视为附件。如果您复制消息,OutLook 会完全做到这一点。

我在调试时发现,当我们收到他们的一张票时,MimeMessage.TextBody 为空,MimeMessage.HtmlBody 为空,MimeMessage.Attachments 为空,我可以通过以下方式检索电子邮件正文:

messageTextBody = message.Body.ToString();

但这让我很担心。 MimeMessage.Body 是一个 MimeEntity,我不希望 .ToString() 一直在处理它。

当电子邮件不是文本、html 或附件时,MimeKit 如何 期望客户端提取电子邮件正文?

TextBodyHtmlBodyAttachments 属性只是为了方便通用消息结构。

您需要做的是遍历 MIME 邮件正文的树结构。

这在常见问题解答中都有解释:https://github.com/jstedfast/MailKit/blob/master/FAQ.md#q-how-can-i-get-the-main-body-of-a-message

在你的具体情况下,你可能会退回到这个:

var body = message.BodyParts.OfType<TextPart>().FirstOrDefault();
var text = body.Text;

P.S。你绝对应该 而不是 使用 message.Body.ToString().