使用 MSI 从 Azure 函数将文件写入 Azure Data Lake 时出错

Error writing a file to Azure Data Lake from an Azure function using MSI

我正在尝试创建一个写入 Azure Data Lake Store 的 Azure 函数。 我正在使用托管服务标识来管理身份验证内容。

我在功能应用上启用了 MSI。我还启用了 Function 应用程序以访问所需的 Data Lake Store。 我正在使用以下代码获取令牌并写入 ADL。 我错过了什么吗?

var azureServiceTokenProvider = new AzureServiceTokenProvider();
string accessToken = await azureServiceTokenProvider.GetAccessTokenAsync("https://datalake.azure.net");
var client = AdlsClient.CreateClient(_adlsAccountName, accessToken);
using (var stream = client.CreateFile(fileName, IfExists.Overwrite))
    {
        byte[] textByteArray = Encoding.UTF8.GetBytes("Winter is coming! \r\n");
        stream.Write(textByteArray, 0, textByteArray.Length);
    }

我的代码因以下错误而失败。

with exception Microsoft.Azure.DataLake.Store.AdlsException: Error in creating file /Path/tempFile0.txt.

**Operation: CREATE failed with HttpStatus:Unauthorized Error: Uexpected error in JSON parsing.**

Last encountered exception thrown after 1 tries. [Uexpected error in JSON parsing]

[ServerRequestId:<Some ID>]

at Microsoft.Azure.DataLake.Store.AdlsClient.CreateFile(String filename, IfExists mode, String octalPermission, Boolean createParent)

我主要使用以下代码片段从 Azure Functions 验证和写入数据湖:

var clientCredential = new ClientCredential(clientId, clientSecret);
var creds = ApplicationTokenProvider.LoginSilentAsync("domainId", clientCredential).Result;
_client = new DataLakeStoreFileSystemManagementClient(creds);

其中 clientIdclientSecret 是:

  • 来自 AD
  • ObjectId
  • 附带一个秘密

所以基本上您必须创建一个服务主体并从门户获取这些特定属性。

然后我可以使用以下内容:

public async Task AppendToFile(string destinationPath, string content)
{
    using (var stream = new MemoryStream(Encoding.UTF8.GetBytes(content)))
    {
        await _client.FileSystem.ConcurrentAppendAsync("datalakeaccount", destinationPath, stream, appendMode: AppendModeType.Autocreate);
    }
}

将数据写入 ADLS。

您也可以参考this博客post。

将 "Bearer " 添加到访问令牌对我有用。像这样(其他一切保持不变),

var client = AdlsClient.CreateClient(_adlsAccountName, “Bearer “ + accessToken);

部分感谢 Arturo Lucatero 的 Github 文档提到了这一点。 https://github.com/MicrosoftDocs/azure-docs/blob/master/articles/active-directory/managed-service-identity/tutorial-linux-vm-access-datalake.md