从 S3 Python AWS Lambda 读取 XML
Reading XML from S3 Python AWS Lambda
我正在尝试读取 s3 存储桶中的文件并在 python AWS Lambda 函数中使用 xml minidom 提取元素。我不断收到错误消息 - "errorMessage":"Unable to marshal response: Object of type Element is not JSON serializable"。
import json
from xml.dom import minidom
import boto3
s3 = boto3.resource('s3')
def lambda_handler(event, context):
bucketname = 'mybucket'
filename = 'myfile.xml'
obj = s3.Object(bucketname, filename)
file_data = obj.get()['Body'].read()
#parse xml
xmldoc = minidom.parseString(file_data)
message_1 = xmldoc.getElementsByTagName('id')
#return
return {
"bucketname": bucketname,
"file_data": file_data,
"id": message_1
}
getElementsByTagName
returns 包含 Elements
的 NodeList
又不是 JSON 可序列化的。如果您希望 xml 中只有 1 个 id
元素,您可以
return {
"bucketname": bucketname,
"file_data": file_data,
"id": message_1.item(0).firstChild.data
}
我正在尝试读取 s3 存储桶中的文件并在 python AWS Lambda 函数中使用 xml minidom 提取元素。我不断收到错误消息 - "errorMessage":"Unable to marshal response: Object of type Element is not JSON serializable"。
import json
from xml.dom import minidom
import boto3
s3 = boto3.resource('s3')
def lambda_handler(event, context):
bucketname = 'mybucket'
filename = 'myfile.xml'
obj = s3.Object(bucketname, filename)
file_data = obj.get()['Body'].read()
#parse xml
xmldoc = minidom.parseString(file_data)
message_1 = xmldoc.getElementsByTagName('id')
#return
return {
"bucketname": bucketname,
"file_data": file_data,
"id": message_1
}
getElementsByTagName
returns 包含 Elements
的 NodeList
又不是 JSON 可序列化的。如果您希望 xml 中只有 1 个 id
元素,您可以
return {
"bucketname": bucketname,
"file_data": file_data,
"id": message_1.item(0).firstChild.data
}