如何将HTML tbody数据解析成表格格式的Python

How to parse HTML tbody data into Python in tabular format

我是 python 的新手,我正在尝试将此数据解析为 Python 中的表格格式。我已经考虑过示例但无法获得所需的结果。

有人可以帮我解决这个问题

<tbody>
<tr><td>Kupon in %</td><td>36,520</td></tr>
<tr><td>Erstes Kupondatum</td><td>03.07.2017</td></tr>
<tr><td>Letztes Kupondatum</td><td>03.04.2022</td></tr>
<tr><td>Zahlweise Kupon</td><td>Zinszahlung normal</td></tr>
<tr><td>Spezialkupon Typ</td><td>Zinssatz variabel</td></tr>

需要这样的数据:

Kupon % 36,520 Erstes Kupondatum 03.07.2017 Letztes Kupondatum 03.04.2022

您可以通过两种方式做到这一点 1. 使用列表理解和 2. 使用 for 循环 两者都产生相同的结果,您可以选择。

from bs4 import BeautifulSoup

html = """<tbody>
<tr><td>Kupon in %</td><td>36,520</td></tr>
<tr><td>Erstes Kupondatum</td><td>03.07.2017</td></tr>
<tr><td>Letztes Kupondatum</td><td>03.04.2022</td></tr>
<tr><td>Zahlweise Kupon</td><td>Zinszahlung normal</td></tr>
<tr><td>Spezialkupon Typ</td><td>Zinssatz variabel</td></tr>"""

#1
soup = BeautifulSoup(html,'lxml')
print(' '.join([td.text for td in soup.find_all('td')]))

# 2 
tags = []
tr = soup.find_all('td')
for td in tr:
  tags.append(td.text)

print(' '.join(tags))

Output: Kupon in % 36,520 Erstes Kupondatum 03.07.2017 Letztes Kupondatum 03.04.2022 Zahlweise Kupon Zinszahlung normal Spezialkupon Typ Zinssatz variabel