Python/Pandas - 比较来自 excel 的单行数据
Python/Pandas - comparing data in single rows from excel
我曾尝试编写程序来比较 excel 中的两个单行数据,如果行中不止一个世界,我将其拆分并将单个单词放入数组中。
它有点用:)但是有些行仍然保持空白而没有插入“好”或“坏”我不知道为什么。如果来自数组的 4 个变量中的 3 个是相同的,我也希望有可能插入“好”。
下面你可以找到我的代码,谢谢你的支持。
import pandas as pd
import numpy as np
df = (pd.read_excel("numtest.xlsx", "Arkusz1"))
for i in range (0, 9005):
try:
a = df.iloc[i, 1]
b = df.iloc[i, 2]
x = a.split()
y = b.split()
data_1 = {'TYPE': x}
data_2 = {'TYPE': y}
if np.array_equal(data_1, data_2):
df.iloc[i, 3] = 'well'
except:
df.iloc[i, 3] = 'bad'
df.to_excel("numtest2.xlsx", sheet_name="Sheet3")
如果存在异常,则您仅将第三列更新为错误,如果存在不匹配,您需要稍微更改代码,如下所示:
import pandas as pd
import numpy as np
df = (pd.read_excel("numtest.xlsx", "Arkusz1"))
for i in range (0, 9005):
try:
a = df.iloc[i, 1]
b = df.iloc[i, 2]
x = a.split()
y = b.split()
data_1 = {'TYPE': x}
data_2 = {'TYPE': y}
if np.array_equal(data_1, data_2):
df.iloc[i, 3] = 'well'
else:
df.iloc[i, 3] = 'bad'
except:
df.iloc[i, 3] = 'very-bad' # something went wrong in parsing the data
df.to_excel("numtest2.xlsx", sheet_name="Sheet3")
我曾尝试编写程序来比较 excel 中的两个单行数据,如果行中不止一个世界,我将其拆分并将单个单词放入数组中。
它有点用:)但是有些行仍然保持空白而没有插入“好”或“坏”我不知道为什么。如果来自数组的 4 个变量中的 3 个是相同的,我也希望有可能插入“好”。
下面你可以找到我的代码,谢谢你的支持。
import pandas as pd
import numpy as np
df = (pd.read_excel("numtest.xlsx", "Arkusz1"))
for i in range (0, 9005):
try:
a = df.iloc[i, 1]
b = df.iloc[i, 2]
x = a.split()
y = b.split()
data_1 = {'TYPE': x}
data_2 = {'TYPE': y}
if np.array_equal(data_1, data_2):
df.iloc[i, 3] = 'well'
except:
df.iloc[i, 3] = 'bad'
df.to_excel("numtest2.xlsx", sheet_name="Sheet3")
如果存在异常,则您仅将第三列更新为错误,如果存在不匹配,您需要稍微更改代码,如下所示:
import pandas as pd
import numpy as np
df = (pd.read_excel("numtest.xlsx", "Arkusz1"))
for i in range (0, 9005):
try:
a = df.iloc[i, 1]
b = df.iloc[i, 2]
x = a.split()
y = b.split()
data_1 = {'TYPE': x}
data_2 = {'TYPE': y}
if np.array_equal(data_1, data_2):
df.iloc[i, 3] = 'well'
else:
df.iloc[i, 3] = 'bad'
except:
df.iloc[i, 3] = 'very-bad' # something went wrong in parsing the data
df.to_excel("numtest2.xlsx", sheet_name="Sheet3")