Python/Pandas - 比较来自 excel 的单行数据

Python/Pandas - comparing data in single rows from excel

我曾尝试编写程序来比较 excel 中的两个单行数据,如果行中不止一个世界,我将其拆分并将单个单词放入数组中。

它有点用:)但是有些行仍然保持空白而没有插入“好”或“坏”我不知道为什么。如果来自数组的 4 个变量中的 3 个是相同的,我也希望有可能插入“好”。

下面你可以找到我的代码,谢谢你的支持。

import pandas as pd
import numpy as np

df = (pd.read_excel("numtest.xlsx", "Arkusz1"))


for i in range (0, 9005):
    try:
        a = df.iloc[i, 1]
        b = df.iloc[i, 2]
        x = a.split()
        y = b.split()

        data_1 = {'TYPE': x}
        data_2 = {'TYPE': y} 

        if np.array_equal(data_1, data_2):
            df.iloc[i, 3] = 'well'
    except:
        df.iloc[i, 3] = 'bad'
df.to_excel("numtest2.xlsx", sheet_name="Sheet3")

如果存在异常,则您仅将第三列更新为错误,如果存在不匹配,您需要稍微更改代码,如下所示:

import pandas as pd
import numpy as np

df = (pd.read_excel("numtest.xlsx", "Arkusz1"))


for i in range (0, 9005):
    try:
        a = df.iloc[i, 1]
        b = df.iloc[i, 2]
        x = a.split()
        y = b.split()

        data_1 = {'TYPE': x}
        data_2 = {'TYPE': y} 

        if np.array_equal(data_1, data_2):
            df.iloc[i, 3] = 'well'
        else:
            df.iloc[i, 3] = 'bad'
    except:
        df.iloc[i, 3] = 'very-bad'   # something went wrong in parsing the data

df.to_excel("numtest2.xlsx", sheet_name="Sheet3")