使用 python(或其他)从大型 csv 文件创建 Excel 数据 sheet
Creating an Excel data sheet from big csv file using python (or other)
在我的工作中,我们正在处理大量的房地产数据,这些数据压缩在一个大约 200000 行(不断增长)的 csv 文件中。
此 csv sheet 包含以下信息的列:定价、表面积、建成年份、街道、街道编号、post 代码等。
我们正在做的部分工作包括创建一个 Excel sheet 的属性,这些属性与在一组特定限制内的 given 对象相当(例如表面积 +/- 20%)。
我想自动生成这样一个 Excel 列表,我正在考虑为此使用 Python。这是我希望程序执行的操作:
1) 读入csv文件
2) 为 Excel sheet
获取要比较的所有必要参数
3) 从具有适合这些属性的 csv 数据创建 excel sheet
参数
4) 重写抽象参数描述(例如,如果 'dishwasher' 列的值为'0',则写入 'No dishwasher available')并将 house_number 列中的值附加到 street_name列值
python 是处理此问题的好方法还是您有其他建议?
Python 是一种很好的语言来进行这样的数据解析。使用 pandas library might be helpful. It has functions for importing CSVs and functions to operate on the resulting data. Pandas can also directly export into the excel format.
在我的工作中,我们正在处理大量的房地产数据,这些数据压缩在一个大约 200000 行(不断增长)的 csv 文件中。
此 csv sheet 包含以下信息的列:定价、表面积、建成年份、街道、街道编号、post 代码等。
我们正在做的部分工作包括创建一个 Excel sheet 的属性,这些属性与在一组特定限制内的 given 对象相当(例如表面积 +/- 20%)。
我想自动生成这样一个 Excel 列表,我正在考虑为此使用 Python。这是我希望程序执行的操作:
1) 读入csv文件
2) 为 Excel sheet
获取要比较的所有必要参数3) 从具有适合这些属性的 csv 数据创建 excel sheet 参数
4) 重写抽象参数描述(例如,如果 'dishwasher' 列的值为'0',则写入 'No dishwasher available')并将 house_number 列中的值附加到 street_name列值
python 是处理此问题的好方法还是您有其他建议?
Python 是一种很好的语言来进行这样的数据解析。使用 pandas library might be helpful. It has functions for importing CSVs and functions to operate on the resulting data. Pandas can also directly export into the excel format.