python 中动态生成的 XLSXWriter 图表 - 未引用
Dynamically produced XLSXWriter charts in python - not referencing
我正在使用我编写的以下 class 来尝试动态创建一个包含多个工作表的 Excel 文件,其中每个工作表中都有一个打印的数据框和一个柱形图。
与代码的交互(见下文)应该在您启动工作簿的地方起作用:
test = Workbook('Test Workbook')
然后,您可以添加任意数量的图表:
test.add_chart(df, 'Df Title', 1)
test.add_chart(df2, 'Df2 Title', 1)
然后你制作练习册:
test.produce()
输入数据帧有 headers。第一列是文本类别,后续列(不同数量)是小数形式的数据,将以百分比形式绘制。
问题:代码运行良好,似乎可以单独生成所有带有图表的工作表,但有些图表显示为 "not referenced",这意味着当我单击列中的栏时图表,它不会突出显示源数据。部分用代码生成的图表,适当引用,所以我不确定问题出在哪里,也没有明显的趋势。
import xlsxwriter
import pandas as pd
class Workbook:
def __init__(self, workbook_name):
self.workbook_name = workbook_name
self.workbook = xlsxwriter.Workbook(str(self.workbook_name) + '.xlsx')
self.letters = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P']
def produce(self):
self.workbook.close()
print 'Created ' + str(self.workbook_name) + '.xlsx'
def print_frame(self, worksheet, dataframe, df_width, start_data_index):
col_as_lists = []
col_names = list(dataframe.columns.values)
# loops through columns in df and converts to list
for n in range(0, df_width):
col_n = dataframe[col_names[n]].tolist()
# checks to see if column has numbers, if so -> convert to float!
if n < start_data_index:
col_n.insert(0, col_names[n])
elif self.is_number(col_n[0]):
convert = col_n[0:]
convert = [float(x) for x in convert]
convert.insert(0, col_names[n])
col_n = convert
else:
col_n.insert(0, col_names[n])
col_as_lists.append(col_n)
# Prints each list into the worksheet.
worksheet.write_column(self.letters[n] + '1', col_as_lists[n])
#Formats numerical data as percentage
percentformat = self.workbook.add_format({'num_format': '0%'})
worksheet.set_column(self.letters[start_data_index] + ':' + self.letters[df_width], None, percentformat)
def add_chart(self, dataframe, tab_name, start_data_index):
df_width = len(dataframe.columns)
worksheet = self.workbook.add_worksheet(tab_name)
self.print_frame(worksheet, dataframe, df_width, start_data_index)
chart = self.workbook.add_chart({'type': 'column'})
df_length = (len(dataframe.index))
for n in range(start_data_index, df_width):
chart.add_series({
'name': '=' + tab_name +'!$' + self.letters[n] + '',
'categories': '=' + tab_name +'!$' + self.letters[start_data_index - 1] + ':$'+ self.letters[start_data_index - 1] + '$' + str(df_length + 1),
'values': '=' + tab_name +'!$' + self.letters[n] + ':$'+ self.letters[n] + '$' + str(df_length + 1),
'fill': {'color': '#FFB11E'},
'data_labels': {'value': True, 'center': True}
})
chart.set_title({'name': tab_name})
chart.set_x_axis({'major_gridlines': {'visible': False}})
chart.set_y_axis({'major_gridlines': {'visible': False}, 'max': .70})
worksheet.insert_chart(self.letters[df_width + 2] + '2', chart)
return
def is_number(self, s):
""" Function used to help with detecting and converting floats
from string to number data types."""
try:
float(s)
return True
except ValueError:
return False
您的示例调用:
test.add_chart(df, 'Df Title', 1)
test.add_chart(df2, 'Df2 Title', 1)
建议您有时名称中有空格。当您尝试
之类的操作时,这会导致引用中断
'name': '=' + tab_name +'!$' + self.letters[n] + '',
计算结果为
'name': '=Df Title!$A',
(当tab_name
等于'Df Title'
且n
等于0
时),例如
您应该仍然可以使用带空格的 sheet 引用,但用单引号括起来,例如
'name': "='Df Title'!$A",
所以更稳健的编码方式是
'name': "='" + tab_name +"'!$" + self.letters[n] + '',
我有点惊讶这些图表完全可以使用损坏的 sheet 引用,但我自己并没有实际测试过图表,只是涉及 sheet 名称的普通单元格公式.
@John Y 是正确的,您没有在图表范围引用中正确引用工作表名称。
您可以通过使用图表列表语法而不是字符串语法来避免此问题以及从数字到单元格引用的手动转换:
chart.add_series({
'name': ['Sheet1', 0, col],
'categories': ['Sheet1', 1, 0, max_row, 0],
'values': ['Sheet1', 1, col, max_row, col],
})
该片段来自 this example in the XlsxWriter docs。
这也适用于您代码中的其他几个地方。作为 XlsxWriter 中的一般规则,您可以(几乎)在任何需要使用 A1
语法的地方使用 row-column
语法:Working with Cell Notation.
我正在使用我编写的以下 class 来尝试动态创建一个包含多个工作表的 Excel 文件,其中每个工作表中都有一个打印的数据框和一个柱形图。
与代码的交互(见下文)应该在您启动工作簿的地方起作用:
test = Workbook('Test Workbook')
然后,您可以添加任意数量的图表:
test.add_chart(df, 'Df Title', 1)
test.add_chart(df2, 'Df2 Title', 1)
然后你制作练习册:
test.produce()
输入数据帧有 headers。第一列是文本类别,后续列(不同数量)是小数形式的数据,将以百分比形式绘制。
问题:代码运行良好,似乎可以单独生成所有带有图表的工作表,但有些图表显示为 "not referenced",这意味着当我单击列中的栏时图表,它不会突出显示源数据。部分用代码生成的图表,适当引用,所以我不确定问题出在哪里,也没有明显的趋势。
import xlsxwriter
import pandas as pd
class Workbook:
def __init__(self, workbook_name):
self.workbook_name = workbook_name
self.workbook = xlsxwriter.Workbook(str(self.workbook_name) + '.xlsx')
self.letters = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P']
def produce(self):
self.workbook.close()
print 'Created ' + str(self.workbook_name) + '.xlsx'
def print_frame(self, worksheet, dataframe, df_width, start_data_index):
col_as_lists = []
col_names = list(dataframe.columns.values)
# loops through columns in df and converts to list
for n in range(0, df_width):
col_n = dataframe[col_names[n]].tolist()
# checks to see if column has numbers, if so -> convert to float!
if n < start_data_index:
col_n.insert(0, col_names[n])
elif self.is_number(col_n[0]):
convert = col_n[0:]
convert = [float(x) for x in convert]
convert.insert(0, col_names[n])
col_n = convert
else:
col_n.insert(0, col_names[n])
col_as_lists.append(col_n)
# Prints each list into the worksheet.
worksheet.write_column(self.letters[n] + '1', col_as_lists[n])
#Formats numerical data as percentage
percentformat = self.workbook.add_format({'num_format': '0%'})
worksheet.set_column(self.letters[start_data_index] + ':' + self.letters[df_width], None, percentformat)
def add_chart(self, dataframe, tab_name, start_data_index):
df_width = len(dataframe.columns)
worksheet = self.workbook.add_worksheet(tab_name)
self.print_frame(worksheet, dataframe, df_width, start_data_index)
chart = self.workbook.add_chart({'type': 'column'})
df_length = (len(dataframe.index))
for n in range(start_data_index, df_width):
chart.add_series({
'name': '=' + tab_name +'!$' + self.letters[n] + '',
'categories': '=' + tab_name +'!$' + self.letters[start_data_index - 1] + ':$'+ self.letters[start_data_index - 1] + '$' + str(df_length + 1),
'values': '=' + tab_name +'!$' + self.letters[n] + ':$'+ self.letters[n] + '$' + str(df_length + 1),
'fill': {'color': '#FFB11E'},
'data_labels': {'value': True, 'center': True}
})
chart.set_title({'name': tab_name})
chart.set_x_axis({'major_gridlines': {'visible': False}})
chart.set_y_axis({'major_gridlines': {'visible': False}, 'max': .70})
worksheet.insert_chart(self.letters[df_width + 2] + '2', chart)
return
def is_number(self, s):
""" Function used to help with detecting and converting floats
from string to number data types."""
try:
float(s)
return True
except ValueError:
return False
您的示例调用:
test.add_chart(df, 'Df Title', 1)
test.add_chart(df2, 'Df2 Title', 1)
建议您有时名称中有空格。当您尝试
之类的操作时,这会导致引用中断'name': '=' + tab_name +'!$' + self.letters[n] + '',
计算结果为
'name': '=Df Title!$A',
(当tab_name
等于'Df Title'
且n
等于0
时),例如
您应该仍然可以使用带空格的 sheet 引用,但用单引号括起来,例如
'name': "='Df Title'!$A",
所以更稳健的编码方式是
'name': "='" + tab_name +"'!$" + self.letters[n] + '',
我有点惊讶这些图表完全可以使用损坏的 sheet 引用,但我自己并没有实际测试过图表,只是涉及 sheet 名称的普通单元格公式.
@John Y 是正确的,您没有在图表范围引用中正确引用工作表名称。
您可以通过使用图表列表语法而不是字符串语法来避免此问题以及从数字到单元格引用的手动转换:
chart.add_series({
'name': ['Sheet1', 0, col],
'categories': ['Sheet1', 1, 0, max_row, 0],
'values': ['Sheet1', 1, col, max_row, col],
})
该片段来自 this example in the XlsxWriter docs。
这也适用于您代码中的其他几个地方。作为 XlsxWriter 中的一般规则,您可以(几乎)在任何需要使用 A1
语法的地方使用 row-column
语法:Working with Cell Notation.