使用Python自動化Microsoft Excel和Word

將Excel與Word整合,無縫生成自動報告

毫無疑問,微軟的Excel和Word是公司和非公司領域使用最廣泛的兩款軟體。它們實際上是“工作”的同義詞。通常情況下,每一週我們都會將兩者結合起來,並以某種方式發揮它們的優點。雖然一般的日常用途不會要求自動化,但有時自動化可能是必需的。也就是說,當您有大量的圖表、圖形、表格和報告要生成時,如果您選擇手動方式,它可能會成為一項極其繁瑣的工作。其實沒必要這樣。實際上,有一種方法可以在Python中建立一個管道,您可以將兩者無縫整合,在Excel中生成電子表格,然後將結果傳輸到Word中,幾乎即時生成報告。

Openpyxl

Openpyxl它可以說是Python中最通用的包之一,它可以非常容易使用Excel介面。有了它,你可以讀和寫所有當前和最早的excel格式,即xlsx和xls。Openpyxl允許您填充行和列、執行公式、建立2D和3D圖表、標記軸和標題,以及其他許多非常有用的功能。然而,最重要的是,這個包允許您在Excel中遍歷無窮多的行和列,從而避免了之前必須做的所有煩人的數字處理和繪圖。

Python-docx

然後是Python-docx,這個包之於Word就像Openpyxl之於Excel。如果您還沒有學習他們的文件,那麼您可能應該看一看。毫不誇張地說,Python-docx是我開始使用Python以來使用過的最簡單、最不言自明的工具包之一。它允許您透過插入文字、填充表格和在報表中自動渲染影象來自動生成文件。

言歸正傳,讓我們建立我們自己的自動化流水線。繼續使用Anaconda(或者你選擇的任何其他IDE)並安裝以下軟體包:

pip install openpyxl

pip install python-docx

Microsoft Excel自動化

首先,我們將載入一個已經建立好的Excel工作簿(如下所示):

workbook = xl。load_workbook(‘Book1。xlsx’)

sheet_1 = workbook[‘Sheet1’]

隨後,我們將遍歷電子表格中的所有行,透過電流乘以電壓來計算和插入功率值:

for row in range(2, sheet_1。max_row + 1):

current = sheet_1。cell(row, 2)

voltage = sheet_1。cell(row, 3)

power = float(current。value) * float(voltage。value)

power_cell = sheet_1。cell(row, 1)

power_cell。value = power

一旦完成,我們將使用計算的功率值生成折線圖,將插入指定的單元格,如下圖所示:

values = Reference(sheet_1, min_row = 2, max_row = sheet_1。max_row, min_col = 1, max_col = 1)

chart = LineChart()

chart。y_axis。title = ‘Power’

chart。x_axis。title = ‘Index’

chart。add_data(values)

sheet_1。add_chart(chart, ‘e2’)

workbook。save(‘Book1。xlsx’)

現在我們已經生成了圖表,我們需要將其提取為影象,以便在Word報告中使用它。首先,我們將確定Excel檔案的確切位置,以及輸出的圖表影象應該儲存的位置:

input_file = “C:/Users/。。。/Book1。xlsx”

output_image = “C:/Users/。。。/chart。png”

然後使用以下方法訪問電子表格:

operation = win32com。client。Dispatch(“Excel。Application”)

operation。Visible = 0

operation。DisplayAlerts = 0

workbook_2 = operation。Workbooks。Open(input_file)

sheet_2 = operation。Sheets(1)

你可以迭代電子表格中的所有圖表物件(如果有一個以上),並將它們儲存在指定的位置如下:

for x, chart in enumerate(sheet_2。Shapes):

chart。Copy()

image = ImageGrab。grabclipboard()

image。save(output_image, ‘png’)

passworkbook_2。Close(True)

operation。Quit()

Microsoft Word自動化

現在我們已經生成了圖表影象,我們必須建立一個模板文件,它基本上是一個普通的Microsoft Word文件(。docx),它完全按照我們希望的報告外觀來制定,包括字型、字型大小、格式和頁面結構。然後,我們需要做的就是為我們的自動內容建立佔位符,即表值和影象,並使用變數名宣告它們,如下所示。

任何自動的內容都可以在雙花括號{{variable_name}}中宣告,包括文字和影象。對於表,你需要建立一個包含所有列的模板行表,然後你需要在上面加上一行,下面加上一行,符號如下:

第一行:

{%tr for item in variable_name %}

最後一行:

{%tr endfor %}

在上圖中,變數名是:

table_contents用於儲存表格資料的Python字典

字典鍵的索引(第一列)

字典值的功率、電流和電壓(第二、第三和第四列)

然後我們將模板文件匯入Python,並建立一個字典來儲存表中的值:

template = DocxTemplate(‘template。docx’)

table_contents = []for i in range(2, sheet_1。max_row + 1):

table_contents。append({

‘Index’: i-1,

‘Power’: sheet_1。cell(i, 1)。value,

‘Current’: sheet_1。cell(i, 2)。value,

‘Voltage’: sheet_1。cell(i, 3)。value

})

接下來,我們將匯入之前由Excel生成的圖表影象,並建立另一個字典來例項化模板文件中宣告的所有佔位符變數:

image = InlineImage(template,‘chart。png’,Cm(10))context = {

‘title’: ‘Automated Report’,

‘day’: datetime。datetime。now()。strftime(‘%d’),

‘month’: datetime。datetime。now()。strftime(‘%b’),

‘year’: datetime。datetime。now()。strftime(‘%Y’),

‘table_contents’: table_contents,

‘image’: image

}

最後,我們將用我們的值表和圖表影象渲染報告:

template。render(context)

template。save(‘Automated_report。docx’)

結果

好了,這就是一個自動生成的Microsoft Word報告,包含數字和在Microsoft Excel中建立的圖表。這樣你就有了一個完全自動化的管道,可以用來建立儘可能多的表格、圖表和文件。

最後,完整的程式碼在這裡:github/mkhorasani/excel

word

automation 有興趣的可以下載修改和執行

作者:M Khorasani

deephub翻譯組

相關文章