使用Python自動化Microsoft Excel和Word
將Excel與Word整合,無縫生成自動報告
毫無疑問,微軟的Excel和Word是公司和非公司領域使用最廣泛的兩款軟體。它們實際上是“工作”的同義詞。通常情況下,每一週我們都會將兩者結合起來,並以某種方式發揮它們的優點。雖然一般的日常用途不會要求自動化,但有時自動化可能是必需的。也就是說,當您有大量的圖表、圖形、表格和報告要生成時,如果您選擇手動方式,它可能會成為一項極其繁瑣的工作。其實沒必要這樣。實際上,有一種方法可以在Python中建立一個管道,您可以將兩者無縫整合,在Excel中生成電子表格,然後將結果傳輸到Word中,幾乎即時生成報告。
Openpyxl
Openpyxl它可以說是Python中最通用的包之一,它可以非常容易使用Excel介面。有了它,你可以讀和寫所有當前和最早的excel格式,即xlsx和xls。Openpyxl允許您填充行和列、執行公式、建立2D和3D圖表、標記軸和標題,以及其他許多非常有用的功能。然而,最重要的是,這個包允許您在Excel中遍歷無窮多的行和列,從而避免了之前必須做的所有煩人的數字處理和繪圖。
Python-docx
然後是Python-docx,這個包之於Word就像Openpyxl之於Excel。如果您還沒有學習他們的文件,那麼您可能應該看一看。毫不誇張地說,Python-docx是我開始使用Python以來使用過的最簡單、最不言自明的工具包之一。它允許您透過插入文字、填充表格和在報表中自動渲染影象來自動生成文件。
言歸正傳,讓我們建立我們自己的自動化流水線。繼續使用Anaconda(或者你選擇的任何其他IDE)並安裝以下軟體包:
pip install openpyxl
pip install python-docx
Microsoft Excel自動化
首先,我們將載入一個已經建立好的Excel工作簿(如下所示):
workbook = xl。load_workbook(‘Book1。xlsx’)
sheet_1 = workbook[‘Sheet1’]
隨後,我們將遍歷電子表格中的所有行,透過電流乘以電壓來計算和插入功率值:
for row in range(2, sheet_1。max_row + 1):
current = sheet_1。cell(row, 2)
voltage = sheet_1。cell(row, 3)
power = float(current。value) * float(voltage。value)
power_cell = sheet_1。cell(row, 1)
power_cell。value = power
一旦完成,我們將使用計算的功率值生成折線圖,將插入指定的單元格,如下圖所示:
values = Reference(sheet_1, min_row = 2, max_row = sheet_1。max_row, min_col = 1, max_col = 1)
chart = LineChart()
chart。y_axis。title = ‘Power’
chart。x_axis。title = ‘Index’
chart。add_data(values)
sheet_1。add_chart(chart, ‘e2’)
workbook。save(‘Book1。xlsx’)
現在我們已經生成了圖表,我們需要將其提取為影象,以便在Word報告中使用它。首先,我們將確定Excel檔案的確切位置,以及輸出的圖表影象應該儲存的位置:
input_file = “C:/Users/。。。/Book1。xlsx”
output_image = “C:/Users/。。。/chart。png”
然後使用以下方法訪問電子表格:
operation = win32com。client。Dispatch(“Excel。Application”)
operation。Visible = 0
operation。DisplayAlerts = 0
workbook_2 = operation。Workbooks。Open(input_file)
sheet_2 = operation。Sheets(1)
你可以迭代電子表格中的所有圖表物件(如果有一個以上),並將它們儲存在指定的位置如下:
for x, chart in enumerate(sheet_2。Shapes):
chart。Copy()
image = ImageGrab。grabclipboard()
image。save(output_image, ‘png’)
passworkbook_2。Close(True)
operation。Quit()
Microsoft Word自動化
現在我們已經生成了圖表影象,我們必須建立一個模板文件,它基本上是一個普通的Microsoft Word文件(。docx),它完全按照我們希望的報告外觀來制定,包括字型、字型大小、格式和頁面結構。然後,我們需要做的就是為我們的自動內容建立佔位符,即表值和影象,並使用變數名宣告它們,如下所示。
任何自動的內容都可以在雙花括號{{variable_name}}中宣告,包括文字和影象。對於表,你需要建立一個包含所有列的模板行表,然後你需要在上面加上一行,下面加上一行,符號如下:
第一行:
{%tr for item in variable_name %}
最後一行:
{%tr endfor %}
在上圖中,變數名是:
table_contents用於儲存表格資料的Python字典
字典鍵的索引(第一列)
字典值的功率、電流和電壓(第二、第三和第四列)
然後我們將模板文件匯入Python,並建立一個字典來儲存表中的值:
template = DocxTemplate(‘template。docx’)
table_contents = []for i in range(2, sheet_1。max_row + 1):
table_contents。append({
‘Index’: i-1,
‘Power’: sheet_1。cell(i, 1)。value,
‘Current’: sheet_1。cell(i, 2)。value,
‘Voltage’: sheet_1。cell(i, 3)。value
})
接下來,我們將匯入之前由Excel生成的圖表影象,並建立另一個字典來例項化模板文件中宣告的所有佔位符變數:
image = InlineImage(template,‘chart。png’,Cm(10))context = {
‘title’: ‘Automated Report’,
‘day’: datetime。datetime。now()。strftime(‘%d’),
‘month’: datetime。datetime。now()。strftime(‘%b’),
‘year’: datetime。datetime。now()。strftime(‘%Y’),
‘table_contents’: table_contents,
‘image’: image
}
最後,我們將用我們的值表和圖表影象渲染報告:
template。render(context)
template。save(‘Automated_report。docx’)
結果
好了,這就是一個自動生成的Microsoft Word報告,包含數字和在Microsoft Excel中建立的圖表。這樣你就有了一個完全自動化的管道,可以用來建立儘可能多的表格、圖表和文件。
最後,完整的程式碼在這裡:github/mkhorasani/excel
word
automation 有興趣的可以下載修改和執行
作者:M Khorasani
deephub翻譯組
相關文章
- 2021-06-18Excel 異形佈局的錯行資料表,按條件求和,提需求的算職場pua嗎?
- 2021-05-08對比6款資料分析熱門工具,入門入行學什麼,看完一目瞭然
- 2021-05-06Excel下拉序號技巧,自動更新序號,小技巧解決大問題
- 2021-03-31認識Office辦公軟體
- 2021-03-24用Excel也能畫畫,77歲日本表格老人