扣丁學(xué)堂Python培訓(xùn)之Excel處理庫openpyxl詳解

發(fā)布人：扣丁學(xué)堂1 時間：2021-01-11 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

openpyxl是一個第三方庫，可以處理xlsx格式的Excel文件。pipinstallopenpyxl安裝。

讀取Excel文件

需要導(dǎo)入相關(guān)函數(shù)

fromopenpyxlimportload_workbook
#默認可讀寫，若有需要可以指定write_only和read_only為True
wb=load_workbook('codingke.xlsx')
默認打開的文件為可讀寫，若有需要可以指定參數(shù)read_only為True。

獲取工作表--Sheet

　　#獲得所有sheet的名稱
　　print(wb.get_sheet_names())
　　#根據(jù)sheet名字獲得sheet
　　a_sheet=wb.get_sheet_by_name('Sheet1')
　　#獲得sheet名
　　print(a_sheet.title)
　　#獲得當前正在顯示的sheet,也可以用wb.get_active_sheet()
　　sheet=wb.active

獲取單元格

　　#獲取某個單元格的值，觀察excel發(fā)現(xiàn)也是先字母再數(shù)字的順序，即先列再行
　　b4=sheet['B4']
　　#分別返回
　　print(f'({b4.column},{b4.row})is{b4.value}')#返回的數(shù)字就是int型
　　#除了用下標的方式獲得，還可以用cell函數(shù),換成數(shù)字，這個表示B2
　　b4_too=sheet.cell(row=4,column=2)
　　print(b4_too.value)

b4.column返回B,b4.row返回4,value則是那個單元格的值。另外cell還有一個屬性coordinate,像b4這個單元格返回的是坐標B4。

獲得最大行和最大列

#獲得最大列和最大行
print(sheet.max_row)
print(sheet.max_column)

獲取行和列

　　heet.rows為生成器,里面是每一行的數(shù)據(jù)，每一行又由一個tuple包裹。
　　sheet.columns類似，不過里面是每個tuple是每一列的單元格。
　　#因為按行，所以返回A1,B1,C1這樣的順序
　　forrowinsheet.rows:
　　forcellinrow:
　　print(cell.value)
　　#A1,A2,A3這樣的順序
　　forcolumninsheet.columns:
　　forcellincolumn:
　　print(cell.value)

上面的代碼就可以獲得所有單元格的數(shù)據(jù)。如果要獲得某行的數(shù)據(jù)呢？給其一個索引就行了，因為sheet.rows是生成器類型，不能使用索引，轉(zhuǎn)換成list之后再使用索引，list(sheet.rows)[2]這樣就獲取到第二行的tuple對象。

forcellinlist(sheet.rows)[2]:
print(cell.value)

如何獲得任意區(qū)間的單元格

可以使用range函數(shù)，下面的寫法，獲得了以A1為左上角，B3為右下角矩形區(qū)域的所有單元格。注意range從1開始的，因為在openpyxl中為了和Excel中的表達方式一致，并不和編程語言的習(xí)慣以0表示第一個值。

　　foriinrange(1,4):
　　forjinrange(1,3):
　　print(sheet.cell(row=i,column=j))
　　#out
　　<Cellpythontab.A1>
　　<Cellpythontab.B1>
　　<Cellpythontab.A2>
　　<Cellpythontab.B2>
　　<Cellpythontab.A3>
　　<Cellpythontab.B3>

還可以像使用切片那樣使用。sheet['A1':'B3']返回一個tuple，該元組內(nèi)部還是元組，由每行的單元格構(gòu)成一個元組。

　　forrow_cellinsheet['A1':'B3']:
　　forcellinrow_cell:
　　print(cell)
　　forcellinsheet['A1':'B3']:
　　print(cell)
　　#out
　　(<Cellpythontab.A1>,<Cellpythontab.B1>)
　　(<Cellpythontab.A2>,<Cellpythontab.B2>)
　　(<Cellpythontab.A3>,<Cellpythontab.B3>)

根據(jù)字母獲得列號，根據(jù)列號返回字母

需要導(dǎo)入，這兩個函數(shù)存在于openpyxl.utils

fromopenpyxl.utilsimportget_column_letter,column_index_from_string
#根據(jù)列的數(shù)字返回字母
print(get_column_letter(2))#B
#根據(jù)字母返回列的數(shù)字
print(column_index_from_string('D'))#4

將數(shù)據(jù)寫入Excel

工作表相關(guān)

需要導(dǎo)入WorkBook

fromopenpyxlimportWorkbook
wb=Workbook()

這樣就新建了一個新的工作表（只是還沒被保存）。

若要指定只寫模式，可以指定參數(shù)write_only=True。一般默認的可寫可讀模式就可以了。

　　print(wb.get_sheet_names())#提供一個默認名叫Sheet的表，office2016下新建提供默認Sheet1
　　#直接賦值就可以改工作表的名稱
　　sheet.title='Sheet1'
　　#新建一個工作表，可以指定索引，適當安排其在工作簿中的位置
　　wb.create_sheet('Data',index=1)#被安排到第二個工作表，index=0就是第一個位置
　　#刪除某個工作表
　　wb.remove(sheet)
　　delwb[sheet]

寫入單元格

還可以使用公式

#直接給單元格賦值就行
sheet['A1']='good'
#B9處寫入平均值
sheet['B9']='=AVERAGE(B2:B8)'

但是如果是讀取的時候需要加上data_only=True這樣讀到B9返回的就是數(shù)字，如果不加這個參數(shù)，返回的將是公式本身'=AVERAGE(B2:B8)'

append函數(shù)

可以一次添加多行數(shù)據(jù)，從第一行空白行開始（下面都是空白行）寫入。

　　#添加一行
　　row=[1,2,3,4,5]
　　sheet.append(row)
　　#添加多行
　　rows=[
　　['Number','data1','data2'],
　　[2,40,30],
　　[3,40,25],
　　[4,50,30],
　　[5,30,10],
　　[6,25,5],
　　[7,50,10],
　　]

由于append函數(shù)只能按行寫入。如果我們想按列寫入呢。append能實現(xiàn)需求么？如果把上面的列表嵌套看作矩陣。只要將矩陣轉(zhuǎn)置就可以了。使用zip()函數(shù)可以實現(xiàn)，不過內(nèi)部的列表變成了元組就是了。都是可迭代對象，不影響。

　　list(zip(*rows))
　　#out
　　[('Number',2,3,4,5,6,7),
　　('data1',40,40,50,30,25,50),
　　('data2',30,25,30,10,5,10)]

解釋下上面的list(zip(*rows))首先*rows將列表打散，相當于填入了若干個參數(shù)，zip從某個列表中提取第1個值組合成一個tuple，再從每個列表中提取第2個值組合成一個tuple，一直到最短列表的最后一個值提取完畢后結(jié)束，更長列表的之后的值被舍棄，換句話，最后的元組個數(shù)是由原來每個參數(shù)（可迭代對象）的最短長度決定的。比如現(xiàn)在隨便刪掉一個值，最短列表長度為2，data2那一列（豎著看）的值全部被舍棄。

　　rows=[
　　['Number','data1','data2'],
　　[2,40],
　　[3,40,25],
　　[4,50,30],
　　[5,30,10],
　　[6,25,5],
　　[7,50,10],
　　]
　　#out
　　[('Number',2,3,4,5,6,7),('data1',40,40,50,30,25,50)]

最后zip返回的是zip對象，看不到數(shù)據(jù)的。使用list轉(zhuǎn)換下就好了。使用zip可以方便實現(xiàn)將數(shù)據(jù)按列寫入。

保存文件

所有的操作結(jié)束后，一定記得保存文件。指定路徑和文件名，后綴名為xlsx。

wb.save(r'D:\example.xlsx')

設(shè)置單元格風格--Style

先導(dǎo)入需要的類

fromopenpyxl.stylesimportFont,colors,Alignment

分別可指定字體相關(guān)，顏色，和對齊方式。

字體

bold_itatic_24_font=Font(name='線',size=24,italic=True,color=colors.RED,bold=True)
sheet['A1'].font=bold_itatic_24_font

上面的代碼指定了等線24號加粗斜體，字體顏色紅色。直接使用cell的font屬性，將Font對象賦值給它。

對齊方式

也是直接使用cell的屬性aligment，這里指定垂直居中和水平居中。除了center，還可以使用right、left等等參數(shù)。

#設(shè)置B1中的數(shù)據(jù)垂直居中和水平居中
sheet['B1'].alignment=Alignment(horizontal='center',vertical='center')

設(shè)置行高和列寬

有時候數(shù)據(jù)太長顯示不完，就需要拉長拉高單元格。

#第2行行高
sheet.row_dimensions[2].height=40
#C列列寬
sheet.column_dimensions['C'].width=30

合并和拆分單元格

所謂合并單元格，即以合并區(qū)域的左上角的那個單元格為基準，覆蓋其他單元格使之稱為一個大的單元格。

相反，拆分單元格后將這個大單元格的值返回到原來的左上角位置。

#合并單元格，往左上角寫入數(shù)據(jù)即可

sheet.merge_cells('B1:G1')#合并一行中的幾個單元格

sheet.merge_cells('A1:C3')#合并一個矩形區(qū)域中的單元格

合并后只可以往左上角寫入數(shù)據(jù)，也就是區(qū)間中:左邊的坐標。

如果這些要合并的單元格都有數(shù)據(jù)，只會保留左上角的數(shù)據(jù)，其他則丟棄。換句話說若合并前不是在左上角寫入數(shù)據(jù)，合并后單元格中不會有數(shù)據(jù)。

以下是拆分單元格的代碼。拆分后，值回到A1位置。

sheet.unmerge_cells('A1:C3')

以上就是關(guān)于扣丁學(xué)堂Python基礎(chǔ)教程之Excel處理庫openpyxl的詳細介紹，最后想要了解更多關(guān)于Python發(fā)展前景趨勢，請關(guān)注扣丁學(xué)堂Python培訓(xùn)官網(wǎng)、微信等平臺，扣丁學(xué)堂IT職業(yè)在線學(xué)習(xí)教育平臺為您提供最新的Python視頻教程系統(tǒng)，通過千鋒扣丁學(xué)堂金牌講師在線錄制的Python視頻教程課程，讓你快速掌握Python從入門到精通開發(fā)實戰(zhàn)技能?？鄱W(xué)堂python學(xué)習(xí)交流群：816572891。微信號：codingbb

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

扣丁學(xué)堂Python培訓(xùn)之Excel處理庫openpyxl詳解

相關(guān)推薦

技術(shù)專區(qū)