PythonでExcelファイルを読み取るライブラリ:openpyxl、xlrd、pandas
PythonでExcelファイルを操作するための代表的なライブラリにopenpyxl、xlrd、pandasがあります。ここでは、それぞれの特徴と使い方についてわかりやすく説明します。
1. openpyxl
openpyxlは、Excel 2010 以降の.xlsx形式のファイルを読み書きするためのライブラリです。柔軟に操作ができ、セルのスタイルやグラフの操作も可能です。
特徴:
.xlsx形式に対応- 読み書きが可能
- セルのスタイルやグラフの操作もサポート
インストール:
pip install openpyxl
使用例:
import openpyxl
# Excelファイルを読み込む
workbook = openpyxl.load_workbook('example.xlsx')
sheet = workbook.active
# シートのデータを表示
for row in sheet.iter_rows(values_only=True):
print(row)
上記のコードは、Excel ファイルを読み込み、各行の内容を表示します。
2. xlrd
xlrdは古い Excel ファイル(.xls形式)を読み取るためのライブラリです。.xlsx形式のサポートは現在削除されていますので、古い Excel ファイルを扱う場合に使用します。
特徴:
.xls形式に対応- 読み取り専用
インストール:
pip install xlrd
使用例:
import xlrd
# Excelファイルを読み込む
workbook = xlrd.open_workbook('example.xls')
sheet = workbook.sheet_by_index(0)
# シートのデータを表示
for row_idx in range(sheet.nrows):
print(sheet.row_values(row_idx))
このコードは、.xlsファイルを読み込み、各行の内容を表示します。
3. pandas
pandasはデータ操作と分析に非常に強力なライブラリで、Excel ファイルの読み取りも簡単にできます。Excel のデータをデータフレーム(DataFrame)として扱えるため、データの操作や分析が簡単になります。
特徴:
.xlsx、.xls両方に対応- 高度なデータ操作と分析が可能
- 読み書きが可能
インストール:
pip install pandas
使用例:
import pandas as pd
# Excelファイルを読み込む
df = pd.read_excel('example.xlsx')
# データフレームの内容を表示
print(df)
このコードは、Excel ファイルをデータフレームに読み込み、その内容を表示します。
まとめ
openpyxl、xlrd、pandasのそれぞれに特徴があります。
openpyxlは、.xlsx形式のファイルの読み書きに適しており、セルのスタイルやグラフの操作も可能です。xlrdは、古い.xls形式のファイルの読み取りに適しています。pandasは、データ操作と分析に強力で、Excel ファイルの読み取り・書き出し機能を持ち、データフレームを使って効率的にデータを扱えます。
プロジェクトや用途に応じて、最適なライブラリを選んで活用してみてください。
