PythonでExcelファイルを読み取るライブラリ:openpyxl、xlrd、pandas
PythonでExcelファイルを操作するための代表的なライブラリにopenpyxl
、xlrd
、pandas
があります。ここでは、それぞれの特徴と使い方についてわかりやすく説明します。
1. openpyxl
openpyxl
は、Excel 2010 以降の.xlsx
形式のファイルを読み書きするためのライブラリです。柔軟に操作ができ、セルのスタイルやグラフの操作も可能です。
特徴:
.xlsx
形式に対応- 読み書きが可能
- セルのスタイルやグラフの操作もサポート
インストール:
pip install openpyxl
使用例:
import openpyxl
# Excelファイルを読み込む
workbook = openpyxl.load_workbook('example.xlsx')
sheet = workbook.active
# シートのデータを表示
for row in sheet.iter_rows(values_only=True):
print(row)
上記のコードは、Excel ファイルを読み込み、各行の内容を表示します。
2. xlrd
xlrd
は古い Excel ファイル(.xls
形式)を読み取るためのライブラリです。.xlsx
形式のサポートは現在削除されていますので、古い Excel ファイルを扱う場合に使用します。
特徴:
.xls
形式に対応- 読み取り専用
インストール:
pip install xlrd
使用例:
import xlrd
# Excelファイルを読み込む
workbook = xlrd.open_workbook('example.xls')
sheet = workbook.sheet_by_index(0)
# シートのデータを表示
for row_idx in range(sheet.nrows):
print(sheet.row_values(row_idx))
このコードは、.xls
ファイルを読み込み、各行の内容を表示します。
3. pandas
pandas
はデータ操作と分析に非常に強力なライブラリで、Excel ファイルの読み取りも簡単にできます。Excel のデータをデータフレーム(DataFrame)として扱えるため、データの操作や分析が簡単になります。
特徴:
.xlsx
、.xls
両方に対応- 高度なデータ操作と分析が可能
- 読み書きが可能
インストール:
pip install pandas
使用例:
import pandas as pd
# Excelファイルを読み込む
df = pd.read_excel('example.xlsx')
# データフレームの内容を表示
print(df)
このコードは、Excel ファイルをデータフレームに読み込み、その内容を表示します。
まとめ
openpyxl
、xlrd
、pandas
のそれぞれに特徴があります。
openpyxl
は、.xlsx
形式のファイルの読み書きに適しており、セルのスタイルやグラフの操作も可能です。xlrd
は、古い.xls
形式のファイルの読み取りに適しています。pandas
は、データ操作と分析に強力で、Excel ファイルの読み取り・書き出し機能を持ち、データフレームを使って効率的にデータを扱えます。
プロジェクトや用途に応じて、最適なライブラリを選んで活用してみてください。