PythonでExcelファイルを読み取るライブラリ:openpyxl、xlrd、pandas

PythonでExcelファイルを操作するための代表的なライブラリにopenpyxlxlrdpandasがあります。ここでは、それぞれの特徴と使い方についてわかりやすく説明します。

1. openpyxl

openpyxlは、Excel 2010 以降の.xlsx形式のファイルを読み書きするためのライブラリです。柔軟に操作ができ、セルのスタイルやグラフの操作も可能です。

特徴

  • .xlsx形式に対応
  • 読み書きが可能
  • セルのスタイルやグラフの操作もサポート

インストール

pip install openpyxl

使用例

import openpyxl

# Excelファイルを読み込む
workbook = openpyxl.load_workbook('example.xlsx')
sheet = workbook.active

# シートのデータを表示
for row in sheet.iter_rows(values_only=True):
    print(row)

上記のコードは、Excel ファイルを読み込み、各行の内容を表示します。

2. xlrd

xlrdは古い Excel ファイル(.xls形式)を読み取るためのライブラリです。.xlsx形式のサポートは現在削除されていますので、古い Excel ファイルを扱う場合に使用します。

特徴

  • .xls形式に対応
  • 読み取り専用

インストール

pip install xlrd

使用例

import xlrd

# Excelファイルを読み込む
workbook = xlrd.open_workbook('example.xls')
sheet = workbook.sheet_by_index(0)

# シートのデータを表示
for row_idx in range(sheet.nrows):
    print(sheet.row_values(row_idx))

このコードは、.xlsファイルを読み込み、各行の内容を表示します。

3. pandas

pandasはデータ操作と分析に非常に強力なライブラリで、Excel ファイルの読み取りも簡単にできます。Excel のデータをデータフレーム(DataFrame)として扱えるため、データの操作や分析が簡単になります。

特徴

  • .xlsx.xls両方に対応
  • 高度なデータ操作と分析が可能
  • 読み書きが可能

インストール

pip install pandas

使用例

import pandas as pd

# Excelファイルを読み込む
df = pd.read_excel('example.xlsx')

# データフレームの内容を表示
print(df)

このコードは、Excel ファイルをデータフレームに読み込み、その内容を表示します。

まとめ

openpyxlxlrdpandasのそれぞれに特徴があります。

  • openpyxlは、.xlsx形式のファイルの読み書きに適しており、セルのスタイルやグラフの操作も可能です。
  • xlrdは、古い.xls形式のファイルの読み取りに適しています。
  • pandasは、データ操作と分析に強力で、Excel ファイルの読み取り・書き出し機能を持ち、データフレームを使って効率的にデータを扱えます。

プロジェクトや用途に応じて、最適なライブラリを選んで活用してみてください。