【Python】csvファイルをエクセル(xlsx)に変換する方法を解説

データのやり取りや分析において、CSVファイルは非常に一般的な形式ですが、エクセルのような表計算ソフトで扱いやすいXLSX形式に変換したい場合もあります。

この記事では、Pythonを使ってCSVファイルをXLSXファイルに変換する方法を解説します。

目次から探す

Pythonを使ったCSVファイルからXLSXファイルへの変換方法

Pythonを使ってCSVファイルをXLSXファイルに変換する方法を解説します。

必要なライブラリのインストール

CSVファイルをXLSXファイルに変換する方法はいくつかありますが、この記事ではpandasopenpyxlという2つのライブラリを使用します。

まずはこれらのライブラリをインストールしましょう。

pandasのインストール

pandasは、データ解析を支援する機能を提供するライブラリです。

CSVファイルの読み込みやデータの操作に使用します。

以下のコマンドでインストールできます。

pip install pandas

openpyxlのインストール

openpyxlは、Excelファイルを読み書きするためのライブラリです。

XLSXファイルへの変換や保存に使用します。

以下のコマンドでインストールできます。

pip install openpyxl

CSVファイルの読み込み

まずは、pandasを使ってCSVファイルを読み込みます。

以下のサンプルコードを参考にしてください。


import pandas as pd
csv_file = 'sample.csv'
df = pd.read_csv(csv_file)
print(df)

このコードでは、 pd.read_csv() 関数を使ってCSVファイルを読み込み、データフレーム(df)に格納しています。

print(df) でデータフレームの内容を表示しています。

XLSXファイルへの変換

次に、pandasopenpyxlを使ってデータフレームをXLSXファイルに変換します。

以下のサンプルコードを参考にしてください。


xlsx_file = 'sample.xlsx'
df.to_excel(xlsx_file, engine='openpyxl', index=False)

このコードでは、 df.to_excel() 関数を使ってデータフレームをXLSXファイルに変換して保存しています。

engine='openpyxl'openpyxlを使うことを指定し、index=Falseでインデックス列を出力しないようにしています。

これでCSVファイルがXLSXファイルに変換され、エクセルで扱いやすい形式になりました。

よくあるエラーと対処法

CSVファイルをXLSXファイルに変換する際に、いくつかのエラーが発生することがあります。

この章では、よくあるエラーとその対処法について説明します。

エンコーディングエラー

CSVファイルを読み込む際に、エンコーディングエラーが発生することがあります。

これは、ファイルの文字コードがPythonでデフォルトで想定されているものと異なるために起こります。

この問題を解決するには、 pandas.read_csv() 関数のencoding引数を適切な文字コードに設定します。

例えば、Shift-JISでエンコードされたCSVファイルを読み込む場合は、以下のようにencoding引数に'shift_jis'を指定します。


import pandas as pd
csv_file = 'sample.csv'
df = pd.read_csv(csv_file, encoding='shift_jis')

区切り文字の問題

CSVファイルの区切り文字が、デフォルトのカンマ(,)以外の場合、正しく読み込めないことがあります。

この問題を解決するには、 pandas.read_csv() 関数のsep引数を適切な区切り文字に設定します。

例えば、タブ文字で区切られたCSVファイルを読み込む場合は、以下のようにsep引数に'\t'を指定します。


import pandas as pd
csv_file = 'sample.tsv'
df = pd.read_csv(csv_file, sep='\t')

ライブラリのインストールエラー

pandasopenpyxlのインストール時にエラーが発生することがあります。

この問題を解決するには、以下の手順を試してみてください。

インストールしているPythonのバージョンを確認する

pandasopenpyxlは、Python 3.6以降のバージョンで動作します。

Pythonのバージョンを確認するには、コマンドプロンプトやターミナルで以下のコマンドを実行します。


python --version

安定したインターネット接続環境を使用する

インターネット接続が不安定な場合、ライブラリのインストールが失敗することがあります。

飲食店などの公共Wi-Fiだったり、通信制限中の携帯回線のテザリングなどを使用すると、インターネット接続が不安定なのが原因でライブラリのインストールに失敗します。

最新のpipかどうか確認する

最新のpipを使っていないとエラーが発生したり、pipの更新を行ってからライブラリのインストールを要求されることがあります。

pipのバージョンを確認するには、コマンドプロンプトやターミナルで以下のコマンドを実行します。


pip --version

pipのバージョンをアップグレードするには、以下のコマンドを実行します。


pip install --upgrade pip

pandasopenpyxlにかぎらず、Pythonでライブラリをインストールする時にエラーが発生して失敗した場合は、これらの方法を試してみてください。

目次から探す