[Python] 2つ以上のmp3ファイルを結合する方法

2025-04-15更新日: 2025-04-15

Pythonで2つ以上のmp3ファイルを結合するには、pydubライブラリを使用するのが一般的です。

まず、pydubをインストールし、AudioSegmentクラスを使ってmp3ファイルを読み込みます。

次に、+演算子を使って複数の音声ファイルを結合し、exportメソッドで新しいmp3ファイルとして保存します。

pydubはffmpegをバックエンドとして使用するため、ffmpegもインストールしておく必要があります。

目次から探す

pydubライブラリのインストールとセットアップ
mp3ファイルの読み込み
mp3ファイルの結合方法
結合時の注意点
応用例：mp3ファイルの編集
応用例：mp3ファイルのメタデータ操作
応用例：mp3ファイルのフォーマット変換
まとめ

pydubライブラリのインストールとセットアップ

pydubとは？

pydubは、Pythonで音声ファイルを簡単に操作するためのライブラリです。

特に、音声ファイルの結合、トリミング、音量調整などの処理を直感的に行うことができます。

mp3、wav、oggなど、さまざまな音声フォーマットに対応しており、音声処理を行う際に非常に便利です。

pydubを使用することで、音声ファイルの操作が簡単になり、プログラミングの効率が向上します。

pydubのインストール方法

pydubはPythonのパッケージ管理ツールであるpipを使用してインストールできます。

以下のコマンドをターミナルまたはコマンドプロンプトで実行してください。

pip install pydub

このコマンドを実行することで、pydubライブラリがインストールされます。

インストールが完了したら、Pythonのスクリプト内でpydubをインポートして使用できるようになります。

ffmpegのインストールと設定

pydubは音声ファイルの処理にffmpegを利用します。

ffmpegは、音声や動画の変換、編集を行うための強力なツールです。

以下の手順でffmpegをインストールし、設定を行います。

ffmpegのダウンロード: ffmpegの公式サイトから、使用しているOSに合ったバージョンをダウンロードします。
インストール: ダウンロードしたファイルを解凍し、適切なフォルダに配置します。
環境変数の設定: ffmpegの実行ファイルがあるフォルダを環境変数に追加します。

プログラムがあるカレントディレクトリにffmpeg.exeを配置するだけでもPythonから使用できます。

これにより、コマンドラインからffmpegを直接実行できるようになります。

pydubとffmpegの連携確認

pydubとffmpegが正しく連携しているか確認するために、以下のサンプルコードを実行してみましょう。

from pydub import AudioSegment
# mp3ファイルを読み込む
audio = AudioSegment.from_file("sample.mp3")
# 音声の長さを表示
print(f"音声の長さ: {len(audio)} ミリ秒")

このコードを実行すると、指定したmp3ファイルの長さがミリ秒単位で表示されます。

もしエラーが発生した場合は、ffmpegのインストールや環境変数の設定を再確認してください。

音声の長さ: 120000 ミリ秒

これで、pydubとffmpegのインストールと設定が完了しました。

次のステップでは、mp3ファイルの読み込みについて詳しく見ていきます。

mp3ファイルの読み込み

AudioSegmentクラスの基本

AudioSegmentクラスは、pydubライブラリの中心的なクラスで、音声ファイルを表現します。

このクラスを使用することで、音声データの操作や編集が可能になります。

AudioSegmentは、音声の長さ、サンプリングレート、チャンネル数などの情報を持っており、音声ファイルを簡単に扱うことができます。

主なメソッドには、音声の再生、結合、トリミング、音量調整などがあります。

mp3ファイルの読み込み方法

mp3ファイルを読み込むには、AudioSegmentクラスのfrom_fileメソッドを使用します。

このメソッドにファイル名を渡すことで、指定したmp3ファイルをAudioSegmentオブジェクトとして読み込むことができます。

以下は、mp3ファイルを読み込むサンプルコードです。

from pydub import AudioSegment
# mp3ファイルを読み込む
audio = AudioSegment.from_file("sample.mp3")
# 音声の長さを表示
print(f"音声の長さ: {len(audio)} ミリ秒")

音声の長さ: 120000 ミリ秒

このコードを実行すると、指定したmp3ファイルの長さがミリ秒単位で表示されます。

複数ファイルの読み込み方法

複数のmp3ファイルを読み込む場合も、from_fileメソッドを使用してそれぞれのファイルをAudioSegmentオブジェクトとして読み込むことができます。

以下のサンプルコードでは、2つのmp3ファイルを読み込み、それぞれの音声の長さを表示します。

from pydub import AudioSegment
# 複数のmp3ファイルを読み込む
audio1 = AudioSegment.from_file("sample1.mp3")
audio2 = AudioSegment.from_file("sample2.mp3")
# 音声の長さを表示
print(f"音声1の長さ: {len(audio1)} ミリ秒")
print(f"音声2の長さ: {len(audio2)} ミリ秒")

音声1の長さ: 150000 ミリ秒
音声2の長さ: 180000 ミリ秒

このようにして、複数のmp3ファイルを簡単に読み込むことができます。

次のステップでは、mp3ファイルの結合方法について詳しく見ていきます。

mp3ファイルの結合方法

AudioSegmentを使った結合の基本

pydubのAudioSegmentクラスを使用すると、複数の音声ファイルを簡単に結合することができます。

結合は、+演算子を使って行います。

この演算子を使用することで、2つのAudioSegmentオブジェクトを連結し、新しいAudioSegmentオブジェクトを作成することができます。

結合された音声は、元の音声の順番で再生されます。

2つのmp3ファイルを結合する方法

2つのmp3ファイルを結合するには、まずそれぞれのファイルをAudioSegmentオブジェクトとして読み込み、その後+演算子を使って結合します。

以下は、2つのmp3ファイルを結合するサンプルコードです。

from pydub import AudioSegment
# 2つのmp3ファイルを読み込む
audio1 = AudioSegment.from_file("sample1.mp3")
audio2 = AudioSegment.from_file("sample2.mp3")
# 2つの音声を結合する
combined_audio = audio1 + audio2
# 結合後の音声の長さを表示
print(f"結合後の音声の長さ: {len(combined_audio)} ミリ秒")

結合後の音声の長さ: 330000 ミリ秒

3つ以上のmp3ファイルを結合する方法

3つ以上のmp3ファイルを結合する場合も、同様に+演算子を使用します。

以下のサンプルコードでは、3つのmp3ファイルを結合しています。

from pydub import AudioSegment
# 3つのmp3ファイルを読み込む
audio1 = AudioSegment.from_file("sample1.mp3")
audio2 = AudioSegment.from_file("sample2.mp3")
audio3 = AudioSegment.from_file("sample3.mp3")
# 3つの音声を結合する
combined_audio = audio1 + audio2 + audio3
# 結合後の音声の長さを表示
print(f"結合後の音声の長さ: {len(combined_audio)} ミリ秒")

結合後の音声の長さ: 480000 ミリ秒

結合後のファイルの保存方法

結合した音声をファイルとして保存するには、AudioSegmentオブジェクトのexportメソッドを使用します。

このメソッドにファイル名とフォーマットを指定することで、音声ファイルを保存できます。

以下は、結合後の音声をmp3ファイルとして保存するサンプルコードです。

# 結合後の音声をmp3ファイルとして保存する
combined_audio.export("combined.mp3", format="mp3")

このコードを実行すると、結合された音声がcombined.mp3という名前で保存されます。

これで、mp3ファイルの結合が完了しました。

次のステップでは、結合時の注意点について詳しく見ていきます。

結合時の注意点

ファイルのサンプリングレートの違い

音声ファイルには、サンプリングレート(Hz)が設定されています。

これは、音声がどれだけの頻度でサンプリングされているかを示す値です。

異なるサンプリングレートを持つ音声ファイルを結合すると、音質が劣化したり、再生時に問題が発生することがあります。

結合する前に、すべての音声ファイルのサンプリングレートを確認し、必要に応じて変換することが重要です。

pydubでは、set_frame_rateメソッドを使用してサンプリングレートを変更できます。

ファイルのビットレートの違い

ビットレートは、音声データの圧縮率を示す指標で、通常はkbps(キロビット毎秒)で表されます。

異なるビットレートの音声ファイルを結合すると、音質の不均一が生じる可能性があります。

特に、低ビットレートのファイルと高ビットレートのファイルを結合すると、音質が悪化することがあります。

結合前に、ビットレートを統一することをお勧めします。

pydubでは、exportメソッドのbitrate引数を使用して、出力ファイルのビットレートを指定できます。

結合時の音量調整

異なる音声ファイルを結合する際、音量が異なる場合があります。

音量が大きすぎたり小さすぎたりすると、再生時に不快感を与えることがあります。

pydubでは、+演算子を使用して結合する前に、apply_gainメソッドを使って音量を調整することができます。

以下は、音量を調整するサンプルコードです。

# 音量を調整する(例：-5dB)
audio1 = audio1.apply_gain(-5)
audio2 = audio2.apply_gain(-5)
combined_audio = audio1 + audio2

結合時の無音部分の処理

音声ファイルの中には、無音部分が含まれていることがあります。

無音部分があると、結合後の音声が不自然に感じられることがあります。

pydubでは、split_to_monoメソッドやdetect_nonsilentメソッドを使用して無音部分を検出し、必要に応じてトリミングすることができます。

無音部分を削除することで、よりスムーズな音声の結合が可能になります。

以下は、無音部分を削除するサンプルコードです。

from pydub.silence import detect_nonsilent
# 無音部分を検出
nonsilent_ranges = detect_nonsilent(audio, min_silence_len=1000, silence_thresh=-40)
# 無音部分をトリミング
trimmed_audio = audio[nonsilent_ranges[0][0]: nonsilent_ranges[-1][1]]

これらの注意点を考慮することで、より高品質な音声ファイルの結合が可能になります。

次のステップでは、mp3ファイルの編集について詳しく見ていきます。

応用例：mp3ファイルの編集

mp3ファイルのトリミング

mp3ファイルのトリミングは、特定の部分を切り取って新しい音声ファイルを作成するプロセスです。

pydubでは、AudioSegmentオブジェクトのスライス機能を使用して簡単にトリミングできます。

以下は、mp3ファイルをトリミングするサンプルコードです。

from pydub import AudioSegment
# mp3ファイルを読み込む
audio = AudioSegment.from_file("sample.mp3")
# トリミングする範囲を指定(例：10秒から30秒まで)
start_time = 10 * 1000  # 10秒
end_time = 30 * 1000    # 30秒
trimmed_audio = audio[start_time:end_time]
# トリミング後の音声を保存
trimmed_audio.export("trimmed_sample.mp3", format="mp3")

このコードを実行すると、指定した範囲の音声がtrimmed_sample.mp3として保存されます。

mp3ファイルのフェードイン・フェードアウト

フェードインとフェードアウトは、音声の開始や終了時に音量を徐々に変化させる効果です。

pydubでは、fade_inメソッドとfade_outメソッドを使用して簡単に実装できます。

以下は、フェードインとフェードアウトを適用するサンプルコードです。

from pydub import AudioSegment
# mp3ファイルを読み込む
audio = AudioSegment.from_file("sample.mp3")
# フェードイン(5秒)とフェードアウト(5秒)を適用
faded_audio = audio.fade_in(5000).fade_out(5000)
# フェード処理後の音声を保存
faded_audio.export("faded_sample.mp3", format="mp3")

このコードを実行すると、フェードインとフェードアウトが適用された音声がfaded_sample.mp3として保存されます。

mp3ファイルの音量調整

音量調整は、音声の音量を上げたり下げたりするプロセスです。

pydubでは、apply_gainメソッドを使用して音量を調整できます。

以下は、音量を調整するサンプルコードです。

from pydub import AudioSegment
# mp3ファイルを読み込む
audio = AudioSegment.from_file("sample.mp3")
# 音量を上げる(例：+5dB)
adjusted_audio = audio.apply_gain(5)
# 音量調整後の音声を保存
adjusted_audio.export("adjusted_sample.mp3", format="mp3")

このコードを実行すると、音量が調整された音声がadjusted_sample.mp3として保存されます。

複数のmp3ファイルをクロスフェードで結合する

クロスフェードは、2つの音声ファイルが重なり合う部分で音量が徐々に変化する効果です。

pydubでは、overlayメソッドを使用してクロスフェードを実現できます。

以下は、2つのmp3ファイルをクロスフェードで結合するサンプルコードです。

from pydub import AudioSegment
# 2つのmp3ファイルを読み込む
audio1 = AudioSegment.from_file("sample1.mp3")
audio2 = AudioSegment.from_file("sample2.mp3")
# クロスフェードの時間(例：3秒)
crossfade_duration = 3000  # 3秒
# クロスフェードを適用
crossfaded_audio = audio1.append(audio2, crossfade=crossfade_duration)
# クロスフェード後の音声を保存
crossfaded_audio.export("crossfaded_sample.mp3", format="mp3")

このコードを実行すると、クロスフェードが適用された音声がcrossfaded_sample.mp3として保存されます。

これにより、2つの音声がスムーズに切り替わる効果が得られます。

次のステップでは、mp3ファイルのメタデータ操作について詳しく見ていきます。

応用例：mp3ファイルのメタデータ操作

メタデータの読み込み

mp3ファイルには、タイトル、アーティスト、アルバム名などのメタデータが含まれています。

pydubでは、mutagenライブラリを使用してメタデータを読み込むことができます。

以下は、mp3ファイルのメタデータを読み込むサンプルコードです。

from mutagen.mp3 import MP3
# mp3ファイルを読み込む
audio = MP3("sample.mp3")
# メタデータを表示
print(f"タイトル: {audio.get('TIT2')}")
print(f"アーティスト: {audio.get('TPE1')}")
print(f"アルバム: {audio.get('TALB')}")

このコードを実行すると、指定したmp3ファイルのタイトル、アーティスト、アルバム名が表示されます。

mutagenライブラリを使用することで、簡単にメタデータを取得できます。

メタデータの編集

メタデータを編集するには、mutagenライブラリを使用して、各フィールドに新しい値を設定します。

以下は、mp3ファイルのメタデータを編集するサンプルコードです。

from mutagen.mp3 import MP3
from mutagen.id3 import ID3, TIT2, TPE1, TALB
# mp3ファイルを読み込む
audio = MP3("sample.mp3", ID3=ID3)
# メタデータを編集
audio["TIT2"] = TIT2(encoding=3, text="新しいタイトル")
audio["TPE1"] = TPE1(encoding=3, text="新しいアーティスト")
audio["TALB"] = TALB(encoding=3, text="新しいアルバム")
# 編集したメタデータを保存
audio.save()

このコードを実行すると、指定したmp3ファイルのタイトル、アーティスト、アルバム名が新しい値に更新されます。

結合後のファイルにメタデータを追加する

結合した音声ファイルにメタデータを追加することも可能です。

結合後に新しいmp3ファイルを作成し、そのファイルにメタデータを設定します。

以下は、結合後のファイルにメタデータを追加するサンプルコードです。

from pydub import AudioSegment
from mutagen.mp3 import MP3
from mutagen.id3 import ID3, TIT2, TPE1, TALB
# 2つのmp3ファイルを読み込む
audio1 = AudioSegment.from_file("sample1.mp3")
audio2 = AudioSegment.from_file("sample2.mp3")
# 2つの音声を結合する
combined_audio = audio1 + audio2
# 結合後の音声を保存
combined_audio.export("combined.mp3", format="mp3")
# 結合後のファイルにメタデータを追加
audio = MP3("combined.mp3", ID3=ID3)
audio["TIT2"] = TIT2(encoding=3, text="結合された音声")
audio["TPE1"] = TPE1(encoding=3, text="アーティスト名")
audio["TALB"] = TALB(encoding=3, text="アルバム名")
audio.save()

このコードを実行すると、combined.mp3というファイルに新しいメタデータが追加されます。

これにより、結合した音声ファイルに対しても適切な情報を付加することができます。

次のステップでは、mp3ファイルのフォーマット変換について詳しく見ていきます。

応用例：mp3ファイルのフォーマット変換

mp3から他のフォーマットへの変換

pydubを使用すると、mp3ファイルを他の音声フォーマットに簡単に変換できます。

サポートされているフォーマットには、wav、ogg、flvなどがあります。

以下は、mp3ファイルをwavフォーマットに変換するサンプルコードです。

from pydub import AudioSegment
# mp3ファイルを読み込む
audio = AudioSegment.from_file("sample.mp3")
# wavフォーマットに変換して保存
audio.export("sample.wav", format="wav")

このコードを実行すると、sample.wavという名前でwavフォーマットのファイルが作成されます。

他のフォーマットからmp3への変換

逆に、他の音声フォーマットからmp3フォーマットに変換することも可能です。

以下は、wavファイルをmp3フォーマットに変換するサンプルコードです。

from pydub import AudioSegment
# wavファイルを読み込む
audio = AudioSegment.from_file("sample.wav")
# mp3フォーマットに変換して保存
audio.export("sample_converted.mp3", format="mp3")

このコードを実行すると、sample_converted.mp3という名前でmp3フォーマットのファイルが作成されます。

結合後のファイルを異なるフォーマットで保存する

結合した音声ファイルを異なるフォーマットで保存することもできます。

以下は、2つのmp3ファイルを結合し、その結果をoggフォーマットで保存するサンプルコードです。

from pydub import AudioSegment
# 2つのmp3ファイルを読み込む
audio1 = AudioSegment.from_file("sample1.mp3")
audio2 = AudioSegment.from_file("sample2.mp3")
# 2つの音声を結合する
combined_audio = audio1 + audio2
# 結合後の音声をoggフォーマットで保存
combined_audio.export("combined.ogg", format="ogg")

このコードを実行すると、combined.oggという名前でoggフォーマットのファイルが作成されます。

これにより、結合した音声を異なるフォーマットで保存することができます。

次のステップでは、mp3ファイルに関するよくある質問について詳しく見ていきます。