ビデオ

[Python] mp4から音声を抜き出してwavに変換する方法

2025-04-15更新日: 2025-04-15

PythonでMP4から音声を抜き出してWAVに変換するには、moviepyやpydubなどのライブラリを使用できます。

moviepyを使う場合、VideoFileClipでMP4ファイルを読み込み、audio.write_audiofile()でWAV形式に変換します。

pydubを使う場合は、ffmpegが必要で、AudioSegmentを利用してMP4から音声を抽出し、WAV形式で保存します。

どちらの方法も簡単に音声を抽出・変換できます。

目次から探す

MP4から音声を抽出してWAVに変換する方法の概要
moviepyを使った音声抽出とWAV変換
pydubを使った音声抽出とWAV変換
ffmpegを直接使った音声抽出とWAV変換
応用例：他の音声フォーマットへの変換
応用例：音声の編集と加工
応用例：複数ファイルの一括変換
まとめ

MP4から音声を抽出してWAVに変換する方法の概要

音声ファイルの形式にはさまざまな種類がありますが、MP4は主に動画ファイルとして使用される形式で、WAVは音声ファイルの一種です。

この記事では、MP4ファイルから音声を抽出し、WAV形式に変換する方法について解説します。

MP4とWAVの違いとは？

特徴	MP4	WAV
用途	動画ファイル	音声ファイル
圧縮方式	圧縮(ロスあり)	非圧縮(ロスなし)
ファイルサイズ	小さい	大きい
音質	圧縮により劣化する可能性あり	高音質(劣化なし)

MP4は動画と音声を同時に扱えるため、主に動画コンテンツで使用されます。

一方、WAVは音声専用のフォーマットで、音質が高く、音声編集や音楽制作に適しています。

Pythonで音声を抽出・変換するためのライブラリ

Pythonには、音声を抽出・変換するための便利なライブラリがいくつかあります。

以下は代表的なライブラリです。

ライブラリ名	概要
moviepy	動画編集に特化したライブラリ
pydub	音声処理に特化したライブラリ
ffmpeg	高機能なマルチメディア処理ツール

これらのライブラリを使用することで、MP4から音声を抽出し、WAV形式に変換することが容易になります。

必要な環境と準備

音声抽出と変換を行うためには、以下の環境を整える必要があります。

Pythonのインストール: Python 3.xをインストールします。
必要なライブラリのインストール: 使用するライブラリをpipでインストールします。

moviepyの場合: pip install moviepy
pydubの場合: pip install pydub
ffmpegの場合: ffmpegを公式サイトからダウンロードし、環境変数にパスを設定します。

これらの準備が整ったら、実際にMP4から音声を抽出し、WAV形式に変換する手順に進むことができます。

moviepyを使った音声抽出とWAV変換

Pythonのmoviepyライブラリを使用すると、MP4ファイルから音声を簡単に抽出し、WAV形式に変換することができます。

以下では、moviepyの基本情報やインストール方法、具体的な手順について解説します。

moviepyとは？

moviepyは、Pythonで動画編集を行うためのライブラリです。

動画のカット、結合、音声の抽出、エフェクトの追加など、さまざまな機能を提供しています。

特に音声処理においても強力で、MP4ファイルから音声を抽出して他の形式に変換することが容易です。

moviepyのインストール方法

moviepyをインストールするには、以下のコマンドをターミナルまたはコマンドプロンプトで実行します。

pip install moviepy

これにより、moviepyとその依存関係が自動的にインストールされます。

MP4から音声を抽出する手順

MP4ファイルから音声を抽出するための基本的なコードは以下の通りです。

from moviepy.editor import VideoFileClip
# MP4ファイルを読み込む
video = VideoFileClip("input_video.mp4")
# 音声を抽出する
audio = video.audio

このコードでは、VideoFileClipを使用してMP4ファイルを読み込み、その音声部分を抽出しています。

抽出した音声をWAV形式で保存する方法

抽出した音声をWAV形式で保存するには、以下のコードを追加します。

# 音声をWAV形式で保存する
audio.write_audiofile("output_audio.wav", codec='pcm_s16le')

このコードにより、抽出した音声がoutput_audio.wavという名前で保存されます。

codec='pcm_s16le'はWAV形式の標準的なコーデックです。

エラーハンドリングと注意点

音声抽出や変換を行う際には、以下の点に注意が必要です。

ファイルパスの確認: 指定したMP4ファイルのパスが正しいか確認してください。
ファイル形式の確認: 対応していないファイル形式を指定するとエラーが発生します。
エラーハンドリング: 例外処理を追加することで、エラー発生時に適切な対応が可能です。

以下は、エラーハンドリングの例です。

try:
    video = VideoFileClip("input_video.mp4")
    audio = video.audio
    audio.write_audiofile("output_audio.wav", codec='pcm_s16le')
except Exception as e:
    print(f"エラーが発生しました: {e}")

このようにすることで、エラーが発生した際にその内容を表示することができます。

pydubを使った音声抽出とWAV変換

pydubは、音声処理に特化したPythonのライブラリで、音声ファイルの読み込み、編集、変換が簡単に行えます。

ここでは、pydubを使用してMP4ファイルから音声を抽出し、WAV形式に変換する方法について解説します。

pydubとは？

pydubは、音声ファイルの操作を簡単に行うためのライブラリです。

音声のトリミング、結合、音量調整、エフェクトの追加など、多くの機能を提供しています。

特に、異なる音声フォーマット間の変換が得意です。

pydubのインストール方法とffmpegの設定

pydubを使用するには、まずライブラリをインストールする必要があります。

また、音声ファイルの変換にはffmpegが必要です。

pydubのインストール:

以下のコマンドをターミナルまたはコマンドプロンプトで実行します。

   pip install pydub

ffmpegのインストール:

Windowsの場合: ffmpegの公式サイトからダウンロードし、解凍後、binフォルダ内のffmpeg.exeのパスを環境変数に追加します。
macOSの場合: Homebrewを使用してインストールできます。

   brew install ffmpeg

ffmpegのパス設定:

pydubがffmpegを正しく認識できるように、以下のように設定します。

   from pydub import AudioSegment
   AudioSegment.converter = "ffmpegのパス"

MP4から音声を抽出する手順

MP4ファイルから音声を抽出するための基本的なコードは以下の通りです。

from pydub import AudioSegment
# MP4ファイルを読み込む
audio = AudioSegment.from_file("input_video.mp4", format="mp4")

このコードでは、AudioSegment.from_fileを使用してMP4ファイルを読み込み、音声データを取得しています。

抽出した音声をWAV形式で保存する方法

抽出した音声をWAV形式で保存するには、以下のコードを追加します。

# 音声をWAV形式で保存する
audio.export("output_audio.wav", format="wav")

このコードにより、抽出した音声がoutput_audio.wavという名前で保存されます。

pydubを使う際の注意点

pydubを使用する際には、以下の点に注意が必要です。

ffmpegのインストール: pydubは音声ファイルの変換にffmpegを使用するため、必ずインストールしておく必要があります。
ファイル形式の確認: 対応していないファイル形式を指定するとエラーが発生します。
メモリ使用量: 大きな音声ファイルを扱う場合、メモリを多く消費することがありますので、注意が必要です。

これらの注意点を理解しておくことで、pydubをより効果的に活用することができます。

ffmpegを直接使った音声抽出とWAV変換

ffmpegは、音声や動画の処理を行うための強力なコマンドラインツールです。

多くのフォーマットに対応しており、音声の抽出や変換を効率的に行うことができます。

ここでは、ffmpegを使用してMP4ファイルから音声を抽出し、WAV形式に変換する方法について解説します。

ffmpegとは？

ffmpegは、音声や動画の変換、編集、ストリーミングを行うためのオープンソースのソフトウェアです。

多くのフォーマットに対応しており、非常に高機能で柔軟性があります。

コマンドラインベースで動作するため、スクリプトやプログラムからも簡単に呼び出すことができます。

ffmpegのインストール方法

ffmpegをインストールする方法は、使用しているOSによって異なります。

Windowsの場合:

ffmpegの公式サイトからWindows用のビルドをダウンロードします。
ZIPファイルを解凍し、binフォルダ内のffmpeg.exeを任意の場所に配置します。
環境変数にffmpeg.exeのパスを追加します。

macOSの場合:

Homebrewを使用してインストールできます。

  brew install ffmpeg

Linuxの場合:

パッケージマネージャを使用してインストールできます。

  sudo apt-get install ffmpeg

Pythonからffmpegを呼び出す方法

Pythonからffmpegを呼び出すには、subprocessモジュールを使用します。

以下のように記述します。

import subprocess
# ffmpegコマンドを実行する関数
def run_ffmpeg(command):
    subprocess.run(command, shell=True, check=True)

この関数を使用して、ffmpegのコマンドを実行することができます。

MP4から音声を抽出する手順

MP4ファイルから音声を抽出するためのffmpegコマンドは以下の通りです。

# MP4ファイルから音声を抽出するコマンド
command = "ffmpeg -i input_video.mp4 -q:a 0 -map a output_audio.mp3"
run_ffmpeg(command)

このコマンドでは、-iオプションで入力ファイルを指定し、-map aで音声ストリームを選択しています。

-q:a 0は音質を最高に設定するオプションです。

抽出した音声をWAV形式で保存する方法

抽出した音声をWAV形式で保存するには、以下のようにコマンドを変更します。

# MP4ファイルから音声をWAV形式で保存するコマンド
command = "ffmpeg -i input_video.mp4 output_audio.wav"
run_ffmpeg(command)

このコマンドにより、MP4ファイルから音声が抽出され、output_audio.wavという名前で保存されます。

ffmpegを使用することで、音声の抽出や変換が非常に効率的に行えるため、特に大量のファイルを処理する際に便利です。

応用例：他の音声フォーマットへの変換

MP4ファイルから音声を抽出する際、WAV形式だけでなく、他の音声フォーマットへの変換も可能です。

ここでは、MP4からMP3、OGG、FLACへの変換方法について解説します。

MP4からMP3への変換

MP3は、音声ファイルの中で最も一般的なフォーマットの一つです。

ffmpegを使用してMP4からMP3に変換する方法は以下の通りです。

# MP4ファイルからMP3形式で保存するコマンド
command = "ffmpeg -i input_video.mp4 -q:a 0 -map a output_audio.mp3"
run_ffmpeg(command)

このコマンドでは、-q:a 0オプションを使用して音質を最高に設定しています。

これにより、MP4ファイルから高品質のMP3音声が生成されます。

MP4からOGGへの変換

OGGは、オープンソースの音声フォーマットで、特に音質が良いとされています。

MP4からOGGに変換する方法は以下の通りです。

# MP4ファイルからOGG形式で保存するコマンド
command = "ffmpeg -i input_video.mp4 -c:a libvorbis output_audio.ogg"
run_ffmpeg(command)

このコマンドでは、-c:a libvorbisオプションを使用して、OGGフォーマットに適したコーデックを指定しています。

MP4からFLACへの変換

FLACは、ロスレス圧縮音声フォーマットで、高音質を保ちながらファイルサイズを小さくすることができます。

MP4からFLACに変換する方法は以下の通りです。

# MP4ファイルからFLAC形式で保存するコマンド
command = "ffmpeg -i input_video.mp4 output_audio.flac"
run_ffmpeg(command)

このコマンドでは、特にコーデックを指定する必要はなく、ffmpegが自動的にFLAC形式で保存します。

これらの方法を使用することで、MP4ファイルからさまざまな音声フォーマットに変換することができ、用途に応じた音声ファイルを作成することが可能です。

応用例：音声の編集と加工

音声ファイルを単に抽出するだけでなく、編集や加工を行うことで、より使いやすい音声データを作成することができます。

ここでは、音声のトリミング、音量調整、フィルタリングについて解説します。

音声のトリミング

音声のトリミングは、不要な部分をカットして必要な部分だけを残す作業です。

pydubを使用して音声をトリミングする方法は以下の通りです。

from pydub import AudioSegment
# 音声ファイルを読み込む
audio = AudioSegment.from_file("input_audio.wav")
# トリミングする開始時間と終了時間(ミリ秒)
start_time = 10000  # 10秒
end_time = 30000    # 30秒
# 音声をトリミングする
trimmed_audio = audio[start_time:end_time]
# トリミングした音声を保存する
trimmed_audio.export("trimmed_audio.wav", format="wav")

このコードでは、10秒から30秒の部分をトリミングし、新しいファイルとして保存しています。

音声の音量調整

音声の音量を調整することで、聞きやすさを向上させることができます。

pydubを使用して音量を調整する方法は以下の通りです。

from pydub import AudioSegment
# 音声ファイルを読み込む
audio = AudioSegment.from_file("input_audio.wav")
# 音量を上げる(+5dB)
louder_audio = audio + 5
# 音量を下げる(-5dB)
quieter_audio = audio - 5
# 調整した音声を保存する
louder_audio.export("louder_audio.wav", format="wav")
quieter_audio.export("quieter_audio.wav", format="wav")

このコードでは、音量を5dB上げた音声と5dB下げた音声をそれぞれ保存しています。

音声のフィルタリング

音声のフィルタリングは、特定の周波数帯域を強調したり、カットしたりする処理です。

pydubでは、簡単なフィルタリングを行うことができますが、より高度なフィルタリングにはscipyなどのライブラリを使用することが一般的です。

ここでは、pydubを使った基本的なフィルタリングの例を示します。

from pydub import AudioSegment
from pydub.playback import play
# 音声ファイルを読み込む
audio = AudioSegment.from_file("input_audio.wav")
# 高音域を強調するためのフィルタリング
filtered_audio = audio.high_pass_filter(3000)  # 3000Hz以上を通過させる
# フィルタリングした音声を保存する
filtered_audio.export("filtered_audio.wav", format="wav")
# フィルタリングした音声を再生する
play(filtered_audio)

このコードでは、3000Hz以上の高音域を通過させる高域通過フィルターを適用しています。

フィルタリング後の音声は新しいファイルとして保存され、再生も可能です。

これらの編集や加工を行うことで、音声ファイルをより効果的に活用することができます。

応用例：複数ファイルの一括変換

複数のMP4ファイルから音声を一括で抽出し、変換することは、特に大量のデータを扱う際に非常に便利です。

ここでは、複数ファイルの一括変換方法、エラーハンドリング、処理速度を向上させるための工夫について解説します。

複数のMP4ファイルから音声を一括抽出する方法

ffmpegを使用して、複数のMP4ファイルから音声を一括で抽出する方法は以下の通りです。

ここでは、Pythonのosモジュールを使用して、指定したディレクトリ内のすべてのMP4ファイルを処理します。

import os
import subprocess
# MP4ファイルが格納されているディレクトリ
input_directory = "path/to/mp4/files"
output_directory = "path/to/output/files"
# ディレクトリ内のすべてのMP4ファイルを取得
for filename in os.listdir(input_directory):
    if filename.endswith(".mp4"):
        input_file = os.path.join(input_directory, filename)
        output_file = os.path.join(output_directory, f"{os.path.splitext(filename)[0]}.wav")
        
        # ffmpegコマンドを実行
        command = f"ffmpeg -i \"{input_file}\" \"{output_file}\""
        subprocess.run(command, shell=True, check=True)

このコードでは、指定したディレクトリ内のすべてのMP4ファイルをループ処理し、それぞれのファイルからWAV形式の音声を抽出しています。

一括変換時のエラーハンドリング

一括変換を行う際には、エラーが発生する可能性があります。

エラーハンドリングを追加することで、処理を中断せずに続行することができます。

以下は、エラーハンドリングを追加した例です。

for filename in os.listdir(input_directory):
    if filename.endswith(".mp4"):
        input_file = os.path.join(input_directory, filename)
        output_file = os.path.join(output_directory, f"{os.path.splitext(filename)[0]}.wav")
        
        try:
            # ffmpegコマンドを実行
            command = f"ffmpeg -i \"{input_file}\" \"{output_file}\""
            subprocess.run(command, shell=True, check=True)
            print(f"{filename} の変換が成功しました。")
        except subprocess.CalledProcessError as e:
            print(f"{filename} の変換中にエラーが発生しました: {e}")

このコードでは、tryブロック内でffmpegコマンドを実行し、エラーが発生した場合にはexceptブロックでエラーメッセージを表示します。

処理速度を向上させるための工夫

複数のファイルを一括で処理する際、処理速度を向上させるための工夫がいくつかあります。

並列処理: Pythonのconcurrent.futuresモジュールを使用して、複数の変換を同時に実行することができます。

   from concurrent.futures import ProcessPoolExecutor
   def convert_file(input_file, output_file):
       command = f"ffmpeg -i \"{input_file}\" \"{output_file}\""
       subprocess.run(command, shell=True, check=True)
   with ProcessPoolExecutor() as executor:
       futures = []
       for filename in os.listdir(input_directory):
           if filename.endswith(".mp4"):
               input_file = os.path.join(input_directory, filename)
               output_file = os.path.join(output_directory, f"{os.path.splitext(filename)[0]}.wav")
               futures.append(executor.submit(convert_file, input_file, output_file))

バッチ処理: 一度に多くのファイルを処理することで、I/Oオーバーヘッドを減らすことができます。
ffmpegのオプション最適化: ffmpegのコマンドに適切なオプションを指定することで、処理速度を向上させることができます。

例えば、-threadsオプションを使用して、使用するスレッド数を指定することができます。

これらの工夫を取り入れることで、複数ファイルの一括変換を効率的に行うことができます。