スレッド

[Python] マルチスレッドで複数のスレッドを同期させる方法

2025-04-15更新日: 2025-04-15

Pythonでマルチスレッドを使用する際、複数のスレッドを同期させるために、threadingモジュールが提供する様々な同期プリミティブを活用します。

代表的なものにLock、RLock、Semaphore、Event、Conditionがあります。

Lockはスレッド間で共有されるリソースへのアクセスを制御し、RLockは再帰的にロックを取得できます。

Semaphoreはカウンタを持ち、複数のスレッドが同時にリソースを使用することを許可します。

Eventはスレッド間でのフラグの設定と待機を行い、Conditionは複雑なスレッド間の通信を可能にします。

目次から探す

スレッドの同期
スレッドプール
応用例
まとめ

スレッドの同期

同期の必要性

マルチスレッドプログラミングでは、複数のスレッドが同時に同じリソースにアクセスすることがあります。

この場合、データの整合性を保つためにスレッドの同期が必要です。

同期を行わないと、データ競合や不整合が発生し、プログラムが予期しない動作をする可能性があります。

スレッドの同期を行うことで、リソースへのアクセスを制御し、安定した動作を実現します。

ロック(Lock)オブジェクト

ロックは、スレッドが共有リソースにアクセスする際に、他のスレッドがそのリソースにアクセスできないようにするための仕組みです。

Pythonでは、threadingモジュールを使用してロックを作成できます。

ロックの取得と解放

以下のサンプルコードでは、ロックを取得し、リソースにアクセスした後にロックを解放する方法を示します。

import threading
# 共有リソース
shared_resource = 0
lock = threading.Lock()
def increment():
    global shared_resource
    lock.acquire()  # ロックを取得
    shared_resource += 1
    lock.release()  # ロックを解放
# スレッドの作成と実行
threads = [threading.Thread(target=increment) for _ in range(10)]
for thread in threads:
    thread.start()
for thread in threads:
    thread.join()
print(shared_resource)  # 出力: 10

このコードでは、10個のスレッドが同時にincrement関数を実行し、共有リソースを安全にインクリメントしています。

ロックを使用することで、データ競合を防いでいます。

デッドロックの回避方法

デッドロックは、複数のスレッドが互いにロックを待ち続ける状態です。

これを回避するためには、以下の方法があります。

ロックの取得順序を統一する
タイムアウトを設定してロックを取得できない場合は解放する
必要なロックを一度に取得する

RLock(再帰ロック)

RLockは、同じスレッドが複数回ロックを取得できる特別なロックです。

通常のロックでは、同じスレッドがロックを再度取得しようとすると、デッドロックが発生しますが、RLockを使用することでこれを防げます。

RLockの使い方

以下のサンプルコードでは、RLockを使用して同じスレッドがロックを再度取得する例を示します。

import threading
# 共有リソース
shared_resource = 0
rlock = threading.RLock()
def recursive_increment(count):
    global shared_resource
    rlock.acquire()  # RLockを取得
    if count > 0:
        shared_resource += 1
        recursive_increment(count - 1)  # 再帰呼び出し
    rlock.release()  # RLockを解放
recursive_increment(5)
print(shared_resource)  # 出力: 5

このコードでは、recursive_increment関数が再帰的に呼び出される際に、RLockを使用してロックを管理しています。

RLockの利点と欠点

利点: 同じスレッドが複数回ロックを取得できるため、再帰的な処理に適している。
欠点: 通常のロックよりもオーバーヘッドが大きくなるため、パフォーマンスに影響を与える可能性がある。

セマフォ(Semaphore)

セマフォは、特定の数のスレッドが同時にリソースにアクセスできるように制御するための仕組みです。

Pythonでは、threadingモジュールのSemaphoreクラスを使用します。

セマフォの基本概念

セマフォは、カウンタを持ち、カウンタが0になるまでスレッドがリソースにアクセスできるようにします。

カウンタが減少することで、同時にアクセスできるスレッドの数を制限します。

セマフォの使い方

以下のサンプルコードでは、セマフォを使用して同時に2つのスレッドがリソースにアクセスできるように制御しています。

import threading
import time
# セマフォの作成
semaphore = threading.Semaphore(2)
def access_resource(thread_id):
    with semaphore:  # セマフォを取得
        print(f"スレッド {thread_id} がリソースにアクセス中...")
        time.sleep(2)  # リソースの使用
        print(f"スレッド {thread_id} がリソースの使用を終了しました。")
# スレッドの作成と実行
threads = [threading.Thread(target=access_resource, args=(i,)) for i in range(5)]
for thread in threads:
    thread.start()
for thread in threads:
    thread.join()

このコードでは、5つのスレッドが同時にリソースにアクセスしようとしますが、セマフォによって同時にアクセスできるのは2つのスレッドまでに制限されています。

イベント(Event)

イベントは、スレッド間での通知を行うための仕組みです。

あるスレッドが特定の条件を満たしたときに、他のスレッドに通知を送ることができます。

イベントの基本概念

イベントは、内部的にフラグを持ち、フラグが立っているかどうかでスレッドの動作を制御します。

フラグが立っている場合、待機しているスレッドは実行を再開します。

イベントの使い方

以下のサンプルコードでは、イベントを使用してスレッド間の通知を行っています。

import threading
import time
# イベントの作成
event = threading.Event()
def wait_for_event():
    print("スレッドがイベントを待機中...")
    event.wait()  # イベントが立つまで待機
    print("イベントが発生しました！")
# スレッドの作成と実行
thread = threading.Thread(target=wait_for_event)
thread.start()
time.sleep(2)  # 2秒待機
event.set()  # イベントを立てる
thread.join()

このコードでは、wait_for_event関数がイベントを待機しており、メインスレッドが2秒後にイベントを立てることで、待機しているスレッドが再開します。

コンディション(Condition)

コンディションは、スレッド間での待機と通知を行うための仕組みです。

特定の条件が満たされるまでスレッドを待機させ、条件が満たされたときに他のスレッドを通知します。

コンディションの基本概念

コンディションは、ロックと組み合わせて使用され、スレッドが特定の条件を満たすまで待機することができます。

条件が満たされたときに、待機しているスレッドに通知を送ります。

コンディションの使い方

以下のサンプルコードでは、コンディションを使用してスレッド間の通知を行っています。

import threading
# コンディションの作成
condition = threading.Condition()
shared_data = []
def producer():
    global shared_data
    with condition:
        shared_data.append(1)  # データを追加
        condition.notify()  # 待機しているスレッドに通知
def consumer():
    with condition:
        while not shared_data:  # データがない場合は待機
            condition.wait()
        print("データを消費しました。")
# スレッドの作成と実行
prod_thread = threading.Thread(target=producer)
cons_thread = threading.Thread(target=consumer)
cons_thread.start()
prod_thread.start()
prod_thread.join()
cons_thread.join()

このコードでは、producer関数がデータを追加し、consumer関数がデータが追加されるのを待機しています。

データが追加されると、notifyメソッドによって待機しているスレッドが再開します。

スレッドプール

スレッドプールの基本

スレッドプールは、あらかじめ一定数のスレッドを生成し、タスクを効率的に処理するための仕組みです。

スレッドを毎回生成するのではなく、プールからスレッドを取得してタスクを実行し、タスクが完了したらスレッドをプールに戻します。

これにより、スレッドの生成と破棄にかかるオーバーヘッドを削減し、リソースの効率的な利用が可能になります。

スレッドプールは、特にI/Oバウンドな処理や多数の短時間のタスクを処理する際に有効です。

concurrent.futuresモジュールの使用

Pythonのconcurrent.futuresモジュールを使用すると、スレッドプールを簡単に実装できます。

このモジュールには、ThreadPoolExecutorクラスが含まれており、スレッドプールの管理を行います。

以下のサンプルコードでは、ThreadPoolExecutorを使用して複数のタスクを並行して実行する例を示します。

from concurrent.futures import ThreadPoolExecutor
import time
def task(n):
    print(f"タスク {n} を実行中...")
    time.sleep(1)  # 模擬的な処理
    return f"タスク {n} が完了しました。"
# スレッドプールの作成
with ThreadPoolExecutor(max_workers=3) as executor:
    results = executor.map(task, range(5))
# 結果の表示
for result in results:
    print(result)

このコードでは、最大3つのスレッドを持つスレッドプールを作成し、5つのタスクを並行して実行しています。

executor.mapメソッドを使用することで、タスクの結果を簡単に取得できます。

スレッドプールの利点と欠点

利点	欠点
スレッドの生成コストを削減できる	スレッド数が固定されているため、過負荷になる可能性がある
リソースの効率的な利用が可能	スレッドの数が多すぎると、コンテキストスイッチのオーバーヘッドが増加する
簡単にタスクを並行処理できる	タスクの実行順序が保証されない場合がある

スレッドプールを使用することで、スレッド管理が簡素化され、効率的なタスク処理が可能になりますが、適切なスレッド数の設定やタスクの特性に応じた設計が重要です。

応用例

Webスクレイピングでのマルチスレッド

Webスクレイピングでは、複数のページを同時に取得することで、データ収集の効率を大幅に向上させることができます。

マルチスレッドを使用することで、各スレッドが異なるURLにアクセスし、データを並行して取得できます。

以下のサンプルコードは、requestsライブラリを使用して複数のURLからデータを取得する例です。

import requests
import threading
urls = [
    "http://example.com/page1",
    "http://example.com/page2",
    "http://example.com/page3",
]
def fetch_url(url):
    response = requests.get(url)
    print(f"{url} のステータスコード: {response.status_code}")
threads = [threading.Thread(target=fetch_url, args=(url,)) for url in urls]
for thread in threads:
    thread.start()
for thread in threads:
    thread.join()

このコードでは、3つのURLに対してスレッドを作成し、同時にデータを取得しています。

これにより、全体の処理時間を短縮できます。

データベース操作の効率化

データベースへのアクセスは、I/Oバウンドな処理であるため、マルチスレッドを使用することで効率化できます。

複数のスレッドが同時にデータベースにクエリを送信し、結果を取得することで、全体の処理時間を短縮できます。

以下のサンプルコードは、SQLiteデータベースに対してマルチスレッドでデータを挿入する例です。

import sqlite3
import threading
def insert_data(value):
    conn = sqlite3.connect('example.db')
    cursor = conn.cursor()
    cursor.execute("INSERT INTO my_table (value) VALUES (?)", (value,))
    conn.commit()
    conn.close()
threads = [threading.Thread(target=insert_data, args=(i,)) for i in range(10)]
for thread in threads:
    thread.start()
for thread in threads:
    thread.join()

このコードでは、10個のスレッドが同時にデータを挿入しています。

これにより、データベースへの書き込み処理が効率化されます。

大量ファイルの並列処理

大量のファイルを処理する場合、マルチスレッドを使用することで、ファイルの読み込みや書き込みを並行して行うことができます。

これにより、全体の処理時間を短縮できます。

以下のサンプルコードは、複数のファイルを同時に読み込む例です。

import threading
file_names = ["file1.txt", "file2.txt", "file3.txt"]
def read_file(file_name):
    with open(file_name, 'r') as file:
        data = file.read()
        print(f"{file_name} の内容: {data[:50]}")  # 最初の50文字を表示
threads = [threading.Thread(target=read_file, args=(file_name,)) for file_name in file_names]
for thread in threads:
    thread.start()
for thread in threads:
    thread.join()

このコードでは、3つのファイルを同時に読み込んでいます。

これにより、ファイル処理の効率が向上します。

リアルタイムデータ処理

リアルタイムデータ処理では、データの取得と処理を同時に行う必要があります。

マルチスレッドを使用することで、データの取得を行うスレッドと、取得したデータを処理するスレッドを分けることができます。

以下のサンプルコードは、データを取得し、処理する例です。

import threading
import time
import random
data_queue = []
def data_producer():
    while True:
        data = random.randint(1, 100)
        data_queue.append(data)
        print(f"データを生成: {data}")
        time.sleep(1)  # 1秒ごとにデータを生成
def data_consumer():
    while True:
        if data_queue:
            data = data_queue.pop(0)
            print(f"データを処理: {data}")
        time.sleep(1)  # 1秒ごとにデータを処理
producer_thread = threading.Thread(target=data_producer)
consumer_thread = threading.Thread(target=data_consumer)
producer_thread.start()
consumer_thread.start()

このコードでは、データを生成するスレッドと、生成されたデータを処理するスレッドが同時に動作しています。

これにより、リアルタイムでデータを処理することが可能になります。

ゲーム開発におけるマルチスレッド

ゲーム開発では、マルチスレッドを使用して、ゲームの描画、物理演算、AI処理などを並行して行うことが一般的です。

これにより、ゲームのパフォーマンスを向上させ、スムーズなプレイ体験を提供できます。

以下のサンプルコードは、ゲームの描画とAI処理を別々のスレッドで実行する例です。

import threading
import time
def render():
    while True:
        print("ゲームを描画中...")
        time.sleep(0.1)  # 描画処理の模擬
def ai_processing():
    while True:
        print("AI処理を実行中...")
        time.sleep(0.5)  # AI処理の模擬
render_thread = threading.Thread(target=render)
ai_thread = threading.Thread(target=ai_processing)
render_thread.start()
ai_thread.start()