プロセス

[C言語] 並列処理ができるfork関数の使い方を解説

2025-04-14更新日: 2025-04-14

C言語における並列処理は、主にfork関数を使用して実現されます。

fork関数は、現在のプロセスを複製し、新しいプロセス（子プロセス）を生成します。

この関数は、親プロセスと子プロセスの両方で実行され、戻り値によってどちらのプロセスであるかを判別します。

親プロセスには子プロセスのプロセスIDが返され、子プロセスには0が返されます。

これにより、異なるコードブロックを並列に実行することが可能になります。

目次から探す

fork関数の基本

fork関数とは何か

fork関数は、UNIX系オペレーティングシステムで使用されるシステムコールの一つで、新しいプロセスを生成するために使われます。

この関数を呼び出すと、現在のプロセス(親プロセス)が複製され、新しいプロセス(子プロセス)が作成されます。

親プロセスと子プロセスは、同じプログラムコードを実行しますが、独立したプロセスとして動作します。

プロセスの概念

プロセスとは、実行中のプログラムのインスタンスを指します。

オペレーティングシステムは、各プロセスに対して独立したメモリ空間を割り当て、プロセス間の干渉を防ぎます。

プロセスは、CPU時間やメモリなどのリソースを消費し、複数のプロセスが同時に実行されることで並列処理が可能になります。

fork関数の基本的な使い方

fork関数は、以下のように使用します。

#include <stdio.h>
#include <unistd.h>
int main() {
    pid_t pid = fork(); // 新しいプロセスを生成
    if (pid < 0) {
        // forkが失敗した場合
        perror("fork failed");
        return 1;
    } else if (pid == 0) {
        // 子プロセスの処理
        printf("これは子プロセスです。PID: %d\n", getpid());
    } else {
        // 親プロセスの処理
        printf("これは親プロセスです。PID: %d\n", getpid());
    }
    return 0;
}

これは親プロセスです。PID: 12345
これは子プロセスです。PID: 12346

この例では、fork関数を呼び出すことで、親プロセスと子プロセスがそれぞれのメッセージを出力します。

getpid関数を使って、プロセスIDを取得し、どちらのプロセスが実行されているかを確認できます。

fork関数の戻り値

fork関数は、以下のように異なる戻り値を返します。

戻り値	説明
負の値	`fork`が失敗した場合。
0	子プロセス内での戻り値。
正の値	親プロセス内での戻り値で、生成された子プロセスのプロセスIDを示します。

この戻り値を利用して、親プロセスと子プロセスで異なる処理を行うことができます。

親プロセスと子プロセスの違い

親プロセスと子プロセスは、fork関数を呼び出した時点で同じメモリ空間を共有しますが、forkの呼び出し後は独立したプロセスとして動作します。

以下の点で違いがあります。

プロセスID: 親プロセスと子プロセスは異なるプロセスIDを持ちます。
メモリ空間: fork後は、メモリ空間がコピーされるため、親と子は独立したメモリ空間を持ちます。
実行の流れ: 親プロセスと子プロセスは、forkの戻り値を基に異なる処理を実行できます。

このように、fork関数を利用することで、並列処理を実現することが可能です。

fork関数の実践的な使用方法

プロセスの分岐

fork関数を使用することで、プログラムの実行を親プロセスと子プロセスに分岐させることができます。

これにより、同じプログラム内で異なるタスクを並行して実行することが可能になります。

以下の例では、親プロセスがファイルの読み込みを行い、子プロセスがデータの処理を行うシナリオを示します。

#include <stdio.h>
#include <unistd.h>
int main() {
    pid_t pid = fork();
    if (pid < 0) {
        perror("fork failed");
        return 1;
    } else if (pid == 0) {
        // 子プロセスの処理
        printf("子プロセス: データを処理中...\n");
        // データ処理のコード
    } else {
        // 親プロセスの処理
        printf("親プロセス: ファイルを読み込み中...\n");
        // ファイル読み込みのコード
    }
    return 0;
}

この例では、forkによってプロセスが分岐し、親プロセスと子プロセスがそれぞれ異なるタスクを実行します。

プロセス間のデータ共有

forkによって生成されたプロセスは、独立したメモリ空間を持つため、直接的なデータ共有はできません。

しかし、プロセス間でデータを共有するための方法として、パイプや共有メモリ、ファイルを利用することができます。

以下は、パイプを使用して親プロセスと子プロセス間でデータを共有する例です。

#include <stdio.h>
#include <unistd.h>
#include <string.h>
int main() {
    int pipefd[2];
    char buffer[128];
    const char *message = "こんにちは、子プロセス！";
    if (pipe(pipefd) == -1) {
        perror("pipe failed");
        return 1;
    }
    pid_t pid = fork();
    if (pid < 0) {
        perror("fork failed");
        return 1;
    } else if (pid == 0) {
        // 子プロセス: パイプからデータを読み取る
        close(pipefd[1]); // 書き込み用のファイルディスクリプタを閉じる
        read(pipefd[0], buffer, sizeof(buffer));
        printf("子プロセスが受信: %s\n", buffer);
        close(pipefd[0]);
    } else {
        // 親プロセス: パイプにデータを書き込む
        close(pipefd[0]); // 読み取り用のファイルディスクリプタを閉じる
        write(pipefd[1], message, strlen(message) + 1);
        close(pipefd[1]);
    }
    return 0;
}

子プロセスが受信: こんにちは、子プロセス！

この例では、親プロセスがパイプを通じて子プロセスにメッセージを送信し、子プロセスがそのメッセージを受信して表示します。

プロセスの終了とwait関数

forkによって生成された子プロセスが終了すると、親プロセスはその終了を待つことができます。

wait関数を使用することで、親プロセスは子プロセスの終了を待ち、終了ステータスを取得することができます。

#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>
int main() {
    pid_t pid = fork();
    if (pid < 0) {
        perror("fork failed");
        return 1;
    } else if (pid == 0) {
        // 子プロセスの処理
        printf("子プロセスが終了します。\n");
        return 42; // 終了ステータス
    } else {
        // 親プロセスの処理
        int status;
        wait(&status); // 子プロセスの終了を待つ
        if (WIFEXITED(status)) {
            printf("子プロセスが終了しました。ステータス: %d\n", WEXITSTATUS(status));
        }
    }
    return 0;
}

子プロセスが終了します。
子プロセスが終了しました。ステータス: 42

この例では、親プロセスがwait関数を使用して子プロセスの終了を待ち、終了ステータスを取得して表示します。

エラーハンドリング

fork関数の呼び出しが失敗することがあります。

失敗した場合、forkは負の値を返します。

この場合、適切なエラーハンドリングを行うことが重要です。

以下の例では、forkの失敗を検出し、エラーメッセージを表示します。

#include <stdio.h>
#include <unistd.h>
int main() {
    pid_t pid = fork();
    if (pid < 0) {
        // forkが失敗した場合
        perror("fork failed");
        return 1;
    } else if (pid == 0) {
        // 子プロセスの処理
        printf("子プロセスが実行中です。\n");
    } else {
        // 親プロセスの処理
        printf("親プロセスが実行中です。\n");
    }
    return 0;
}

この例では、forkが失敗した場合にperror関数を使用してエラーメッセージを表示し、プログラムを終了します。

エラーハンドリングを適切に行うことで、プログラムの信頼性を向上させることができます。

fork関数を使った並列処理の実装

並列処理の基本

並列処理とは、複数のプロセスやスレッドが同時に実行されることで、プログラムの処理を効率化する手法です。

これにより、CPUのリソースを最大限に活用し、処理時間を短縮することが可能になります。

並列処理は、特にマルチコアプロセッサを持つシステムで効果を発揮します。

fork関数を用いた並列処理の例

fork関数を使用することで、簡単に並列処理を実装することができます。

以下の例では、forkを用いて複数の子プロセスを生成し、それぞれが独立して計算を行うシナリオを示します。

#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>
void performTask(int taskNumber) {
    printf("プロセス %d がタスク %d を実行中です。\n", getpid(), taskNumber);
    // タスクの処理をここに記述
}
int main() {
    const int numTasks = 3;
    pid_t pids[numTasks];
    for (int i = 0; i < numTasks; i++) {
        pids[i] = fork();
        if (pids[i] < 0) {
            perror("fork failed");
            return 1;
        } else if (pids[i] == 0) {
            // 子プロセスの処理
            performTask(i);
            return 0; // 子プロセスはここで終了
        }
    }
    // 親プロセスはすべての子プロセスの終了を待つ
    for (int i = 0; i < numTasks; i++) {
        waitpid(pids[i], NULL, 0);
    }
    printf("すべてのタスクが完了しました。\n");
    return 0;
}

プロセス 12347 がタスク 0 を実行中です。
プロセス 12348 がタスク 1 を実行中です。
プロセス 12349 がタスク 2 を実行中です。
すべてのタスクが完了しました。

この例では、3つの子プロセスが生成され、それぞれが独立してタスクを実行します。

親プロセスは、すべての子プロセスが終了するのを待ちます。

並列処理のメリットとデメリット

メリット	デメリット
処理速度の向上	リソースの競合
CPUの効率的な利用	デバッグの難しさ
複数タスクの同時実行	プロセス管理の複雑さ

並列処理を利用することで、プログラムの処理速度を向上させることができますが、リソースの競合やデバッグの難しさといった課題も存在します。

これらのデメリットを考慮し、適切に設計することが重要です。

並列処理のデバッグ方法

並列処理のデバッグは、通常のシーケンシャルなプログラムよりも複雑です。

以下の方法を用いることで、デバッグを効率的に行うことができます。

ログ出力: 各プロセスの動作をログに記録し、どのプロセスがどのように動作しているかを確認します。
デバッガの使用: gdbなどのデバッガを使用して、プロセスごとに動作を追跡します。
シンプルなテストケース: 問題を再現しやすいように、シンプルなテストケースを作成してデバッグを行います。
リソースの監視: topやhtopなどのツールを使用して、プロセスのリソース使用状況を監視します。

これらの方法を組み合わせることで、並列処理のデバッグを効果的に行うことができます。

fork関数の応用例

サーバープログラムでの使用

fork関数は、サーバープログラムでクライアントからの接続を処理するために広く使用されます。

サーバーは、クライアントからの接続を受け入れるたびにforkを呼び出し、新しい子プロセスを生成してその接続を処理します。

これにより、サーバーは複数のクライアントを同時に処理することが可能になります。

#include <stdio.h>
#include <unistd.h>
#include <sys/socket.h>
#include <netinet/in.h>
int main() {
    int server_fd, new_socket;
    struct sockaddr_in address;
    int addrlen = sizeof(address);
    // ソケットの作成とバインド、リスニングの設定
    server_fd = socket(AF_INET, SOCK_STREAM, 0);
    address.sin_family = AF_INET;
    address.sin_addr.s_addr = INADDR_ANY;
    address.sin_port = htons(8080);
    bind(server_fd, (struct sockaddr *)&address, sizeof(address));
    listen(server_fd, 3);
    while (1) {
        new_socket = accept(server_fd, (struct sockaddr *)&address, (socklen_t*)&addrlen);
        if (fork() == 0) {
            // 子プロセス: クライアントの接続を処理
            close(server_fd);
            // クライアントとの通信処理
            close(new_socket);
            return 0;
        }
        close(new_socket);
    }
    return 0;
}

この例では、サーバーがクライアントからの接続を受け入れるたびにforkを呼び出し、子プロセスがその接続を処理します。

バッチ処理の並列化

forkを使用することで、バッチ処理を並列化し、処理時間を短縮することができます。

複数のデータセットを同時に処理することで、全体の処理効率を向上させることが可能です。

#include <stdio.h>
#include <unistd.h>
void processBatch(int batchNumber) {
    printf("バッチ %d を処理中です。\n", batchNumber);
    // バッチ処理のコード
}
int main() {
    const int numBatches = 5;
    for (int i = 0; i < numBatches; i++) {
        if (fork() == 0) {
            // 子プロセス: バッチを処理
            processBatch(i);
            return 0;
        }
    }
    // 親プロセスはすべての子プロセスの終了を待つ
    for (int i = 0; i < numBatches; i++) {
        wait(NULL);
    }
    printf("すべてのバッチ処理が完了しました。\n");
    return 0;
}

この例では、5つのバッチを並列に処理し、全体の処理時間を短縮しています。

マルチプロセスによる負荷分散

forkを用いることで、マルチプロセスによる負荷分散を実現できます。

これにより、システムのリソースを効率的に利用し、処理能力を向上させることができます。

特に、CPU集約型のタスクにおいて効果的です。

#include <stdio.h>
#include <unistd.h>
void performHeavyTask(int taskNumber) {
    printf("重いタスク %d を実行中です。\n", taskNumber);
    // 重いタスクの処理
}
int main() {
    const int numTasks = 4;
    for (int i = 0; i < numTasks; i++) {
        if (fork() == 0) {
            // 子プロセス: 重いタスクを実行
            performHeavyTask(i);
            return 0;
        }
    }
    // 親プロセスはすべての子プロセスの終了を待つ
    for (int i = 0; i < numTasks; i++) {
        wait(NULL);
    }
    printf("すべての重いタスクが完了しました。\n");
    return 0;
}

この例では、4つの重いタスクを並列に実行し、システムの負荷を分散しています。

プロセスプールの実装

プロセスプールは、一定数のプロセスを事前に生成しておき、タスクを効率的に処理するための手法です。

forkを用いてプロセスプールを実装することで、プロセス生成のオーバーヘッドを削減し、タスクの処理を迅速に行うことができます。

#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>
void handleTask() {
    printf("プロセス %d がタスクを処理中です。\n", getpid());
    // タスクの処理
}
int main() {
    const int poolSize = 3;
    pid_t pids[poolSize];
    for (int i = 0; i < poolSize; i++) {
        if ((pids[i] = fork()) == 0) {
            // 子プロセス: タスクを処理
            handleTask();
            return 0;
        }
    }
    // 親プロセスはすべての子プロセスの終了を待つ
    for (int i = 0; i < poolSize; i++) {
        waitpid(pids[i], NULL, 0);
    }
    printf("すべてのタスクがプロセスプールで処理されました。\n");
    return 0;
}

この例では、3つのプロセスをプールとして生成し、それぞれがタスクを処理します。

プロセスプールを使用することで、プロセスの生成と終了のオーバーヘッドを削減し、効率的なタスク処理が可能になります。