アルゴリズム

[C言語] 2変量正規分布の実装と応用方法

2025-04-15更新日: 2025-04-15

2変量正規分布は、2つの変数が正規分布に従い、相関を持つ場合の分布を表します。

C言語での実装には、まず平均ベクトルと共分散行列を定義し、乱数生成ライブラリを用いて標準正規分布から乱数を生成します。

次に、Cholesky分解を用いて共分散行列を分解し、生成した乱数に適用して2変量正規分布の乱数を得ます。

応用として、金融データのモデリングや、機械学習におけるデータ生成、シミュレーションなどで利用されます。

目次から探す

2変量正規分布とは
C言語での2変量正規分布の実装
2変量正規分布の応用例
まとめ

2変量正規分布とは

2変量正規分布は、2つの変数が同時に正規分布に従う確率分布の一種です。

この分布は、統計学やデータ分析、機械学習などの分野で広く利用されています。

2変量正規分布は、2次元のデータを扱う際に、そのデータの相関関係や分布の形状を理解するために役立ちます。

2変量正規分布の基本

2変量正規分布は、2つの変数 \(X\) と \(Y\) がそれぞれ正規分布に従い、さらにこれらの変数間に相関がある場合に用いられます。

2変量正規分布は、以下のような確率密度関数(PDF)で表されます：

\[f(x, y) = \frac{1}{2\pi \sigma_X \sigma_Y \sqrt{1-\rho^2}} \exp\left(-\frac{1}{2(1-\rho^2)} \left[ \frac{(x-\mu_X)^2}{\sigma_X^2} + \frac{(y-\mu_Y)^2}{\sigma_Y^2} – \frac{2\rho(x-\mu_X)(y-\mu_Y)}{\sigma_X \sigma_Y} \right] \right)\]

ここで、\(\mu_X\) と \(\mu_Y\) はそれぞれの平均、\(\sigma_X\) と \(\sigma_Y\) は標準偏差、\(\rho\) は相関係数を表します。

平均ベクトルと共分散行列

2変量正規分布は、平均ベクトルと共分散行列によって特徴付けられます。

平均ベクトル: \(\mu = \begin{bmatrix} \mu_X \ \mu_Y \end{bmatrix}\)
共分散行列: \(\Sigma = \begin{bmatrix} \sigma_X^2 & \rho \sigma_X \sigma_Y \ \rho \sigma_X \sigma_Y & \sigma_Y^2 \end{bmatrix}\)

平均ベクトルは、各変数の平均値を表し、共分散行列は変数間の分散と共分散を表します。

共分散行列の対角成分は各変数の分散を示し、非対角成分は変数間の共分散を示します。

2変量正規分布の特性

2変量正規分布には以下の特性があります：

対称性: 分布は平均ベクトルを中心に対称です。
楕円形の等高線: 確率密度関数の等高線は楕円形を形成し、相関係数 \(\rho\) によって楕円の形状が変わります。
独立性: \(\rho = 0\) の場合、2つの変数は独立であり、2変量正規分布はそれぞれの変数の1変量正規分布の積となります。

これらの特性を理解することで、2変量正規分布を用いたデータ分析やモデリングがより効果的に行えます。

C言語での2変量正規分布の実装

C言語で2変量正規分布を実装するには、数学的な計算を行うためのライブラリを利用し、乱数生成や行列計算を行う必要があります。

以下では、必要なライブラリの設定から、2変量正規分布の乱数生成までの手順を解説します。

必要なライブラリと環境設定

C言語で2変量正規分布を実装するためには、以下のライブラリが必要です。

math.h: 数学的な関数を利用するために必要です。
stdlib.h: 乱数生成に必要です。
time.h: 乱数のシード設定に使用します。

これらのライブラリをインクルードすることで、必要な数学的計算や乱数生成が可能になります。

#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#include <time.h>

平均ベクトルと共分散行列の定義

2変量正規分布を定義するために、平均ベクトルと共分散行列を設定します。

これらは、分布の中心と形状を決定します。

double mean[2] = {0.0, 0.0}; // 平均ベクトル
double covariance[2][2] = {{1.0, 0.5}, {0.5, 1.0}}; // 共分散行列

標準正規分布からの乱数生成

標準正規分布に従う乱数を生成するために、Box-Muller法を使用します。

この方法は、2つの一様乱数から2つの標準正規乱数を生成します。

double generateStandardNormal() {
    double u1 = (double)rand() / RAND_MAX;
    double u2 = (double)rand() / RAND_MAX;
    return sqrt(-2.0 * log(u1)) * cos(2.0 * M_PI * u2);
}

Cholesky分解の実装

共分散行列をCholesky分解し、下三角行列を取得します。

この行列を用いて、標準正規乱数を2変量正規乱数に変換します。

void choleskyDecomposition(double matrix[2][2], double lower[2][2]) {
    lower[0][0] = sqrt(matrix[0][0]);
    lower[1][0] = matrix[1][0] / lower[0][0];
    lower[1][1] = sqrt(matrix[1][1] - lower[1][0] * lower[1][0]);
}

2変量正規分布の乱数生成

Cholesky分解を用いて、標準正規乱数を2変量正規乱数に変換します。

void generateBivariateNormal(double mean[2], double covariance[2][2], double result[2]) {
    double lower[2][2];
    choleskyDecomposition(covariance, lower);
    double z[2] = {generateStandardNormal(), generateStandardNormal()};
    result[0] = mean[0] + lower[0][0] * z[0];
    result[1] = mean[1] + lower[1][0] * z[0] + lower[1][1] * z[1];
}

完成したプログラム

以下に、2変量正規分布の乱数を生成するプログラムの全体を示します。

#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#include <time.h>
double generateStandardNormal() {
    double u1 = (double)rand() / RAND_MAX;
    double u2 = (double)rand() / RAND_MAX;
    return sqrt(-2.0 * log(u1)) * cos(2.0 * M_PI * u2);
}
void choleskyDecomposition(double matrix[2][2], double lower[2][2]) {
    lower[0][0] = sqrt(matrix[0][0]);
    lower[1][0] = matrix[1][0] / lower[0][0];
    lower[1][1] = sqrt(matrix[1][1] - lower[1][0] * lower[1][0]);
}
void generateBivariateNormal(double mean[2], double covariance[2][2], double result[2]) {
    double lower[2][2];
    choleskyDecomposition(covariance, lower);
    double z[2] = {generateStandardNormal(), generateStandardNormal()};
    result[0] = mean[0] + lower[0][0] * z[0];
    result[1] = mean[1] + lower[1][0] * z[0] + lower[1][1] * z[1];
}
int main() {
    srand(time(NULL));
    double mean[2] = {0.0, 0.0};
    double covariance[2][2] = {{1.0, 0.5}, {0.5, 1.0}};
    double result[2];
    generateBivariateNormal(mean, covariance, result);
    printf("Generated Bivariate Normal Random Variables: (%f, %f)\n", result[0], result[1]);
    return 0;
}

このプログラムは、2変量正規分布に従う乱数を生成し、結果を出力します。

srand(time(NULL))を使用して乱数のシードを設定することで、毎回異なる乱数を生成します。