OpenCV

【C++】OpenCVによるカラートラッキング実装：リアルタイム物体追跡の基本手法

2025-04-22更新日: 2025-04-22

C++とOpenCVを使い、特定の色を持つ物体の位置や大きさの変化に柔軟に反応する追跡技術です。

まずカメラ映像を取得し、RGBからHSVへ色空間を変換して指定の色域を抽出します。

CamShiftなどのアルゴリズムを活用して、リアルタイムで物体を追跡できるため、動的なシーンにおいても安定したパフォーマンスが期待できます。

目次から探す

C/C++を使った求人

読み込み中…

C++とOpenCVの連携

ライブラリの導入

C++とOpenCVを使うと、画像処理に必要な機能を簡単に利用できる仕組みが整っています。

基本的なライブラリのインクルードは以下のように記述します。

#include <opencv2/opencv.hpp>  // OpenCVの基本機能を利用するためのヘッダ
#include <iostream>            // 入出力処理のためのヘッダ
// main関数からプログラムが始まるサンプルコード
int main() {
    // カメラの初期化を行うためVideoCaptureオブジェクトを作成
    cv::VideoCapture cap(0);
    if(!cap.isOpened()){
        std::cerr << "カメラが初期化できませんでした" << std::endl;
        return -1;
    }
    cv::Mat frame;
    // カメラから1フレーム読み込む
    cap >> frame;
    if(frame.empty()){
        std::cerr << "フレームが取得できませんでした" << std::endl;
        return -1;
    }
    // 取得したフレームをウィンドウで表示する
    cv::imshow("Camera Frame", frame);
    cv::waitKey(0); // キー入力待ち
    return 0;
}

カメラ映像のウィンドウが表示され、キー入力後に終了

上記のコードは、OpenCVの基本ライブラリと入出力のヘッダを用いて、カメラからの映像を取得し表示するサンプルコードです。

最初のフレームしかレンダリングしないため、画面が固まるのは正常です。

コード内のコメントで、各処理の概要を日本語で記述してあり、初めて利用する場合にも理解しやすくなっています。

基本データ構造の利用

OpenCVにおける画像や動画のデータは、特定のデータ構造で扱います。

これにより、複雑な画像処理をシンプルな記述で実装できるようになります。

cv::Matの扱い

画像データはcv::Mat型で管理され、行列形式でピクセル情報が保持されます。

利用例として、画像の読み込みや加工が簡単にできる点が魅力です。

例えば、画像のサイズを取得して新しい画像へコピーする処理は以下の通りです。

#include <opencv2/opencv.hpp>
#include <iostream>
int main() {
    cv::Mat srcImage = cv::imread("sample.jpg"); // 画像ファイルを読み込む
    if(srcImage.empty()){
        std::cerr << "画像が読み込めませんでした" << std::endl;
        return -1;
    }
    // 画像のサイズ情報を取得
    int width = srcImage.cols;
    int height = srcImage.rows;
    std::cout << "画像サイズ: " << width << " x " << height << std::endl;
    // srcImageを別のMat型にコピーする
    cv::Mat dstImage = srcImage.clone();
    cv::imshow("Copied Image", dstImage);
    cv::waitKey(0);
    return 0;
}

画像サイズ: 1536 x 1024

cv::Matを使うと、画像の処理だけでなく、画像のコピー、変形、フィルタ処理など多数の機能が直感的に利用できる点が大きなメリットです。

cv::VideoCaptureの使用方法

動画の取得やカメラ映像のキャプチャにはcv::VideoCaptureが用いられます。

オブジェクト化して初期化するだけで、デバイスやファイルからの映像読み込みが可能となります。

処理の流れとして、ビデオストリームの初期化、フレームの取得、映像の表示など一連の流れが簡単に実装できる点が人気です。

#include <opencv2/opencv.hpp>
#include <iostream>
int main(){
    cv::VideoCapture cap(0); // カメラのデバイスID 0を指定
    if(!cap.isOpened()){
        std::cerr << "カメラの読み込みに失敗しました" << std::endl;
        return -1;
    }
    cv::Mat frame;
    while(true){
        cap >> frame; // フレームの取得
        if(frame.empty()){
            break;
        }
        cv::imshow("Live Frame", frame);
        if(cv::waitKey(30) >= 0){
            break; // キー入力でループから脱出
        }
    }
    return 0;
}

ライブ映像がウィンドウに表示され、キー入力でループが終了

動画フレームの取得と前処理

カメラ映像の取得

カメラ映像は、先ほどのようにcv::VideoCaptureを利用すれば簡単に取得できる仕組みになっています。

各フレームはcv::Mat型として格納され、リアルタイムに画像処理を行う基盤となります。

カメラや動画ファイルから連続的にフレームを取り出し、ループ内で処理を進めます。

フレームのリサイズと正規化

映像のフレームは、処理速度の点からもサイズを統一してから利用する方が望ましいことが多いです。

リサイズ処理を行い、必要に応じてピクセル値の正規化や輝度調整を行うことで、後の色抽出や追跡処理の精度が向上します。

例えば、以下のコードは映像フレームを一定のサイズにリサイズする例です。

#include <opencv2/opencv.hpp>
#include <iostream>
int main(){
    cv::VideoCapture cap(0);
    if(!cap.isOpened()){
        std::cerr << "カメラの初期化に失敗しました" << std::endl;
        return -1;
    }
    cv::Mat frame, resizedFrame;
    while(true){
        cap >> frame;
        if(frame.empty()){
            break;
        }
        // 640x480のサイズにリサイズ
        cv::resize(frame, resizedFrame, cv::Size(640, 480));
        cv::imshow("Resized Frame", resizedFrame);
        if(cv::waitKey(30) >= 0){
            break;
        }
    }
    return 0;
}

ウィンドウに640x480のサイズへリサイズされた映像が表示され、キー入力により終了

カラーフォーマットの確認

画像や映像のカラーフォーマットは、様々な変換やフィルタ処理の前提となる情報です。

特にRGBやBGRの違いは混乱を招くことがあるため、扱うカラーフォーマットの確認は非常に重要です。

OpenCVはデフォルトでBGRフォーマットを利用するため、他のフォーマットとの相互変換を行う際には注意が必要です。

フレームの読み込み後にカラーフォーマットを変更するコード例は以下のようになります。

#include <opencv2/opencv.hpp>
#include <iostream>
int main(){
    cv::VideoCapture cap(0);
    if(!cap.isOpened()){
        std::cerr << "カメラが開けませんでした" << std::endl;
        return -1;
    }
    cv::Mat frame, rgbFrame;
    while(true){
        cap >> frame;
        if(frame.empty()){
            break;
        }
        // BGRからRGBへの変換
        cv::cvtColor(frame, rgbFrame, cv::COLOR_BGR2RGB);
        cv::imshow("RGB Frame", rgbFrame);
        if(cv::waitKey(30) >= 0){
            break;
        }
    }
    return 0;
}

RGBに変換された映像がウィンドウに表示される

色空間変換の仕組み

RGBからHSVへの変換

通常、画像はRGBまたはBGRで管理されるが、カラートラッキングのためにはHSV色空間が便利です。

HSVは色相(Hue)、彩度(Saturation)、明度(Value)の3要素で構成されるため、特定の色を抽出する際にピッタリの形式となります。

変換はcv::cvtColor関数を利用して簡単に実現でき、処理後の画像は特定の色範囲を直感的に設定できるようになります。

以下は、RGBからHSVへの変換のサンプルコードとなります。

#include <opencv2/opencv.hpp>
#include <iostream>
int main(){
    cv::VideoCapture cap(0);
    if(!cap.isOpened()){
        std::cerr << "カメラ初期化に失敗しました" << std::endl;
        return -1;
    }
    cv::Mat frame, hsvFrame;
    while(true){
        cap >> frame;
        if(frame.empty()){
            break;
        }
        // RGB(BGR)画像をHSV画像に変換
        cv::cvtColor(frame, hsvFrame, cv::COLOR_BGR2HSV);
        cv::imshow("HSV Frame", hsvFrame);
        if(cv::waitKey(30) >= 0){
            break;
        }
    }
    return 0;
}

HSV色空間に変換された映像がウィンドウに表示される

変換処理の注意点

色空間変換では、入力画像のカラーデータが正確に変換されるかどうかに注意が必要です。

特に、カメラの設定や環境光によりRGB値が変動するため、変換後のHSV値が安定しない場合があります。

環境に応じたキャリブレーションを行うか、動的なパラメータ調整を実施する必要があります。

色調補正のポイント

色調補正は、明るさや色の再現性を保つための大事な処理です。

例えば、画像全体のヒストグラム平坦化やコントラスト調整を行うことで、低照度や逆光の状況でも適切な色抽出が可能になります。

調整パラメータは環境に合わせて変更し、サンプルコードなどで確認しながら最適値を探すと良いでしょう。

HSV色空間を活用した色抽出

HSV色空間は特定の色を抽出するのに最適な形式です。

たとえば、赤や青といった特徴的な色味を持つ物体は、明確な閾値を定義することで抽出が容易になります。

ここでは、色域設定とマスク処理による対象領域の抽出について詳しく見ていきます。

色域の設定

色抽出のためには、対象とする色域を正確に定義する必要があります。

これには、色相、彩度、明度それぞれに対する閾値設定が重要となります。

色相(Hue)の調整

色相は対象の色の主な違いを表す値です。

例えば、赤色の範囲を抽出するには、色相の値を\( H_{min} \)から\( H_{max} \)の範囲に設定する必要があります。

実際のコード例では、以下のように設定できます。

#include <opencv2/opencv.hpp>
#include <iostream>
int main(){
    cv::VideoCapture cap(0);
    if(!cap.isOpened()){
        std::cerr << "カメラ読み込み失敗" << std::endl;
        return -1;
    }
    cv::Mat frame, hsvFrame, mask;
    while(true){
        cap >> frame;
        if(frame.empty()){
            break;
        }
        // BGRからHSVへの変換
        cv::cvtColor(frame, hsvFrame, cv::COLOR_BGR2HSV);
        // 赤色の閾値設定\( (H_{min}, S_{min}, V_{min}) \)〜\( (H_{max}, S_{max}, V_{max}) \)
        cv::Scalar lower_red(0, 100, 100);
        cv::Scalar upper_red(10, 255, 255);
        cv::inRange(hsvFrame, lower_red, upper_red, mask);
        cv::imshow("Red Mask", mask);
        if(cv::waitKey(30) >= 0){
            break;
        }
    }
    return 0;
}

赤色の対象が抽出されたマスク映像がウィンドウに表示される

彩度(Saturation)と明度(Value)の設定

彩度と明度は、物体の色の鮮明さと明るさを示すパラメータです。

これらを適切に設定することで、微妙な照度の違いにも対応する抽出が可能となります。

設定値は実際の撮影環境や対象物の特性に合わせるのが良いでしょう。

マスク処理による対象領域の抽出

対象の色域が定義できたら、次はマスク処理で必要な領域を抽出します。

cv::inRange関数を利用して設定した閾値内のピクセルを抽出し、対象物を強調表示させることが可能になる点が魅力です。

マスク生成の方法

マスクの生成は、対象領域を白、その他の領域を黒として表現します。

これにより、後続の処理で物体の位置や形状をよりシンプルに扱えるようになるため、追跡アルゴリズムとの連携がしやすくなります。

#include <opencv2/opencv.hpp>
#include <iostream>
int main(){
    cv::VideoCapture cap(0);
    if(!cap.isOpened()){
        std::cerr << "カメラ読み込み失敗" << std::endl;
        return -1;
    }
    cv::Mat frame, hsvFrame, mask;
    while(true){
        cap >> frame;
        if(frame.empty()){
            break;
        }
        cv::cvtColor(frame, hsvFrame, cv::COLOR_BGR2HSV);
        // 対象の色範囲を設定(例：赤色)
        cv::Scalar lower_red(0, 100, 100);
        cv::Scalar upper_red(10, 255, 255);
        cv::inRange(hsvFrame, lower_red, upper_red, mask);
        cv::imshow("Red Mask", mask);
        if(cv::waitKey(30) >= 0){
            break;
        }
    }
    return 0;
}

抽出された赤色領域が白く映し出される映像がウィンドウに表示

追跡アルゴリズムの適用

物体追跡アルゴリズムは、連続するフレーム中における対象物の位置変動を推測するための技術です。

OpenCVはcv::CamShiftなどのアルゴリズムを提供し、マスク処理した映像を基に対象の位置や向きを柔軟に追跡する仕組みが用意されています。

CamShiftアルゴリズムの特徴

CamShiftは、対象物のヒストグラムを使った追跡アルゴリズムで、追跡時に対象物のサイズや形状が変化しても対応可能なため、動く物体にも強い処理となっています。

物体位置の推定

CamShiftは、最初に物体のヒストグラムを生成し、バックプロジェクション画像を元に物体の位置を推定します。

対象物の初期位置が決まれば、連続するフレーム上でも追跡が継続される仕組みです。

平滑化や前処理を施すことで誤検知を減らすことができるので、初期設定は慎重に行うと良いでしょう。

領域更新の処理流れ

追跡中は、対象領域が徐々に変化していくため、逐次的な領域更新が必要となります。

コード例では、cv::CamShift関数を用いて対象物の新しい位置とサイズを取得する処理が含まれます。

以下は簡単なサンプルコードで、追跡領域の更新手順を表現しています。

#include <opencv2/opencv.hpp>
#include <iostream>
int main(){
    cv::VideoCapture cap(0);
    if(!cap.isOpened()){
        std::cerr << "カメラ初期化失敗" << std::endl;
        return -1;
    }
    cv::Mat frame, hsvFrame, mask;
    // 初期対象領域を手動で指定(例として固定矩形)
    cv::Rect trackWindow(200, 150, 100, 100);
    // ヒストグラム用の変数
    cv::Mat roi, roiHist;
    // 最初のフレームでROIとヒストグラムを計算
    cap >> frame;
    cv::cvtColor(frame, hsvFrame, cv::COLOR_BGR2HSV);
    roi = hsvFrame(trackWindow);
    // 対象領域のヒストグラムを計算。Hue成分のみ利用
    int channels[] = {0};
    int histSize[] = {16};
    float hranges[] = {0, 180};
    const float* ranges[] = {hranges};
    cv::calcHist(&roi, 1, channels, cv::Mat(), roiHist, 1, histSize, ranges);
    // ヒストグラムの値を正規化
    cv::normalize(roiHist, roiHist, 0, 255, cv::NORM_MINMAX);
    while(true){
        cap >> frame;
        if(frame.empty()){
            break;
        }
        cv::cvtColor(frame, hsvFrame, cv::COLOR_BGR2HSV);
        // バックプロジェクションの計算
        cv::Mat backProj;
        cv::calcBackProject(&hsvFrame, 1, channels, roiHist, backProj, ranges);
        // CamShiftによる追跡
        cv::RotatedRect trackBox = cv::CamShift(backProj, trackWindow,
                                                 cv::TermCriteria(cv::TermCriteria::EPS | cv::TermCriteria::COUNT, 10, 1));
        // 追跡領域を描画する
        cv::ellipse(frame, trackBox, cv::Scalar(0, 255, 0), 2);
        cv::imshow("CamShift Tracking", frame);
        if(cv::waitKey(30) >= 0){
            break;
        }
    }
    return 0;
}

ウィンドウに緑色の楕円が追跡対象を示して表示、物体の移動に応じて楕円が更新

バックプロジェクションの活用

バックプロジェクションは、画像中の各ピクセルが対象のヒストグラムにどの程度合致しているかを示す処理です。

これにより、対象の分布に基づいた追跡が可能となります。

ピクセル分布の解析

対象のヒストグラムを元に、画像全体に対してピクセル分布を計算し、どの位置が対象の可能性が高いかを示す画像を生成します。

各ピクセルの値は対象色に近いほど高くなるため、対象領域が明確に浮かび上がります。

追跡領域の再定義

バックプロジェクション結果に基づき、追跡アルゴリズム(CamShiftなど)は対象領域を再定義します。

これにより、動きや環境変化に敏感に反応し、追跡の精度が維持される仕組みとなっています。

パラメータの調整と評価

色抽出パラメータの設定

色抽出と追跡の精度は、各種パラメータの適切な調整によって支えられています。

環境や撮影状況により、閾値やノイズ除去の方法を臨機応変に変更する必要があるため、こまめにパラメータのチューニングを行うと良いでしょう。

閾値設定の工夫

色抽出においては、HSVの各成分に対する下限値と上限値の設定が重要です。

例えば、薄暗い場所では明度の下限値を引き下げるなど、撮影環境に応じた調整が求められます。

また、対象物の特性に合わせ、色相の範囲を広く設定するか、狭く設定するか決めることで、誤検知を防止できます。

ノイズ除去の手法

画像処理においては、背景や光の乱れによるノイズが生じやすいため、マスク処理の後に平滑化フィルタ(例：GaussianBlur)やモルフォロジー処理(例：erode, dilate)を適用して、ノイズの影響を軽減する工夫をすると良いです。

これにより、追跡対象の輪郭がより明瞭となり、誤検知のリスクが減少します。

追跡精度の評価

トラッキングシステムの精度評価は、システムを実運用させる前に必ず行っておくべき重要なプロセスです。

各種評価指標やテストシナリオに基づいて、追跡の信頼性を検証することが求められます。

誤検知の原因分析

追跡中に誤った領域が対象と判断される場合、バックプロジェクション画像や抽出されたマスク画像を元に、環境光や対象物の色の変化が要因かを確認します。

原因となるパラメータを調整することで、誤検知の発生率を下げるよう努めると良いでしょう。

軌跡の安定性検証

追跡結果がブレや急激な変動なく滑らかに更新されているか、軌跡の各フレームを比較して評価することが重要です。

連続するフレームごとに対象物の中心位置が大きくずれていないか、追跡の安定性を数値やグラフで示すと、改善ポイントが明確になります。

デバッグと結果の可視化

追跡領域の描画方法

追跡領域を可視化することで、処理結果の確認が容易になり、デバッグがしやすくなります。

描画には、矩形や楕円といったシンプルな形状を用いる方法が一般的です。

バウンディングボックスの実装

対象物の追跡領域をバウンディングボックスで囲む方法は、比較的実装が簡単です。

cv::rectangle関数を用いることで、対象の矩形領域を強調表示できるため、視認性が向上します。

描画したバウンディングボックスで追跡の正確性や対象物の動きを簡単に確認できるのがメリットです。

軌跡表示の工夫

追跡対象が移動する際、過去の位置を線で繋ぐことで、軌跡を視覚的に示すことができます。

例えば、毎フレームの中心点を記録し、cv::line関数を使って過去の中心点と現在の中心点を結ぶと、滑らかな軌跡が浮かび上がるため、パフォーマンスの評価に役立ちます。

出力結果の解析手法

出力結果の解析は、検出精度や追跡範囲の確認に欠かせない作業です。

抽出された情報をテキストやグラフ、表形式で整理することで、システム全体の挙動が理解しやすくなります。

指標の算出方法

追跡対象の動きや面積、中心位置の変動など、様々な指標を算出することで、システムの状態を数値的に評価できます。

例えば、各フレームの対象領域の面積を計測し、平均値や分散値を求めると、追跡の安定性が数値として確認できます。

また、エラー率や誤検出率を算出することで、改善すべきポイントが明確になります。

ビジュアルデバッグの方法

ビジュアルデバッグでは、追跡の各段階で生成される画像(例：マスク画像、バックプロジェクション画像、追跡領域描画済みの画像)を順次ウィンドウ表示することで、どの処理段階で問題が発生しているかを視覚的に確認できるようになります。

また、ウィンドウ上に文字情報をオーバーレイする方法(cv::putText関数を利用)も活用すると、リアルタイムでパラメータの値や処理状況を表示でき、デバッグがより容易になります。

まとめ

今回の記事では、C++とOpenCVを活用したカラートラッキングの実装方法について、ライブラリの導入から動画フレームの取得、前処理、そして色空間変換および追跡アルゴリズムの適用までの流れを柔らかい文体で紹介しました。

各工程において、サンプルコードを利用しながら各処理の考え方や手法を詳しく示し、処理結果の可視化やデバッグ、パラメータ調整のポイントも取り上げました。

これらの技術を組み合わせることで、シンプルながらも実用性の高いカラートラッキングシステムが構築できることをお伝えできたなら嬉しいです。

さらに自分なりの改良を加えることで、環境に応じた柔軟な実装や新たな発展が期待でき、日々の作業の効率向上やプロジェクトの発展につながることでしょう。

参考文献