画像

[Python] opencvで画像の類似度を求める方法

2025-04-15更新日: 2025-04-15

OpenCVを使用して画像の類似度を求める方法はいくつかあります。

代表的な方法として、ヒストグラム比較と構造類似度(SSIM)があります。

ヒストグラム比較では、cv2.calcHistで画像のヒストグラムを計算し、cv2.compareHistで類似度を比較します。

SSIMは、skimage.metrics.structural_similarityを使って画像の構造的な類似度を評価します。

これらの方法は、画像の内容や目的に応じて使い分けることが重要です。

目次から探す

OpenCVで画像の類似度を求める基本的な方法
ヒストグラムを用いた画像の類似度比較
構造類似度(SSIM)を用いた画像の類似度比較
特徴量マッチングを用いた画像の類似度比較
テンプレートマッチングを用いた画像の類似度比較
応用例：画像検索エンジンの構築
応用例：画像の重複検出
応用例：動画フレーム間の類似度比較
まとめ

OpenCVで画像の類似度を求める基本的な方法

画像の類似度とは？

画像の類似度とは、2つの画像がどれだけ似ているかを定量的に評価する指標です。

類似度を測る方法はいくつかあり、主に以下のような要素が考慮されます。

色の分布
形状や構造
テクスチャ

これらの要素を基に、画像間の距離や相関を計算することで、類似度を求めます。

類似度が高いほど、画像は似ていると判断されます。

OpenCVとは？

OpenCV(Open Source Computer Vision Library)は、コンピュータビジョンや画像処理のためのオープンソースライブラリです。

Pythonを含む多くのプログラミング言語で利用可能で、以下のような機能を提供しています。

画像の読み込み・表示・保存
画像のフィルタリングや変換
特徴量の検出とマッチング
機械学習を用いた画像解析

OpenCVを使用することで、画像処理のタスクを効率的に実行できます。

画像の類似度を求める際の一般的なアプローチ

画像の類似度を求める方法は多岐にわたりますが、一般的なアプローチは以下の通りです。

アプローチ	説明
ヒストグラム比較	画像の色分布をヒストグラムとして表現し、比較する方法。
構造類似度(SSIM)	画像の構造的な情報を考慮して類似度を計算する方法。
特徴量マッチング	画像内の特徴点を検出し、マッチングを行う方法。
テンプレートマッチング	画像内の特定のパターンを探す方法。

これらの方法はそれぞれ異なる特性を持ち、用途に応じて使い分けることが重要です。

OpenCVで画像を読み込む方法

OpenCVを使用して画像を読み込むには、cv2.imread関数を使用します。

以下は、画像を読み込むサンプルコードです。

import cv2
# 画像を読み込む
image = cv2.imread('path/to/image.jpg')
# 画像を表示する
cv2.imshow('Loaded Image', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

このコードでは、指定したパスの画像を読み込み、ウィンドウに表示します。

cv2.waitKey(0)は、キーが押されるまでウィンドウを表示し続けるための関数です。

画像を表示した後は、cv2.destroyAllWindows()でウィンドウを閉じます。

ヒストグラムを用いた画像の類似度比較

ヒストグラムとは？

ヒストグラムは、画像内のピクセルの色や明るさの分布を表現するグラフです。

横軸には色の値(例えば、明るさや色相)、縦軸にはその色のピクセル数が示されます。

ヒストグラムを用いることで、画像の特徴を数値的に表現し、異なる画像間の比較が可能になります。

主に以下のような情報を提供します。

画像の明るさの分布
色の偏り
コントラストの強さ

OpenCVでヒストグラムを計算する方法

OpenCVを使用してヒストグラムを計算するには、cv2.calcHist関数を使用します。

以下は、画像のヒストグラムを計算するサンプルコードです。

import cv2
import numpy as np
import matplotlib.pyplot as plt
# 画像を読み込む
image = cv2.imread('path/to/image.jpg')
# ヒストグラムを計算する
hist = cv2.calcHist([image], [0], None, [256], [0, 256])
# ヒストグラムを表示する
plt.plot(hist)
plt.title('Histogram')
plt.xlabel('Pixel Value')
plt.ylabel('Frequency')
plt.show()

このコードでは、指定した画像のヒストグラムを計算し、Matplotlibを使用して表示します。

cv2.calcHist関数の引数には、画像、チャンネル、マスク、ビン数、範囲を指定します。

cv2.compareHistを使ったヒストグラムの比較

OpenCVでは、cv2.compareHist関数を使用して2つのヒストグラムを比較することができます。

この関数は、さまざまな手法(例えば、相関、ユークリッド距離、カイ二乗など)を用いてヒストグラムの類似度を計算します。

以下は、ヒストグラムを比較するサンプルコードです。

import cv2
# 2つの画像を読み込む
image1 = cv2.imread('path/to/image1.jpg')
image2 = cv2.imread('path/to/image2.jpg')
# ヒストグラムを計算する
hist1 = cv2.calcHist([image1], [0], None, [256], [0, 256])
hist2 = cv2.calcHist([image2], [0], None, [256], [0, 256])
# ヒストグラムを比較する
similarity = cv2.compareHist(hist1, hist2, cv2.HISTCMP_CORREL)
print(f'ヒストグラムの類似度: {similarity}')

ヒストグラムの類似度: 0.9967426773549225

このコードでは、2つの画像のヒストグラムを計算し、相関係数を用いて類似度を比較しています。

出力される値は、1に近いほど類似度が高いことを示します。

ヒストグラム比較のメリットとデメリット

ヒストグラムを用いた画像の類似度比較には、以下のようなメリットとデメリットがあります。

メリット	デメリット
簡単に計算できる	画像の構造情報を無視する
色の分布を考慮できる	明るさやコントラストの違いに敏感
計算が高速	画像の回転やスケールに対して不変ではない

ヒストグラム比較は、色の分布を考慮した簡単な方法ですが、画像の構造や形状を考慮しないため、他の手法と組み合わせて使用することが推奨されます。

構造類似度(SSIM)を用いた画像の類似度比較

SSIMとは？

SSIM(Structural Similarity Index Measure)は、2つの画像の類似度を評価するための指標で、特に人間の視覚特性を考慮した方法です。

SSIMは、画像の明るさ、コントラスト、構造の3つの要素を基にして、画像間の類似度を計算します。

値は-1から1の範囲で、1に近いほど画像が似ていることを示します。

SSIMは、従来のピクセルベースの比較方法よりも、より信頼性の高い結果を提供します。

SSIMの理論的背景

SSIMは、以下の3つの要素を考慮して計算されます。

明るさ(L): 画像の平均輝度を比較します。
コントラスト(C): 画像のコントラストを比較します。
構造(S): 画像の構造的な情報を比較します。

これらの要素を組み合わせて、SSIMは次のように定義されます。

\[SSIM(x, y) = \frac{(2\mu_x\mu_y + C_1)(2\sigma_{xy} + C_2)}{(\mu_x^2 + \mu_y^2 + C_1)(\sigma_x^2 + \sigma_y^2 + C_2)}\]

ここで、\(\mu_x\)と\(\mu_y\)はそれぞれの画像の平均輝度、\(\sigma_x^2\)と\(\sigma_y^2\)は分散、\(\sigma_{xy}\)は共分散、\(C_1\)と\(C_2\)は安定化定数です。

skimage.metrics.structural_similarityを使ったSSIMの計算

Pythonのskimageライブラリを使用すると、簡単にSSIMを計算できます。

以下は、SSIMを計算するサンプルコードです。

import cv2
from skimage.metrics import structural_similarity as ssim
# 画像を読み込む
image1 = cv2.imread('path/to/image1.jpg', cv2.IMREAD_GRAYSCALE)
image2 = cv2.imread('path/to/image2.jpg', cv2.IMREAD_GRAYSCALE)
# SSIMを計算する
similarity_index, _ = ssim(image1, image2, full=True)
print(f'SSIMの類似度: {similarity_index}')

このコードでは、2つの画像をグレースケールで読み込み、skimage.metrics.structural_similarity関数を使用してSSIMを計算しています。

出力される値は、1に近いほど画像が似ていることを示します。

SSIMのメリットとデメリット

SSIMを用いた画像の類似度比較には、以下のようなメリットとデメリットがあります。

メリット	デメリット
人間の視覚特性を考慮している	計算がヒストグラム比較よりも重い
構造的な情報を考慮できる	画像のサイズが異なる場合に不適切
明るさやコントラストの違いに強い	ノイズに敏感な場合がある

SSIMは、特に画像の品質評価や圧縮効果の評価において有用ですが、使用する際にはその特性を理解しておくことが重要です。

SSIMの実装例

以下は、2つの画像のSSIMを計算し、類似度を出力する実装例です。

import cv2
from skimage.metrics import structural_similarity as ssim
# 画像を読み込む
image1 = cv2.imread('path/to/image1.jpg', cv2.IMREAD_GRAYSCALE)
image2 = cv2.imread('path/to/image2.jpg', cv2.IMREAD_GRAYSCALE)
# SSIMを計算する
similarity_index, _ = ssim(image1, image2, full=True)
# 結果を表示する
print(f'SSIMの類似度: {similarity_index}')

このコードを実行すると、2つの画像のSSIMの類似度が出力されます。

類似度が高いほど、画像は似ていると判断されます。

特徴量マッチングを用いた画像の類似度比較

特徴量マッチングとは？

特徴量マッチングは、画像内の特定の特徴点を検出し、それらの特徴点を比較することで画像の類似度を評価する手法です。

この方法は、画像の回転やスケールの変化に対しても頑健であり、特に物体認識や画像検索において広く利用されています。

特徴量マッチングは、以下のステップで行われます。

特徴点の検出
特徴量の記述
特徴点のマッチング

SIFT, SURF, ORBなどの特徴量検出アルゴリズム

特徴量マッチングには、さまざまなアルゴリズムが存在します。

代表的なものには以下があります。

アルゴリズム	説明
SIFT	スケール不変特徴変換(Scale-Invariant Feature Transform)で、スケールや回転に対して頑健。
SURF	加速されたスケール不変特徴変換(Speeded-Up Robust Features)で、SIFTよりも高速。
ORB	Oriented FAST and Rotated BRIEFで、計算が軽量でリアルタイム処理に適している。

これらのアルゴリズムは、画像の特徴点を検出し、それに基づいて特徴量を記述します。

OpenCVで特徴量を検出する方法

OpenCVを使用して特徴量を検出するには、まずアルゴリズムを選択し、次に画像から特徴点を検出します。

以下は、ORBを使用して特徴点を検出するサンプルコードです。

import cv2
# 画像を読み込む
image = cv2.imread('path/to/image.jpg')
# ORBオブジェクトを作成
orb = cv2.ORB_create()
# 特徴点を検出
keypoints, descriptors = orb.detectAndCompute(image, None)
# 特徴点を描画
image_with_keypoints = cv2.drawKeypoints(image, keypoints, None, color=(0, 255, 0))
# 結果を表示
cv2.imshow('Keypoints', image_with_keypoints)
cv2.waitKey(0)
cv2.destroyAllWindows()

このコードでは、ORBを使用して画像から特徴点を検出し、それを描画して表示します。

cv2.BFMatcherを使った特徴量マッチング

特徴量マッチングを行うには、cv2.BFMatcher(Brute Force Matcher)を使用します。

このクラスは、特徴量のマッチングを行うための便利なメソッドを提供します。

以下は、特徴量をマッチングするサンプルコードです。

import cv2
# 2つの画像を読み込む
image1 = cv2.imread('path/to/image1.jpg')
image2 = cv2.imread('path/to/image2.jpg')
# ORBオブジェクトを作成
orb = cv2.ORB_create()
# 特徴点を検出
keypoints1, descriptors1 = orb.detectAndCompute(image1, None)
keypoints2, descriptors2 = orb.detectAndCompute(image2, None)
# BFMatcherを作成
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
# 特徴量をマッチング
matches = bf.match(descriptors1, descriptors2)
# マッチング結果を描画
matches = sorted(matches, key=lambda x: x.distance)
matched_image = cv2.drawMatches(image1, keypoints1, image2, keypoints2, matches[:10], None, flags=cv2.DrawMatchesFlags_NOT_DRAW_SINGLE_POINTS)
# 結果を表示
cv2.imshow('Matches', matched_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

このコードでは、2つの画像の特徴点を検出し、cv2.BFMatcherを使用してマッチングを行い、最も良いマッチング結果を描画して表示します。

特徴量マッチングの実装例

以下は、特徴量マッチングを用いて2つの画像の類似度を評価する実装例です。

import cv2
# 2つの画像を読み込む
image1 = cv2.imread('path/to/image1.jpg')
image2 = cv2.imread('path/to/image2.jpg')
# ORBオブジェクトを作成
orb = cv2.ORB_create()
# 特徴点を検出
keypoints1, descriptors1 = orb.detectAndCompute(image1, None)
keypoints2, descriptors2 = orb.detectAndCompute(image2, None)
# BFMatcherを作成
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
# 特徴量をマッチング
matches = bf.match(descriptors1, descriptors2)
# マッチング結果を描画
matches = sorted(matches, key=lambda x: x.distance)
matched_image = cv2.drawMatches(image1, keypoints1, image2, keypoints2, matches[:10], None, flags=cv2.DrawMatchesFlags_NOT_DRAW_SINGLE_POINTS)
# 結果を表示
cv2.imshow('Matches', matched_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

このコードを実行すると、2つの画像の特徴点がマッチングされ、最も良いマッチング結果が表示されます。

特徴量マッチングは、画像の類似度を評価する強力な手法であり、特に物体認識や画像検索において有用です。

テンプレートマッチングを用いた画像の類似度比較

テンプレートマッチングとは？

テンプレートマッチングは、ある画像(テンプレート)を別の画像内で探し出す手法です。

この方法は、特定のパターンやオブジェクトを画像内で検出するのに非常に有効です。

テンプレートマッチングは、以下のような手順で行われます。

テンプレート画像を用意する。
対象画像に対してテンプレートをスライドさせながら、各位置での類似度を計算する。
類似度が最も高い位置を特定する。

この手法は、特にオブジェクト認識や画像検索において広く利用されています。

cv2.matchTemplateを使ったテンプレートマッチング

OpenCVでは、cv2.matchTemplate関数を使用してテンプレートマッチングを行います。

この関数は、テンプレート画像と対象画像の間の類似度を計算し、結果を出力します。

以下は、テンプレートマッチングを行うサンプルコードです。

import cv2
import numpy as np
# 対象画像とテンプレート画像を読み込む
image = cv2.imread('path/to/image.jpg')
template = cv2.imread('path/to/template.jpg')
# テンプレートマッチングを実行
result = cv2.matchTemplate(image, template, cv2.TM_CCOEFF_NORMED)
# 類似度が最も高い位置を特定
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result)
# テンプレートのサイズを取得
h, w = template.shape[:2]
# マッチング結果を描画
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)
cv2.rectangle(image, top_left, bottom_right, (0, 255, 0), 2)
# 結果を表示
cv2.imshow('Matched Result', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

このコードでは、対象画像とテンプレート画像を読み込み、cv2.matchTemplateを使用してテンプレートマッチングを行い、最も類似度が高い位置に矩形を描画して表示します。

テンプレートマッチングのメリットとデメリット

テンプレートマッチングには、以下のようなメリットとデメリットがあります。

メリット	デメリット
実装が簡単で直感的	スケールや回転に対して不変ではない
特定のパターンを簡単に検出できる	計算コストが高くなる場合がある
明確な結果が得られる	背景のノイズに影響されやすい

テンプレートマッチングは、特定のパターンを検出するのに非常に有効ですが、スケールや回転に対しては弱いため、使用する際にはその特性を理解しておくことが重要です。

テンプレートマッチングの実装例

以下は、テンプレートマッチングを用いて特定のオブジェクトを画像内で検出する実装例です。

import cv2
import numpy as np
# 対象画像とテンプレート画像を読み込む
image = cv2.imread('path/to/image.jpg')
template = cv2.imread('path/to/template.jpg')
# テンプレートマッチングを実行
result = cv2.matchTemplate(image, template, cv2.TM_CCOEFF_NORMED)
# 類似度が最も高い位置を特定
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result)
# テンプレートのサイズを取得
h, w = template.shape[:2]
# マッチング結果を描画
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)
cv2.rectangle(image, top_left, bottom_right, (0, 255, 0), 2)
# 結果を表示
cv2.imshow('Matched Result', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

このコードを実行すると、対象画像内でテンプレートが検出され、矩形で囲まれた結果が表示されます。

テンプレートマッチングは、特定のオブジェクトを見つけるための強力な手法であり、さまざまなアプリケーションで利用されています。

応用例：画像検索エンジンの構築

画像検索エンジンとは？

画像検索エンジンは、ユーザーが入力した画像に基づいて、データベース内の類似画像を検索し、結果を返すシステムです。

一般的には、ユーザーがアップロードした画像を解析し、その特徴を抽出して、データベース内の画像と比較します。

画像検索エンジンは、eコマースサイト、ソーシャルメディア、デジタルアーカイブなど、さまざまな分野で利用されています。

ヒストグラムを使った画像検索エンジンの実装

ヒストグラムを用いた画像検索エンジンは、画像の色分布を基に類似画像を検索します。

以下は、ヒストグラムを使った画像検索エンジンの実装例です。

import cv2
import numpy as np
import os
def calculate_histogram(image_path):
    image = cv2.imread(image_path)
    hist = cv2.calcHist([image], [0], None, [256], [0, 256])
    return hist
def search_similar_images(query_image_path, database_folder):
    query_hist = calculate_histogram(query_image_path)
    similarities = {}
    for filename in os.listdir(database_folder):
        if filename.endswith('.jpg') or filename.endswith('.png'):
            db_image_path = os.path.join(database_folder, filename)
            db_hist = calculate_histogram(db_image_path)
            similarity = cv2.compareHist(query_hist, db_hist, cv2.HISTCMP_CORREL)
            similarities[filename] = similarity
    # 類似度が高い順にソート
    sorted_similarities = sorted(similarities.items(), key=lambda x: x[1], reverse=True)
    return sorted_similarities
# 使用例
query_image = 'path/to/query_image.jpg'
database_folder = 'path/to/image_database/'
results = search_similar_images(query_image, database_folder)
for filename, similarity in results:
    print(f'画像: {filename}, 類似度: {similarity}')

このコードでは、指定したデータベース内の画像とクエリ画像のヒストグラムを比較し、類似度を計算して結果を表示します。

SSIMを使った画像検索エンジンの実装

SSIMを用いた画像検索エンジンは、画像の構造的な情報を基に類似画像を検索します。

以下は、SSIMを使った画像検索エンジンの実装例です。

import cv2
from skimage.metrics import structural_similarity as ssim
import os
def calculate_ssim(image_path1, image_path2):
    image1 = cv2.imread(image_path1, cv2.IMREAD_GRAYSCALE)
    image2 = cv2.imread(image_path2, cv2.IMREAD_GRAYSCALE)
    similarity_index, _ = ssim(image1, image2, full=True)
    return similarity_index
def search_similar_images_ssim(query_image_path, database_folder):
    similarities = {}
    for filename in os.listdir(database_folder):
        if filename.endswith('.jpg') or filename.endswith('.png'):
            db_image_path = os.path.join(database_folder, filename)
            similarity = calculate_ssim(query_image_path, db_image_path)
            similarities[filename] = similarity
    # 類似度が高い順にソート
    sorted_similarities = sorted(similarities.items(), key=lambda x: x[1], reverse=True)
    return sorted_similarities
# 使用例
query_image = 'path/to/query_image.jpg'
database_folder = 'path/to/image_database/'
results = search_similar_images_ssim(query_image, database_folder)
for filename, similarity in results:
    print(f'画像: {filename}, SSIM類似度: {similarity}')

このコードでは、SSIMを使用してデータベース内の画像とクエリ画像の類似度を計算し、結果を表示します。

特徴量マッチングを使った画像検索エンジンの実装

特徴量マッチングを用いた画像検索エンジンは、画像の特徴点を基に類似画像を検索します。

以下は、特徴量マッチングを使った画像検索エンジンの実装例です。

import cv2
import os
def calculate_keypoints_and_descriptors(image_path):
    image = cv2.imread(image_path)
    orb = cv2.ORB_create()
    keypoints, descriptors = orb.detectAndCompute(image, None)
    return keypoints, descriptors
def search_similar_images_feature_matching(query_image_path, database_folder):
    query_keypoints, query_descriptors = calculate_keypoints_and_descriptors(query_image_path)
    bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
    similarities = {}
    for filename in os.listdir(database_folder):
        if filename.endswith('.jpg') or filename.endswith('.png'):
            db_image_path = os.path.join(database_folder, filename)
            db_keypoints, db_descriptors = calculate_keypoints_and_descriptors(db_image_path)
            matches = bf.match(query_descriptors, db_descriptors)
            similarity = len(matches)  # マッチした特徴点の数を類似度とする
            similarities[filename] = similarity
    # 類似度が高い順にソート
    sorted_similarities = sorted(similarities.items(), key=lambda x: x[1], reverse=True)
    return sorted_similarities
# 使用例
query_image = 'path/to/query_image.jpg'
database_folder = 'path/to/image_database/'
results = search_similar_images_feature_matching(query_image, database_folder)
for filename, similarity in results:
    print(f'画像: {filename}, マッチした特徴点数: {similarity}')

このコードでは、特徴量マッチングを使用してデータベース内の画像とクエリ画像の類似度を計算し、結果を表示します。

特徴量マッチングは、特に物体認識や画像検索において非常に効果的です。

応用例：画像の重複検出

画像の重複検出とは？

画像の重複検出は、データベースやフォルダ内に存在する同一または類似の画像を特定するプロセスです。

この技術は、ストレージの最適化やデータの整理、重複コンテンツの削除に役立ちます。

重複画像は、異なるファイル名や解像度で保存されている場合が多いため、効果的な検出手法が必要です。

重複検出は、特にデジタルアーカイブや画像管理システムで重要な役割を果たします。

ヒストグラムを使った重複画像の検出

ヒストグラムを用いた重複画像の検出は、画像の色分布を比較することで行います。

以下は、ヒストグラムを使った重複画像の検出の実装例です。

import cv2
import numpy as np
import os
def calculate_histogram(image_path):
    image = cv2.imread(image_path)
    hist = cv2.calcHist([image], [0], None, [256], [0, 256])
    return hist
def find_duplicate_images(database_folder):
    histograms = {}
    duplicates = []
    for filename in os.listdir(database_folder):
        if filename.endswith('.jpg') or filename.endswith('.png'):
            image_path = os.path.join(database_folder, filename)
            hist = calculate_histogram(image_path)
            histograms[filename] = hist
    # ヒストグラムを比較して重複を検出
    for file1, hist1 in histograms.items():
        for file2, hist2 in histograms.items():
            if file1 != file2:
                similarity = cv2.compareHist(hist1, hist2, cv2.HISTCMP_CORREL)
                if similarity > 0.95:  # 類似度が高い場合
                    duplicates.append((file1, file2))
    return duplicates
# 使用例
database_folder = 'path/to/image_database/'
duplicates = find_duplicate_images(database_folder)
for file1, file2 in duplicates:
    print(f'重複画像: {file1} と {file2}')

このコードでは、指定したフォルダ内の画像のヒストグラムを計算し、類似度が高い画像を重複として検出します。

SSIMを使った重複画像の検出

SSIMを用いた重複画像の検出は、画像の構造的な情報を基に行います。

以下は、SSIMを使った重複画像の検出の実装例です。

import cv2
from skimage.metrics import structural_similarity as ssim
import os
def calculate_ssim(image_path1, image_path2):
    image1 = cv2.imread(image_path1, cv2.IMREAD_GRAYSCALE)
    image2 = cv2.imread(image_path2, cv2.IMREAD_GRAYSCALE)
    similarity_index, _ = ssim(image1, image2, full=True)
    return similarity_index
def find_duplicate_images_ssim(database_folder):
    duplicates = []
    images = [f for f in os.listdir(database_folder) if f.endswith('.jpg') or f.endswith('.png')]
    for i in range(len(images)):
        for j in range(i + 1, len(images)):
            image_path1 = os.path.join(database_folder, images[i])
            image_path2 = os.path.join(database_folder, images[j])
            similarity = calculate_ssim(image_path1, image_path2)
            if similarity > 0.95:  # 類似度が高い場合
                duplicates.append((images[i], images[j]))
    return duplicates
# 使用例
database_folder = 'path/to/image_database/'
duplicates = find_duplicate_images_ssim(database_folder)
for file1, file2 in duplicates:
    print(f'重複画像: {file1} と {file2}')

このコードでは、SSIMを使用してフォルダ内の画像を比較し、重複画像を検出します。

特徴量マッチングを使った重複画像の検出

特徴量マッチングを用いた重複画像の検出は、画像の特徴点を基に行います。

以下は、特徴量マッチングを使った重複画像の検出の実装例です。

import cv2
import os
def calculate_keypoints_and_descriptors(image_path):
    image = cv2.imread(image_path)
    orb = cv2.ORB_create()
    keypoints, descriptors = orb.detectAndCompute(image, None)
    return keypoints, descriptors
def find_duplicate_images_feature_matching(database_folder):
    duplicates = []
    images = [f for f in os.listdir(database_folder) if f.endswith('.jpg') or f.endswith('.png')]
    for i in range(len(images)):
        keypoints1, descriptors1 = calculate_keypoints_and_descriptors(os.path.join(database_folder, images[i]))
        for j in range(i + 1, len(images)):
            keypoints2, descriptors2 = calculate_keypoints_and_descriptors(os.path.join(database_folder, images[j]))
            bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
            matches = bf.match(descriptors1, descriptors2)
            if len(matches) > 10:  # マッチした特徴点が一定数以上の場合
                duplicates.append((images[i], images[j]))
    return duplicates
# 使用例
database_folder = 'path/to/image_database/'
duplicates = find_duplicate_images_feature_matching(database_folder)
for file1, file2 in duplicates:
    print(f'重複画像: {file1} と {file2}')

このコードでは、特徴量マッチングを使用してフォルダ内の画像を比較し、重複画像を検出します。

特徴量マッチングは、特に異なる解像度やサイズの画像に対しても効果的です。

応用例：動画フレーム間の類似度比較

動画フレーム間の類似度比較とは？

動画フレーム間の類似度比較は、動画内の連続するフレームや異なるフレーム間での類似度を評価するプロセスです。

この手法は、動画の編集、圧縮、分析、または異常検出など、さまざまなアプリケーションで利用されます。

フレーム間の類似度を比較することで、冗長な情報を削除したり、特定のシーンを特定したりすることが可能になります。

ヒストグラムを使ったフレーム間の類似度比較

ヒストグラムを用いたフレーム間の類似度比較は、各フレームの色分布を基に行います。

以下は、ヒストグラムを使ったフレーム間の類似度比較の実装例です。

import cv2
import numpy as np
def calculate_histogram(frame):
    hist = cv2.calcHist([frame], [0], None, [256], [0, 256])
    return hist
def compare_frames_histogram(video_path):
    cap = cv2.VideoCapture(video_path)
    ret, prev_frame = cap.read()
    prev_hist = calculate_histogram(prev_frame)
    frame_index = 1
    similarities = []
    while True:
        ret, current_frame = cap.read()
        if not ret:
            break
        current_hist = calculate_histogram(current_frame)
        similarity = cv2.compareHist(prev_hist, current_hist, cv2.HISTCMP_CORREL)
        similarities.append((frame_index, similarity))
        prev_hist = current_hist
        frame_index += 1
    cap.release()
    return similarities
# 使用例
video_path = 'path/to/video.mp4'
similarities = compare_frames_histogram(video_path)
for index, similarity in similarities:
    print(f'フレーム {index}: 類似度 {similarity}')

このコードでは、動画の各フレームのヒストグラムを計算し、前のフレームとの類似度を比較して結果を表示します。

SSIMを使ったフレーム間の類似度比較

SSIMを用いたフレーム間の類似度比較は、フレームの構造的な情報を基に行います。

以下は、SSIMを使ったフレーム間の類似度比較の実装例です。

import cv2
from skimage.metrics import structural_similarity as ssim
def compare_frames_ssim(video_path):
    cap = cv2.VideoCapture(video_path)
    ret, prev_frame = cap.read()
    prev_frame_gray = cv2.cvtColor(prev_frame, cv2.COLOR_BGR2GRAY)
    frame_index = 1
    similarities = []
    while True:
        ret, current_frame = cap.read()
        if not ret:
            break
        current_frame_gray = cv2.cvtColor(current_frame, cv2.COLOR_BGR2GRAY)
        similarity_index, _ = ssim(prev_frame_gray, current_frame_gray, full=True)
        similarities.append((frame_index, similarity_index))
        prev_frame_gray = current_frame_gray
        frame_index += 1
    cap.release()
    return similarities
# 使用例
video_path = 'path/to/video.mp4'
similarities = compare_frames_ssim(video_path)
for index, similarity in similarities:
    print(f'フレーム {index}: SSIM類似度 {similarity}')

このコードでは、動画の各フレームをグレースケールに変換し、SSIMを使用して前のフレームとの類似度を比較して結果を表示します。

特徴量マッチングを使ったフレーム間の類似度比較

特徴量マッチングを用いたフレーム間の類似度比較は、フレーム内の特徴点を基に行います。

以下は、特徴量マッチングを使ったフレーム間の類似度比較の実装例です。

import cv2
def compare_frames_feature_matching(video_path):
    cap = cv2.VideoCapture(video_path)
    orb = cv2.ORB_create()
    ret, prev_frame = cap.read()
    prev_keypoints, prev_descriptors = orb.detectAndCompute(prev_frame, None)
    frame_index = 1
    similarities = []
    while True:
        ret, current_frame = cap.read()
        if not ret:
            break
        current_keypoints, current_descriptors = orb.detectAndCompute(current_frame, None)
        bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
        matches = bf.match(prev_descriptors, current_descriptors)
        similarity = len(matches)  # マッチした特徴点の数を類似度とする
        similarities.append((frame_index, similarity))
        prev_keypoints, prev_descriptors = current_keypoints, current_descriptors
        frame_index += 1
    cap.release()
    return similarities
# 使用例
video_path = 'path/to/video.mp4'
similarities = compare_frames_feature_matching(video_path)
for index, similarity in similarities:
    print(f'フレーム {index}: マッチした特徴点数 {similarity}')

このコードでは、動画の各フレームの特徴点を検出し、前のフレームとのマッチングを行い、マッチした特徴点の数を類似度として表示します。

特徴量マッチングは、特に動きのあるシーンや異なる解像度のフレームに対しても効果的です。