NumPy

[Python] NumPy – 2つのベクトルを比較する方法

2025-04-15更新日: 2025-04-15

NumPyを使用して2つのベクトルを比較するには、numpy.array_equal()やブール演算子を使います。

numpy.array_equal()は、2つの配列が形状や要素の値まで完全に一致しているかを確認します。

部分的な一致や条件付きの比較には、==演算子やnumpy.allclose()を使用します。

==演算子は要素ごとの比較を行い、結果はブール値の配列になります。

numpy.allclose()は、浮動小数点の誤差を考慮して近似的に等しいかを判定します。

目次から探す

NumPyでベクトルを比較する基本的な方法
条件付きのベクトル比較
ベクトルの類似度を測る方法
応用例：ベクトル比較の実践
まとめ

NumPyでベクトルを比較する基本的な方法

NumPyのインポートとベクトルの作成

NumPyを使用するためには、まずライブラリをインポートする必要があります。

次に、ベクトルを作成します。

以下のコードでは、1次元のベクトルを作成しています。

import numpy as np
# ベクトルの作成
vector_a = np.array([1, 2, 3])
vector_b = np.array([4, 5, 6])

このコードを実行すると、vector_aとvector_bという2つのベクトルが作成されます。

numpy.array_equal()を使った完全一致の比較

numpy.array_equal()関数を使用すると、2つのベクトルが完全に一致するかどうかを確認できます。

この関数は、形状と要素が同じである場合にTrueを返します。

import numpy as np
vector_a = np.array([1, 2, 3])
vector_b = np.array([1, 2, 3])
# 完全一致の比較
is_equal = np.array_equal(vector_a, vector_b)
print(is_equal)  # True

True

要素ごとの比較：==演算子

要素ごとの比較を行うには、==演算子を使用します。

この演算子は、同じインデックスにある要素が等しいかどうかを比較し、ブール配列を返します。

import numpy as np
vector_a = np.array([1, 2, 3])
vector_b = np.array([1, 0, 3])
# 要素ごとの比較
comparison_result = vector_a == vector_b
print(comparison_result)  # [ True False  True]

[ True False  True]

浮動小数点数の比較：numpy.allclose()

浮動小数点数の比較には、numpy.allclose()を使用します。

この関数は、2つの配列が近似的に等しいかどうかを判断します。

特に、浮動小数点数の計算では誤差が生じるため、便利です。

import numpy as np
vector_a = np.array([1.0, 2.0, 3.0])
vector_b = np.array([1.0, 2.0000001, 3.0])
# 浮動小数点数の比較
is_close = np.allclose(vector_a, vector_b)
print(is_close)  # True

True

ブール配列の利用とnumpy.all()、numpy.any()

ブール配列を利用して、条件を満たす要素がすべてまたは一部存在するかを確認することができます。

numpy.all()はすべての要素がTrueであるかを、numpy.any()は一部の要素がTrueであるかを確認します。

import numpy as np
vector_a = np.array([1, 2, 3])
vector_b = np.array([1, 0, 3])
# 要素ごとの比較
comparison_result = vector_a == vector_b
# すべての要素がTrueかどうか
all_true = np.all(comparison_result)
# 一部の要素がTrueかどうか
any_true = np.any(comparison_result)
print(all_true)  # False
print(any_true)  # True

False
True

このように、NumPyを使用することで、ベクトルの比較を簡単に行うことができます。

条件付きのベクトル比較

特定の条件での比較：numpy.where()

numpy.where()関数を使用すると、特定の条件を満たす要素のインデックスを取得できます。

この関数は、条件に基づいて新しい配列を生成することも可能です。

以下の例では、ベクトルの要素が2より大きい場合のインデックスを取得しています。

import numpy as np
vector = np.array([1, 2, 3, 4, 5])
# 特定の条件での比較
indices = np.where(vector > 2)
print(indices)  # (array([2, 3, 4]),)

(array([2, 3, 4]),)

この結果は、vectorの中で2より大きい要素のインデックスを示しています。

ベクトルの大きさや範囲での比較

ベクトルの大きさや範囲を比較するには、numpy.linalg.norm()を使用してベクトルのノルム(大きさ)を計算し、特定の値と比較することができます。

以下の例では、ベクトルの大きさが3より大きいかどうかを確認しています。

import numpy as np
vector = np.array([1, 2, 2])
# ベクトルの大きさを計算
magnitude = np.linalg.norm(vector)
# 大きさの比較
is_greater_than_3 = magnitude > 3
print(is_greater_than_3)  # False

False

絶対値を使った比較：numpy.abs()

numpy.abs()関数を使用すると、ベクトルの各要素の絶対値を取得できます。

これを利用して、特定の値と比較することができます。

以下の例では、ベクトルの要素の絶対値が1より大きいかどうかを確認しています。

import numpy as np
vector = np.array([-2, 0, 3, -1])
# 絶対値を使った比較
absolute_comparison = np.abs(vector) > 1
print(absolute_comparison)  # [ True False  True False]

[ True False  True False]

ベクトルの正規化と比較

ベクトルの正規化は、ベクトルの大きさを1にする操作です。

正規化されたベクトルを比較することで、方向の違いを確認できます。

以下の例では、ベクトルを正規化し、元のベクトルと比較しています。

import numpy as np
vector = np.array([3, 4])
# ベクトルの正規化
normalized_vector = vector / np.linalg.norm(vector)
# 正規化されたベクトルの表示
print(normalized_vector)  # [0.6 0.8]

[0.6 0.8]

このように、条件付きのベクトル比較を行うことで、さまざまな条件に基づいた分析が可能になります。

ベクトルの類似度を測る方法

コサイン類似度を使ったベクトル比較

コサイン類似度は、2つのベクトルの間の角度を測定し、類似度を評価する方法です。

コサイン類似度は、1に近いほど類似していることを示します。

以下のコードでは、コサイン類似度を計算しています。

import numpy as np
vector_a = np.array([1, 2, 3])
vector_b = np.array([4, 5, 6])
# コサイン類似度の計算
cosine_similarity = np.dot(vector_a, vector_b) / (np.linalg.norm(vector_a) * np.linalg.norm(vector_b))
print(cosine_similarity)  # 0.9746318461970762

0.9746318461970762

ユークリッド距離を使ったベクトル比較

ユークリッド距離は、2つのベクトル間の直線距離を測定します。

距離が小さいほど、ベクトルが近いことを示します。

以下のコードでは、ユークリッド距離を計算しています。

import numpy as np
vector_a = np.array([1, 2, 3])
vector_b = np.array([4, 5, 6])
# ユークリッド距離の計算
euclidean_distance = np.linalg.norm(vector_a - vector_b)
print(euclidean_distance)  # 5.196152422706632

5.196152422706632

マンハッタン距離を使ったベクトル比較

マンハッタン距離は、2つのベクトル間の距離を、各次元の絶対値の差の合計として計算します。

以下のコードでは、マンハッタン距離を計算しています。

import numpy as np
vector_a = np.array([1, 2, 3])
vector_b = np.array([4, 5, 6])
# マンハッタン距離の計算
manhattan_distance = np.sum(np.abs(vector_a - vector_b))
print(manhattan_distance)  # 9

numpy.dot()を使った内積による比較

内積は、2つのベクトルの類似度を測るための重要な指標です。

内積が大きいほど、ベクトルが似ていることを示します。

以下のコードでは、内積を計算しています。

import numpy as np
vector_a = np.array([1, 2, 3])
vector_b = np.array([4, 5, 6])
# 内積の計算
dot_product = np.dot(vector_a, vector_b)
print(dot_product)  # 32

これらの方法を使用することで、ベクトル間の類似度をさまざまな観点から評価することができます。

応用例：ベクトル比較の実践

機械学習における特徴ベクトルの比較

機械学習では、データの特徴を数値ベクトルとして表現します。

これらの特徴ベクトルを比較することで、類似したデータポイントを見つけたり、分類を行ったりします。

例えば、コサイン類似度を用いて、異なる文書の類似性を評価することができます。

以下のコードは、2つの特徴ベクトルのコサイン類似度を計算する例です。

import numpy as np
# 特徴ベクトルの例
feature_vector_a = np.array([0.1, 0.2, 0.3])
feature_vector_b = np.array([0.2, 0.1, 0.4])
# コサイン類似度の計算
cosine_similarity = np.dot(feature_vector_a, feature_vector_b) / (np.linalg.norm(feature_vector_a) * np.linalg.norm(feature_vector_b))
print(cosine_similarity)  # 0.9795918367346939

0.9331389496316868

画像処理におけるピクセルベクトルの比較

画像は、各ピクセルの色を数値ベクトルとして表現できます。

画像処理では、異なる画像のピクセルベクトルを比較することで、画像の類似性を評価したり、画像の変化を検出したりします。

以下の例では、2つの画像のピクセルベクトルのユークリッド距離を計算しています。

import numpy as np
# ピクセルベクトルの例
image_a = np.array([255, 0, 0])  # 赤
image_b = np.array([0, 255, 0])  # 緑
# ユークリッド距離の計算
euclidean_distance = np.linalg.norm(image_a - image_b)
print(euclidean_distance)  # 360.62445840513925

360.62445840513925

時系列データのベクトル比較

時系列データは、時間に沿ったデータポイントの集合です。

これらのデータをベクトルとして表現し、異なる時系列の類似性を比較することができます。

例えば、2つの時系列データのマンハッタン距離を計算することで、データの変化を評価できます。

import numpy as np
# 時系列データの例
time_series_a = np.array([1, 2, 3, 4, 5])
time_series_b = np.array([2, 3, 4, 5, 6])
# マンハッタン距離の計算
manhattan_distance = np.sum(np.abs(time_series_a - time_series_b))
print(manhattan_distance)  # 5

ベクトルのクラスタリングにおける比較

クラスタリングは、データをグループに分ける手法です。

ベクトル比較を用いて、データポイント間の距離を計算し、近いデータを同じクラスタに分類します。

例えば、K-meansクラスタリングでは、各データポイントとクラスタの中心との距離を計算して、最も近いクラスタに割り当てます。

以下の例では、簡単なK-meansクラスタリングの初期ステップを示しています。

import numpy as np
# データポイントの例
data_points = np.array([[1, 2], [1, 4], [1, 0], [4, 2], [4, 4], [4, 0]])
# クラスタの中心の初期化
centroids = np.array([[1, 2], [4, 4]])
# 各データポイントとクラスタ中心との距離を計算
distances = np.linalg.norm(data_points[:, np.newaxis] - centroids, axis=2)
print(distances)

[[0.         3.60555128]
 [2.         3.        ]
 [2.         5.        ]
 [3.         2.        ]
 [3.60555128 0.        ]
 [3.60555128 4.        ]]

このように、ベクトル比較はさまざまな分野で応用され、データの分析や処理において重要な役割を果たしています。