NumPy

[Python] NumPyの参照渡し(view)とコピー(np.copy)の違いを解説

2025-04-15更新日: 2025-04-15

NumPyでは、配列の操作において「参照渡し(view)」と「コピー(np.copy)」の違いが重要です。

参照渡しは、元の配列のデータを共有する新しい配列を作成します。

これにより、片方の配列を変更すると、もう片方にも影響が及びます。

一方、np.copyは元の配列のデータを完全に複製し、新しい独立した配列を作成します。

これにより、片方の配列を変更しても、もう片方には影響しません。

目次から探す

参照渡し(view)とコピー(np.copy)の基本
参照渡し(view)の詳細
コピー(np.copy)の詳細
参照渡しとコピーの実際の動作例
応用例：参照渡しとコピーの使い分け
まとめ

参照渡し(view)とコピー(np.copy)の基本

参照渡し(view)とは

NumPyにおける参照渡しは、配列のデータを直接参照する方法です。

これにより、元の配列のデータを変更すると、参照している配列も同様に変更されます。

参照渡しはメモリ効率が良く、大きなデータセットを扱う際に特に有用です。

以下のように、NumPyの配列をスライスすることで参照渡しを行うことができます。

import numpy as np
# 元の配列を作成
original_array = np.array([1, 2, 3, 4, 5])
# スライスによる参照渡し
view_array = original_array[1:4]
# 参照渡しした配列を変更
view_array[0] = 99
print("元の配列:", original_array)
print("参照渡しした配列:", view_array)

元の配列: [ 1 99 3 4 5]
参照渡しした配列: [99 3 4]

コピー(np.copy)とは

NumPyのコピーは、配列のデータを新しい配列に複製する方法です。

これにより、元の配列とコピーした配列は独立しており、一方を変更してももう一方には影響を与えません。

np.copy関数を使用して、配列の完全なコピーを作成できます。

以下はその例です。

import numpy as np
# 元の配列を作成
original_array = np.array([1, 2, 3, 4, 5])
# np.copyを使用してコピーを作成
copy_array = np.copy(original_array)
# コピーした配列を変更
copy_array[0] = 99
print("元の配列:", original_array)
print("コピーした配列:", copy_array)

元の配列: [1 2 3 4 5]
コピーした配列: [99  2  3  4  5]

参照渡しとコピーの違い

参照渡しとコピーの主な違いは、データの共有の有無です。

以下の表にその違いをまとめました。

特徴	参照渡し(view)	コピー(np.copy)
メモリ使用量	少ない	多い
データの共有	あり	なし
変更の影響	互いに影響を与える	互いに影響を与えない
使用例	大規模データ処理	データの独立性が必要な場合

どちらを使うべきかの判断基準

参照渡しとコピーの選択は、使用する状況によって異なります。

以下のポイントを考慮して選択してください。

メモリ効率: 大きなデータセットを扱う場合は、参照渡しを選ぶとメモリ使用量を抑えられます。
データの独立性: 元のデータを変更せずに新しいデータを作成したい場合は、コピーを使用します。
パフォーマンス: 参照渡しはコピーよりも高速ですが、データの整合性を保つためには注意が必要です。

参照渡し(view)の詳細

参照渡しの仕組み

NumPyにおける参照渡しは、配列のデータを直接参照する仕組みです。

配列をスライスしたり、特定のインデックスを指定したりすることで、新しい配列を作成することなく、元の配列のデータを操作できます。

これにより、メモリの使用量を削減し、パフォーマンスを向上させることが可能です。

参照渡しを行うと、元の配列と参照した配列は同じデータを指し示すため、一方の配列を変更すると、もう一方にも影響が及びます。

スライスによる参照渡し

NumPyでは、配列のスライスを使用して参照渡しを行うことができます。

スライスを使うことで、元の配列の一部を参照する新しい配列を作成できます。

以下の例では、スライスを使って参照渡しを行っています。

import numpy as np
# 元の配列を作成
original_array = np.array([10, 20, 30, 40, 50])
# スライスによる参照渡し
view_array = original_array[1:4]
# 参照渡しした配列を変更
view_array[1] = 99
print("元の配列:", original_array)
print("参照渡しした配列:", view_array)

元の配列: [10 20 99 40 50]
参照渡しした配列: [20 99 40]

参照渡しのメリットとデメリット

参照渡しにはいくつかのメリットとデメリットがあります。

以下の表にまとめました。

メリット	デメリット
メモリ使用量が少ない	元のデータが変更される可能性がある
パフォーマンスが向上する	データの整合性が保たれないことがある
大規模データ処理に適している	意図しない変更が発生することがある

参照渡しが有効なケース

参照渡しは特定の状況で特に有効です。

以下のようなケースでの使用が推奨されます。

大規模データの処理: メモリ効率を重視する場合、参照渡しを使用することで、メモリの使用量を抑えられます。
データの一部を変更する場合: 元のデータの一部を変更したいが、全体をコピーする必要がない場合に便利です。
パフォーマンスが重要な場合: 参照渡しはコピーよりも高速であるため、パフォーマンスが求められる処理に適しています。

これらのケースでは、参照渡しを利用することで、効率的にデータを扱うことができます。

コピー(np.copy)の詳細

コピーの仕組み

NumPyのnp.copy関数は、配列のデータを新しい配列に複製するためのメソッドです。

この関数を使用すると、元の配列とは独立した新しい配列が作成されます。

これにより、元の配列を変更してもコピーした配列には影響を与えません。

以下の例では、np.copyを使って配列をコピーしています。

import numpy as np
# 元の配列を作成
original_array = np.array([1, 2, 3, 4, 5])
# np.copyを使用してコピーを作成
copy_array = np.copy(original_array)
# コピーした配列を変更
copy_array[0] = 99
print("元の配列:", original_array)
print("コピーした配列:", copy_array)

元の配列: [1 2 3 4 5]
コピーした配列: [99  2  3  4  5]

浅いコピーと深いコピーの違い

NumPyのコピーには「浅いコピー」と「深いコピー」の2種類があります。

これらの違いは、コピーされたデータの参照の扱いにあります。

浅いコピー: 元のオブジェクトのデータを新しいオブジェクトに参照として持つコピーです。

元のデータが変更されると、浅いコピーも影響を受けます。

深いコピー: 元のオブジェクトのデータを完全に複製した新しいオブジェクトです。

元のデータが変更されても、深いコピーには影響を与えません。

np.copyのメリットとデメリット

np.copyを使用することには、いくつかのメリットとデメリットがあります。

以下の表にまとめました。

メリット	デメリット
元のデータを変更しても影響がない	メモリ使用量が増加する
データの独立性が保たれる	コピー処理に時間がかかることがある
データの整合性が保たれる	大規模データの場合、パフォーマンスが低下することがある

コピーが有効なケース

np.copyは特定の状況で特に有効です。

以下のようなケースでの使用が推奨されます。

データの独立性が必要な場合: 元のデータを変更せずに新しいデータを作成したい場合に適しています。
データの整合性を保ちたい場合: 複数の処理を行う際に、元のデータを保持したい場合に有効です。
データのバックアップを作成する場合: 元のデータの状態を保持したいときに、コピーを作成することで安全に操作できます。

これらのケースでは、np.copyを利用することで、データの管理が容易になります。

参照渡しとコピーの実際の動作例

参照渡しの動作例

参照渡しを使用すると、元の配列と参照した配列が同じデータを指し示すため、一方を変更するともう一方にも影響が及びます。

以下の例では、参照渡しを用いて配列を操作しています。

import numpy as np
# 元の配列を作成
original_array = np.array([10, 20, 30, 40, 50])
# スライスによる参照渡し
view_array = original_array[1:4]
# 参照渡しした配列を変更
view_array[0] = 99
print("元の配列:", original_array)
print("参照渡しした配列:", view_array)

元の配列: [10 99 30 40 50]
参照渡しした配列: [99 30 40]

この例では、view_arrayを変更した結果、original_arrayも影響を受けていることがわかります。

コピーの動作例

次に、np.copyを使用して配列をコピーする例を示します。

コピーした配列を変更しても、元の配列には影響がありません。

import numpy as np
# 元の配列を作成
original_array = np.array([1, 2, 3, 4, 5])
# np.copyを使用してコピーを作成
copy_array = np.copy(original_array)
# コピーした配列を変更
copy_array[0] = 99
print("元の配列:", original_array)
print("コピーした配列:", copy_array)

元の配列: [1 2 3 4 5]
コピーした配列: [99  2  3  4  5]

この例では、copy_arrayを変更してもoriginal_arrayには影響がないことが確認できます。

参照渡しとコピーの違いを確認するコード例

参照渡しとコピーの違いを明確にするために、両方の動作を比較するコードを示します。

import numpy as np
# 元の配列を作成
original_array = np.array([5, 10, 15])
# 参照渡し
view_array = original_array[1:3]
# コピー
copy_array = np.copy(original_array)
# 参照渡しした配列を変更
view_array[0] = 99
# コピーした配列を変更
copy_array[1] = 88
print("元の配列:", original_array)
print("参照渡しした配列:", view_array)
print("コピーした配列:", copy_array)

元の配列: [ 5 99 15]
参照渡しした配列: [99 15]
コピーした配列: [ 5 88 15]

この結果から、参照渡しした配列の変更が元の配列に影響を与えたのに対し、コピーした配列の変更は元の配列に影響を与えないことが確認できます。

変更が元の配列に与える影響の確認

参照渡しとコピーの違いを理解するために、元の配列に対する変更がどのように影響するかを確認します。

以下のコードでは、元の配列を変更した場合の影響を示します。

import numpy as np
# 元の配列を作成
original_array = np.array([1, 2, 3, 4, 5])
# 参照渡し
view_array = original_array[1:4]
# コピー
copy_array = np.copy(original_array)
# 元の配列を変更
original_array[0] = 99
print("元の配列:", original_array)
print("参照渡しした配列:", view_array)
print("コピーした配列:", copy_array)

元の配列: [99  2  3  4  5]
参照渡しした配列: [2  3  4]
コピーした配列: [1  2  3  4  5]

この結果から、元の配列を変更しても、参照渡しした配列は元の配列のスライスを参照しているため、影響を受けないことがわかります。

一方、コピーした配列は元の配列の状態を保持しているため、影響を受けません。

これにより、参照渡しとコピーの違いが明確に示されています。

応用例：参照渡しとコピーの使い分け

大規模データ処理における参照渡しの活用

大規模データを扱う際、メモリの使用量を抑えることが重要です。

参照渡しを利用することで、元のデータを直接参照しながら処理を行うことができ、メモリの消費を大幅に削減できます。

例えば、数百万行のデータを持つ配列を処理する場合、参照渡しを使用することで、必要な部分だけを効率的に操作できます。

以下のように、データの一部を参照して処理を行うことが可能です。

import numpy as np
# 大規模データを作成
large_array = np.random.rand(1000000)
# スライスによる参照渡し
view_array = large_array[100:200]
# 参照渡しした配列を処理
view_array *= 2  # 倍にする処理

このように、参照渡しを活用することで、大規模データの処理が効率的に行えます。

メモリ効率を考慮したコピーの使用

メモリ効率を考慮する場合、特定の状況ではコピーを使用することが適切です。

例えば、元のデータを変更する可能性がある場合や、データの整合性を保つ必要がある場合には、np.copyを使用して独立したデータを作成することが重要です。

以下の例では、元のデータを変更せずにバックアップを作成する場合を示します。

import numpy as np
# 元のデータを作成
data_array = np.array([1, 2, 3, 4, 5])
# データのバックアップを作成
backup_array = np.copy(data_array)
# 元のデータを変更
data_array[0] = 99
print("元のデータ:", data_array)
print("バックアップデータ:", backup_array)

このように、メモリ効率を考慮しつつ、データの整合性を保つためにコピーを使用することができます。

データの一部だけを変更したい場合の選択

データの一部だけを変更したい場合、参照渡しを使用することで、元のデータを直接操作することができます。

これにより、変更が必要な部分だけを効率的に更新できます。

以下の例では、配列の一部を参照して変更を行っています。

import numpy as np
# 元の配列を作成
original_array = np.array([10, 20, 30, 40, 50])
# スライスによる参照渡し
view_array = original_array[1:4]
# 参照渡しした配列の一部を変更
view_array[1] = 99
print("元の配列:", original_array)
print("参照渡しした配列:", view_array)

このように、データの一部だけを変更したい場合には、参照渡しが便利です。

パフォーマンスを重視した場合の選択

パフォーマンスが重要な場合、参照渡しを使用することで、データのコピーを避け、処理速度を向上させることができます。

特に、ループ内で大量のデータを処理する場合、参照渡しを利用することで、メモリのオーバーヘッドを減らし、処理を高速化できます。

以下の例では、参照渡しを用いて配列の要素を変更する処理を行っています。

import numpy as np
# 大規模データを作成
large_array = np.random.rand(1000000)
# スライスによる参照渡し
view_array = large_array[500000:600000]
# 参照渡しした配列を処理
for i in range(len(view_array)):
    view_array[i] *= 2  # 倍にする処理

このように、パフォーマンスを重視する場合には、参照渡しを選択することで、効率的なデータ処理が可能になります。