数学

[Python] 変数にNaNを代入する方法

2025-04-14更新日: 2025-04-14

Pythonで変数にNaNを代入するには、主にNumPyライブラリを使用します。NumPyのnanは、数値データにおける「Not a Number」を表現するために使用されます。

まず、NumPyをインポートし、numpy.nanを変数に代入します。これにより、数値計算やデータ分析の際に欠損値を扱うことが可能になります。

また、Pythonの標準ライブラリであるmathモジュールのnanも利用できますが、NumPyの方が一般的です。

目次から探す

PythonでNaNを扱う方法
- NaNを生成する方法
- NaNの確認方法
NumPyでのNaNの操作
pandasでのNaNの操作
NaNの応用例
まとめ

PythonでNaNを扱う方法

Pythonでは、数値データの欠損値を表すためにNaN(Not a Number)を使用します。

NaNはデータ分析や科学計算の際に非常に重要な役割を果たします。

ここでは、PythonでNaNを生成し、確認する方法について詳しく解説します。

NaNを生成する方法

NaNを生成する方法はいくつかあります。

以下に代表的な方法を紹介します。

NumPyを使用する

NumPyは科学計算のためのライブラリで、NaNを簡単に生成することができます。

import numpy as np
# NumPyでNaNを生成
nan_value = np.nan
print(nan_value)

nan

NumPyのnanは、浮動小数点数のNaNを表します。

この値は計算やデータ処理の際に欠損値として扱われます。

pandasを使用する

pandasはデータ操作に特化したライブラリで、NaNを生成するための機能も備えています。

import pandas as pd
# pandasでNaNを生成
nan_value = pd.NA
print(nan_value)

<NA>

pandasのNAは、欠損値を表すための特別なオブジェクトで、データフレームやシリーズ内で使用されます。

mathモジュールを使用する

Pythonの標準ライブラリであるmathモジュールでもNaNを生成できます。

import math
# mathモジュールでNaNを生成
nan_value = math.nan
print(nan_value)

nan

mathモジュールのnanは、浮動小数点数のNaNを表し、数値計算で使用されます。

NaNの確認方法

生成したNaNが正しくNaNであるかを確認する方法も重要です。

以下にその方法を紹介します。

isNaN関数の使用

Pythonの標準ライブラリには、NaNを確認するためのmath.isnan関数があります。

import math
# NaNの確認
nan_value = math.nan
print(math.isnan(nan_value))

True

math.isnan関数は、引数がNaNである場合にTrueを返します。

pandasのisna関数の使用

pandasには、データフレームやシリーズ内のNaNを確認するためのisna関数があります。

import pandas as pd
# pandasでNaNの確認
nan_series = pd.Series([1, 2, pd.NA, 4])
print(nan_series.isna())

0    False
1    False
2     True
3    False
dtype: bool

isna関数は、シリーズ内の各要素がNaNであるかどうかをブール値で返します。

これにより、データ内の欠損値を簡単に特定できます。

NumPyでのNaNの操作

NumPyは、数値計算を効率的に行うための強力なライブラリであり、NaNの操作においても非常に便利です。

ここでは、NumPyを使用してNaNを生成、検出、そして処理する方法について解説します。

NumPyでNaNを生成する

NumPyでは、np.nanを使用してNaNを生成することができます。

これは、配列内に欠損値を挿入する際に非常に便利です。

import numpy as np
# NumPyでNaNを生成
nan_array = np.array([1.0, 2.0, np.nan, 4.0])
print(nan_array)

[ 1.  2. nan  4.]

このように、np.nanを使用することで、配列内にNaNを含めることができます。

NumPy配列内のNaNを検出する

NumPyでは、np.isnan関数を使用して配列内のNaNを検出することができます。

import numpy as np
# NumPy配列内のNaNを検出
nan_array = np.array([1.0, 2.0, np.nan, 4.0])
nan_mask = np.isnan(nan_array)
print(nan_mask)

[False False  True False]

np.isnan関数は、配列内の各要素がNaNであるかどうかをブール値で返します。

これにより、NaNの位置を特定することができます。

NumPy配列内のNaNを処理する

NaNを含む配列を処理する際には、NaNを他の値に置き換えることが一般的です。

以下に、NaNをゼロや平均値に置き換える方法を紹介します。

NaNをゼロに置き換える

NaNをゼロに置き換えるには、np.nan_to_num関数を使用します。

import numpy as np
# NaNをゼロに置き換える
nan_array = np.array([1.0, 2.0, np.nan, 4.0])
zero_filled_array = np.nan_to_num(nan_array, nan=0.0)
print(zero_filled_array)

[1. 2. 0. 4.]

np.nan_to_num関数は、配列内のNaNを指定した値(この場合はゼロ)に置き換えます。

NaNを平均値で置き換える

NaNを配列の平均値で置き換えるには、まずNaNを除いた平均値を計算し、その値でNaNを置き換えます。

import numpy as np
# NaNを平均値で置き換える
nan_array = np.array([1.0, 2.0, np.nan, 4.0])
mean_value = np.nanmean(nan_array)  # NaNを除いた平均値を計算
nan_array[np.isnan(nan_array)] = mean_value
print(nan_array)

[1. 2. 2.33333333 4.]

np.nanmean関数は、NaNを無視して平均値を計算します。

その平均値を用いて、NaNを置き換えることができます。

これにより、データの一貫性を保ちながら欠損値を処理できます。

pandasでのNaNの操作

pandasはデータ操作に特化したライブラリで、NaNの操作においても非常に強力です。

ここでは、pandasを使用してNaNを生成、検出、そして処理する方法について解説します。

pandasでNaNを生成する

pandasでは、pd.NAを使用してNaNを生成することができます。

これは、データフレームやシリーズ内に欠損値を挿入する際に便利です。

import pandas as pd
# pandasでNaNを生成
data = {'A': [1, 2, pd.NA, 4], 'B': [pd.NA, 2, 3, 4]}
df = pd.DataFrame(data)
print(df)

      A     B
0     1  <NA>
1     2     2
2  <NA>     3
3     4     4

このように、pd.NAを使用することで、データフレーム内にNaNを含めることができます。

DataFrame内のNaNを検出する

pandasでは、isna関数を使用してデータフレーム内のNaNを検出することができます。

import pandas as pd
# DataFrame内のNaNを検出
data = {'A': [1, 2, pd.NA, 4], 'B': [pd.NA, 2, 3, 4]}
df = pd.DataFrame(data)
nan_mask = df.isna()
print(nan_mask)

       A      B
0  False   True
1  False  False
2   True  False
3  False  False

isna関数は、データフレーム内の各要素がNaNであるかどうかをブール値で返します。

これにより、NaNの位置を特定することができます。

DataFrame内のNaNを処理する

データフレーム内のNaNを処理する際には、NaNを削除したり、特定の値に置き換えたりすることが一般的です。

以下にその方法を紹介します。

NaNを削除する

NaNを含む行や列を削除するには、dropna関数を使用します。

import pandas as pd
# NaNを削除する
data = {'A': [1, 2, pd.NA, 4], 'B': [pd.NA, 2, 3, 4]}
df = pd.DataFrame(data)
df_dropped = df.dropna()
print(df_dropped)

   A  B
1  2  2
3  4  4

dropna関数は、デフォルトでNaNを含む行を削除します。

引数を指定することで、列を削除することも可能です。

NaNを特定の値で置き換える

NaNを特定の値で置き換えるには、fillna関数を使用します。

import pandas as pd
# NaNを特定の値で置き換える
data = {'A': [1, 2, pd.NA, 4], 'B': [pd.NA, 2, 3, 4]}
df = pd.DataFrame(data)
df_filled = df.fillna(0)
print(df_filled)