辞書

[Python] defaultdictモジュールの使い方 – デフォルト値付き辞書

2025-04-15更新日: 2025-04-15

defaultdictは、Pythonのcollectionsモジュールに含まれるクラスで、辞書にキーが存在しない場合でもデフォルト値を自動的に設定できる機能を持ちます。

通常の辞書では、存在しないキーにアクセスするとKeyErrorが発生しますが、defaultdictでは指定したデフォルト値が返されます。

初期化時にデフォルト値を生成する関数(例：int、listなど)を渡すことで、キーが存在しない場合にその関数の戻り値が自動的に設定されます。

目次から探す

defaultdictとは？
defaultdictの使い方
defaultdictの具体例
defaultdictの応用例
defaultdictと他のデータ構造の比較
defaultdictのパフォーマンス
まとめ

defaultdictとは？

defaultdictは、Pythonのcollectionsモジュールに含まれる特別な辞書の一種です。

通常の辞書では、存在しないキーにアクセスしようとするとKeyErrorが発生しますが、defaultdictを使用すると、あらかじめ指定したデフォルト値を持つキーにアクセスすることができます。

これにより、辞書の初期化や値の追加を簡素化し、コードの可読性を向上させることができます。

defaultdictは、デフォルト値を生成するための関数を引数に取ります。

この関数は、キーが存在しない場合に自動的に呼び出され、指定されたデフォルト値を返します。

例えば、整数のカウントやリストのグループ化など、さまざまな場面で便利に利用されます。

これにより、データの集計や整理が容易になり、プログラミングの効率が向上します。

defaultdictの使い方

defaultdictのインポート方法

defaultdictを使用するには、まずcollectionsモジュールからインポートする必要があります。

以下のようにインポートします。

from collections import defaultdict

defaultdictの初期化

defaultdictを初期化する際には、デフォルト値を生成するための関数を引数として渡します。

例えば、整数のカウント用にintを指定する場合は次のようになります。

my_dict = defaultdict(int)

デフォルト値の設定方法

defaultdictのデフォルト値は、初期化時に指定した関数によって決まります。

例えば、listを指定した場合、存在しないキーにアクセスすると空のリストが返されます。

my_dict = defaultdict(list)
print(my_dict['new_key'])  # 出力: []

デフォルト値として使える関数

defaultdictでは、以下のような関数をデフォルト値として使用できます。

使用可能な関数	説明
`int`	0を返す
`list`	空のリストを返す
`set`	空のセットを返す
`lambda: 0`	任意の値(この場合は0)を返す

defaultdictの基本的な操作

defaultdictは通常の辞書と同様に、キーと値の追加、削除、更新が可能です。

以下は基本的な操作の例です。

my_dict = defaultdict(int)
my_dict['apple'] += 1
my_dict['banana'] += 2
print(my_dict)  # 出力: defaultdict(<class 'int'>, {'apple': 1, 'banana': 2})

defaultdictの注意点

defaultdictを使用する際の注意点は以下の通りです。

デフォルト値を生成する関数は、引数を取らないものでなければなりません。
デフォルト値が生成されるのは、キーが存在しない場合のみです。

既存のキーにアクセスしてもデフォルト値は生成されません。

defaultdictは、通常の辞書と同様に、イテレーションやメソッドの使用が可能ですが、デフォルト値の特性を理解しておくことが重要です。

defaultdictの具体例

デフォルト値にintを使用する例

defaultdictをintで初期化すると、存在しないキーにアクセスした際に自動的に0が返されます。

これを利用して、要素のカウントを簡単に行うことができます。

from collections import defaultdict
# intをデフォルト値に持つdefaultdictを作成
count_dict = defaultdict(int)
# フルーツのカウント
fruits = ['apple', 'banana', 'apple', 'orange', 'banana', 'banana']
for fruit in fruits:
    count_dict[fruit] += 1
print(count_dict)  # 出力: defaultdict(<class 'int'>, {'apple': 2, 'banana': 3, 'orange': 1})

デフォルト値にlistを使用する例

defaultdictをlistで初期化すると、存在しないキーにアクセスした際に自動的に空のリストが返されます。

これを利用して、要素をグループ化することができます。

from collections import defaultdict
# listをデフォルト値に持つdefaultdictを作成
grouped_dict = defaultdict(list)
# 学生の科目をグループ化
students = [('Alice', 'Math'), ('Bob', 'Science'), ('Alice', 'Science'), ('Bob', 'Math')]
for name, subject in students:
    grouped_dict[name].append(subject)
print(grouped_dict)  # 出力: defaultdict(<class 'list'>, {'Alice': ['Math', 'Science'], 'Bob': ['Science', 'Math']})

デフォルト値にsetを使用する例

defaultdictをsetで初期化すると、存在しないキーにアクセスした際に自動的に空のセットが返されます。

これを利用して、重複を排除しながら要素を追加することができます。

from collections import defaultdict
# setをデフォルト値に持つdefaultdictを作成
unique_dict = defaultdict(set)
# フルーツの重複を排除
fruits = ['apple', 'banana', 'apple', 'orange', 'banana', 'banana']
for fruit in fruits:
    unique_dict['fruits'].add(fruit)
print(unique_dict)  # 出力: defaultdict(<class 'set'>, {'fruits': {'apple', 'banana', 'orange'}})

デフォルト値にlambdaを使用する例

defaultdictでは、lambdaを使って任意のデフォルト値を設定することもできます。

以下の例では、デフォルト値として1を返すように設定しています。

from collections import defaultdict
# lambdaをデフォルト値に持つdefaultdictを作成
custom_dict = defaultdict(lambda: 1)
# キーにアクセス
print(custom_dict['new_key'])  # 出力: 1
print(custom_dict['another_key'])  # 出力: 1

辞書のネストにおけるdefaultdictの活用

defaultdictは、ネストされた辞書を作成する際にも便利です。

以下の例では、各学生の科目ごとのスコアを管理するために、ネストされたdefaultdictを使用しています。

from collections import defaultdict
# ネストされたdefaultdictを作成
nested_dict = defaultdict(lambda: defaultdict(int))
# 学生のスコアを追加
scores = [('Alice', 'Math', 90), ('Bob', 'Science', 85), ('Alice', 'Science', 95)]
for name, subject, score in scores:
    nested_dict[name][subject] += score
print(nested_dict)  # 出力: defaultdict(<function <lambda> at 0x...>, {'Alice': defaultdict(<class 'int'>, {'Math': 90, 'Science': 95}), 'Bob': defaultdict(<class 'int'>, {'Science': 85})})

このように、defaultdictを使うことで、さまざまなデータ構造を簡単に扱うことができます。

defaultdictの応用例

カウント処理におけるdefaultdictの活用

defaultdictは、要素のカウント処理に非常に便利です。

例えば、リスト内の各要素の出現回数をカウントする際に、intをデフォルト値として使用することで、簡潔に実装できます。

from collections import defaultdict
# intをデフォルト値に持つdefaultdictを作成
count_dict = defaultdict(int)
# フルーツのリスト
fruits = ['apple', 'banana', 'apple', 'orange', 'banana', 'banana']
for fruit in fruits:
    count_dict[fruit] += 1
print(count_dict)  # 出力: defaultdict(<class 'int'>, {'apple': 2, 'banana': 3, 'orange': 1})

グループ分けにおけるdefaultdictの活用

defaultdictをlistで初期化することで、データを簡単にグループ分けできます。

例えば、学生の科目を科目ごとにグループ化することができます。

from collections import defaultdict
# listをデフォルト値に持つdefaultdictを作成
grouped_dict = defaultdict(list)
# 学生の科目データ
students = [('Alice', 'Math'), ('Bob', 'Science'), ('Alice', 'Science'), ('Bob', 'Math')]
for name, subject in students:
    grouped_dict[name].append(subject)
print(grouped_dict)  # 出力: defaultdict(<class 'list'>, {'Alice': ['Math', 'Science'], 'Bob': ['Science', 'Math']})

複数の辞書をマージする際のdefaultdictの活用

複数の辞書をマージする際にも、defaultdictは役立ちます。

以下の例では、複数の辞書から値を集約する方法を示します。

from collections import defaultdict
# 複数の辞書
dict1 = {'apple': 1, 'banana': 2}
dict2 = {'banana': 3, 'orange': 1}
# defaultdictを使用してマージ
merged_dict = defaultdict(int)
for d in (dict1, dict2):
    for key, value in d.items():
        merged_dict[key] += value
print(merged_dict)  # 出力: defaultdict(<class 'int'>, {'apple': 1, 'banana': 5, 'orange': 1})

ファイル処理でのdefaultdictの活用

ファイルからデータを読み込む際にも、defaultdictを使用してデータを整理することができます。

以下の例では、テキストファイル内の単語の出現回数をカウントしています。

from collections import defaultdict
# defaultdictを使用して単語のカウント
word_count = defaultdict(int)
# ファイルを読み込む
with open('sample.txt', 'r', encoding='utf-8') as file:
    for line in file:
        words = line.split()
        for word in words:
            word_count[word] += 1
print(word_count)  # 出力: defaultdict(<class 'int'>, {'word1': 2, 'word2': 3, ...})

データ集計におけるdefaultdictの活用

データ集計の場面でも、defaultdictは非常に便利です。

例えば、売上データを商品ごとに集計する場合に使用できます。

from collections import defaultdict
# defaultdictを使用して売上を集計
sales_data = [('apple', 100), ('banana', 200), ('apple', 150), ('orange', 300)]
sales_summary = defaultdict(int)
for product, amount in sales_data:
    sales_summary[product] += amount
print(sales_summary)  # 出力: defaultdict(<class 'int'>, {'apple': 250, 'banana': 200, 'orange': 300})

このように、defaultdictはさまざまな場面でデータの整理や集計を簡単に行うことができ、プログラミングの効率を大幅に向上させます。

defaultdictと他のデータ構造の比較

通常の辞書との比較

通常の辞書dictは、キーと値のペアを格納する基本的なデータ構造ですが、存在しないキーにアクセスするとKeyErrorが発生します。

一方、defaultdictは、あらかじめ指定したデフォルト値を持つため、存在しないキーにアクセスしてもエラーが発生せず、デフォルト値が返されます。

特徴	通常の辞書 `(dict)`	defaultdict
存在しないキーの処理	KeyErrorが発生	デフォルト値が返される
初期化時のデフォルト値	なし	任意の関数を指定可能
使用例	`my_dict['key']`	`my_dict['key']`

Counterとの比較

Counterは、collectionsモジュールに含まれる特別な辞書で、要素のカウントを行うために最適化されています。

Counterは、要素の出現回数を自動的にカウントする機能を持っていますが、defaultdictは任意のデフォルト値を設定できるため、より柔軟な用途に対応できます。

特徴	Counter	defaultdict
主な用途	要素のカウント	任意のデフォルト値の設定
初期化	`Counter(iterable)`	`defaultdict(func)`
存在しないキーの処理	0が返される	指定したデフォルト値が返される

OrderedDictとの比較

OrderedDictは、挿入順序を保持する辞書です。

Python 3.7以降、通常の辞書も挿入順序を保持するようになりましたが、OrderedDictは明示的に順序を管理する必要がある場合に便利です。

defaultdictはデフォルト値の設定に特化しているため、用途が異なります。

特徴	OrderedDict	defaultdict
挿入順序の保持	はい	いいえ
主な用途	順序を保持した辞書	デフォルト値の設定
初期化	`OrderedDict()`	`defaultdict(func)`

setdefaultメソッドとの比較

setdefaultメソッドは、通常の辞書に存在するメソッドで、指定したキーが存在しない場合にデフォルト値を設定します。

しかし、defaultdictは初期化時にデフォルト値を設定するため、より簡潔に同様の処理を行うことができます。

特徴	`setdefaultメソッド`	defaultdict
使用方法	`my_dict.setdefault(key, default)`	`my_dict[key]`
存在しないキーの処理	デフォルト値を設定	自動的にデフォルト値が返される
コードの簡潔さ	より冗長	より簡潔

このように、defaultdictは特定の用途に特化したデータ構造であり、他のデータ構造と比較してもその利点が明確です。

用途に応じて適切なデータ構造を選択することが重要です。