文字列

[Python] 文頭に書くUTF-8などのおまじないの1行とは？

2025-04-14更新日: 2025-04-14

Pythonスクリプトの文頭に書かれる# -*- coding: utf-8 -*-は、ファイルのエンコーディングを指定するための宣言です。

この宣言は、Python 2系で特に重要で、デフォルトのASCIIエンコーディング以外を使用する際に必要です。

Python 3系では、デフォルトでUTF-8が使用されるため、通常はこの宣言は不要ですが、互換性のために記述されることがあります。

この1行のおまじないにより、ソースコード内でUTF-8エンコーディングを用いた文字列を安全に扱うことができます。

目次から探す

Pythonにおけるエンコーディング宣言とは
エンコーディング宣言の書き方
エンコーディング宣言の応用
まとめ

Pythonにおけるエンコーディング宣言とは

Pythonのスクリプトを書く際に、ファイルの先頭に特定のエンコーディングを宣言することがあります。

これは、スクリプト内で使用される文字列がどのようにエンコードされているかを明示するためのものです。

特に、UTF-8エンコーディングは多くの言語で使用されるため、Pythonスクリプトでも一般的に用いられます。

エンコーディング宣言の書き方

Pythonスクリプトにおけるエンコーディング宣言は、スクリプト内で使用される文字列のエンコーディングを明示するために重要です。

特に、非ASCII文字を含むスクリプトでは、エンコーディングを正しく指定することで、文字化けやエラーを防ぐことができます。

宣言の基本構文

エンコーディング宣言は、Pythonスクリプトの最初の数行に特別なコメントとして記述されます。

基本構文は以下の通りです。

# -*- coding: utf-8 -*-

この宣言は、スクリプトがUTF-8エンコーディングを使用していることを示します。

coding:の後に続く部分で、使用するエンコーディングを指定します。

ファイルの先頭に書く理由

エンコーディング宣言をファイルの先頭に書く理由は、Pythonインタプリタがスクリプトを読み込む際に、最初にエンコーディング情報を取得する必要があるためです。

これにより、スクリプト内の文字列を正しく解釈し、エンコーディングに関連するエラーを未然に防ぐことができます。

特に、非ASCII文字を含むコメントや文字列リテラルがある場合、エンコーディング宣言がないとエラーが発生する可能性があります。

実際のコード例

以下は、UTF-8エンコーディングを宣言したPythonスクリプトの例です。

# -*- coding: utf-8 -*-
# これはUTF-8エンコーディングを使用したサンプルスクリプトです
def greet(name):
    # 日本語の挨拶を表示する
    print(f"こんにちは、{name}さん！")
greet("太郎")

こんにちは、太郎さん！

このスクリプトでは、UTF-8エンコーディングを宣言することで、日本語の文字列を正しく扱うことができます。

エンコーディング宣言がない場合、Pythonインタプリタはデフォルトのエンコーディングを使用し、非ASCII文字を含む部分でエラーが発生する可能性があります。

エンコーディング宣言の応用

エンコーディング宣言は、Pythonスクリプトで文字列を正しく扱うための基本的な手法ですが、応用することで多言語対応や特殊文字の処理、エンコーディングエラーの対処にも役立ちます。

多言語対応のためのエンコーディング

多言語対応を行う際には、UTF-8エンコーディングを使用することが一般的です。

UTF-8は、世界中のほとんどの文字をサポートしており、異なる言語の文字を同時に扱うことができます。

以下は、多言語対応の例です。

# -*- coding: utf-8 -*-
# 多言語対応のサンプル
def greet_in_languages(name):
    greetings = {
        "日本語": f"こんにちは、{name}さん！",
        "English": f"Hello, {name}!",
        "Español": f"¡Hola, {name}!"
    }
    for lang, greeting in greetings.items():
        print(f"{lang}: {greeting}")
greet_in_languages("太郎")

このスクリプトでは、日本語、英語、スペイン語の挨拶を表示します。

UTF-8エンコーディングを使用することで、異なる言語の文字列を正しく扱うことができます。

特殊文字を含むファイルの処理

特殊文字を含むファイルを処理する際にも、エンコーディング宣言は重要です。

例えば、絵文字や特殊記号を含む文字列を扱う場合、UTF-8エンコーディングを指定することで、これらの文字を正しく表示できます。

# -*- coding: utf-8 -*-
# 特殊文字を含む文字列の処理
def display_special_characters():
    special_string = "Pythonは楽しい！😊"
    print(special_string)
display_special_characters()