関数

remove_accents() – テキスト中のアクセント文字をASCII文字に変換する

2025-04-15更新日: 2025-04-15

WordPressに組み込まれたremove_accents()は、テキスト中のアクセント付き文字を対応するASCII文字に変換する関数です。

例えば、éはeに置き換えられます。

ロケールに合わせた変換ルールが適用されるため、ドイツ語やデンマーク語など各言語の仕様にも対応します。

シンプルな実装で、URLスラッグやファイル名の整形にも利用できます。

目次から探す

基本的な使用方法
- 関数の仕組みと動作
- 実装例とコードサンプル
カスタマイズ方法
- 独自変換ルールの追加
- 他のWordPress関数との連携
ロケール依存の変換仕様
- ドイツ語向け変換ルール
- デンマーク語向け変換仕様
内部処理とパフォーマンス
- 入力文字列の判別とUTF-8対応
- 正規化処理の役割
まとめ

基本的な使用方法

関数の仕組みと動作

WordPressのremove_accents()関数は、入力されたテキスト内のアクセント文字を対応するASCII文字へ変換するために利用されます。

関数はまず、文字列内に非ASCII文字が存在するかどうかを確認し、不要な処理を避ける仕組みになっています。

アクセント文字が見つかった場合、あらかじめ用意された変換用配列に基づいて、文字を置換します。

アクセント文字の変換ルール

この関数では、ラテン文字に付随するダイアクリティカルマーク(例：é、à、ñなど)やロケール特有の文字が対象です。

例えば、é はe に変換され、ñ はn に置き換えられます。

また、関数内部で定義された配列により、複数の変換ルールが適用されるため、正確な変換が実現されます。

なお、ロケールによっては変換ルールが変更されるため、ドイツ語やデンマーク語の場合は、特有ルールに沿った置換が行われます。

実装例とコードサンプル

シンプルな変換処理

以下は、アクセント文字をシンプルに変換するサンプルコードです。

コード内では、入力された文字列に対してremove_accents()を適用し、変換結果を表示しています。

<?php
// 入力文字列(アクセント付き文字を含む)
$inputString = "Café, Señor, Voilà!";
// remove_accents() によるアクセントの除去
$outputString = remove_accents($inputString);
// 変換結果を出力
echo $outputString;
?>

Cafe, Senor, Voila!

上記のように、アクセント文字が適切に置換され、シンプルなASCII文字列に変換されます。

カスタマイズ方法

独自変換ルールの追加

WordPress標準のアクセント変換ルールに加えて、プロジェクト固有の変換ルールを追加することが可能です。

これにより、特定のケースに合わせた文字変換を実現できます。

変換配列の編集と適用

以下のサンプルコードは、独自ルールとしてÉ を E に変換するルールを追加し、その変換結果を出力する例です。

コード中では、標準の変換配列に独自ルールが組み込まれた状態でstrtr()関数を利用しています。

<?php
// 元の変換用配列(例として一部のみ定義)
$chars = array(
  'á' => 'a',
  'é' => 'e',
  'í' => 'i',
  'Ñ' => 'N',
  'ñ' => 'n'
);
// 独自変換ルールの追加(É を E に変換)
$chars['É'] = 'E';
// 入力文字列(アクセント文字を含む)
$sourceString = "Señor Pérez, Événement";
// 変換処理の実施
$convertedString = strtr($sourceString, $chars);
// 変換結果を出力
echo $convertedString;
?>

Senor Perez, Evénement

カスタムルール作成時の注意点

独自ルールの作成にあたっては、以下の点に注意してください。

既存の変換ルールと重複しないようにルールを設定してください。重複がある場合、意図しない変換結果になる可能性があります。
利用するロケールに応じた変換結果の違いを確認し、必要に応じたカスタマイズを行うことが望ましいです。
入力される文字列のエンコーディングが正しく認識されているか確認してください。UTF-8以外の場合、変換が期待通りに動作しない場合があります。

他のWordPress関数との連携

WordPressでは、remove_accents()は他のサニタイズ用関数と組み合わせて利用されることが多いです。

代表的な例としては、投稿タイトルやファイル名の変換で使用されます。

sanitize_title()との組み合わせ

sanitize_title()は投稿タイトルやURLスラッグを生成する際に利用され、remove_accents()でアクセントを除去した後、さらに不要な文字を削除する役割を持ちます。

以下のコードはその連携例です。

<?php
// 投稿タイトル(アクセント付き)
$postTitle = "El Niño: La historia de un fenómeno";
// アクセントの除去
$titleWithoutAccents = remove_accents($postTitle);
// sanitize_title() による最終的な整形
$slug = sanitize_title($titleWithoutAccents);
// 結果を出力
echo $slug;
?>

el-nino-la-historia-de-un-fenomeno

sanitize_file_name()の利用方法

アップロード時のファイル名の安全化にもremove_accents()は利用されます。

ファイル名のアクセント除去後、sanitize_file_name()で余計な文字が取り除かれ、安全に利用できる名前へ変換されます。

サンプルコードは以下の通りです。

<?php
// 元のファイル名(アクセント付き)
$fileName = "Café-del-Mar.jpg";
// アクセント除去による中間処理
$nameWithoutAccents = remove_accents($fileName);
// sanitize_file_name() による最終整形
$finalFileName = sanitize_file_name($nameWithoutAccents);
// 結果を出力
echo $finalFileName;
?>