文字列

Go言語での文字列分割：基本手法と実践例を解説

2025-04-15更新日: 2025-04-15

Go言語で文字列を分割する方法をシンプルに説明します。

標準ライブラリに含まれる関数を利用し、区切り文字を基にした基本的な分割手法を取り上げます。

実際のコード作成の際に参考となる内容を提供します。

目次から探す

基本的な文字列分割の方法
応用的な文字列分割技法
- 正規表現を利用した分割方法
- カスタムロジックでの分割実装
実践例で確認する文字列分割の活用
- コードサンプルと利用シーン
パフォーマンスと注意点
- 分割処理の効率化のポイント
- メモリ使用量と実行速度の考察
まとめ

基本的な文字列分割の方法

strings.Splitの特徴と使い方

strings.Splitは、指定した区切り文字に基づいて文字列を簡単に分割できる関数です。

区切り文字が見つからなかった場合は、元の文字列が単一の要素として返されます。

簡単な処理に向いており、よく使われる関数です。

例えば、コンマ区切りの文字列を分割するサンプルコードは以下のとおりです。

package main
import (
	"fmt"
	"strings"
)
func main() {
	// サンプル文字列：コンマ区切り
	text := "apple,banana,cherry"
	// コンマで分割する
	parts := strings.Split(text, ",")
	// 分割結果を表示する
	fmt.Println(parts)
}

[apple banana cherry]

strings.SplitNによる区切り数の制御

strings.SplitNは、分割後の要素数を指定できる点が特徴です。

指定した個数で分割が終了するため、必要な分割数に制限する場合に有用です。

例えば、最初の2個の要素だけを取り出すサンプルコードは以下のとおりです。

package main
import (
	"fmt"
	"strings"
)
func main() {
	// サンプル文字列：ハイフン区切り
	text := "2023-10-15-event"
	// 最大2回の分割を行う
	parts := strings.SplitN(text, "-", 3)
	// 結果を表示する
	fmt.Println(parts)
}

[2023 10 15-event]

strings.Fieldsを使った空白区切り

strings.Fieldsは、空白(スペースやタブ、改行など)を区切り文字として利用し、自動的に連続する空白を無視して分割する関数です。

自然言語のテキストやログなど、空白区切りのデータの分割に適しています。

以下は、複数の空白を含む文字列を分割するサンプルコードです。

package main
import (
	"fmt"
	"strings"
)
func main() {
	// サンプル文字列：不規則な空白が含まれる
	text := "Go   is a   powerful   language"
	// 空白で分割する
	words := strings.Fields(text)
	// 結果を表示する
	fmt.Println(words)
}

[Go is a powerful language]

応用的な文字列分割技法

正規表現を利用した分割方法

正規表現を使うことで、複雑なパターンに基づいた文字列分割が可能です。

Goのregexpパッケージを利用すると、複数の区切り文字やパターンを指定して分割することができます。

以下は、カンマとセミコロンを同時に区切り文字として扱う例です。

package main
import (
	"fmt"
	"regexp"
)
func main() {
	// サンプル文字列：カンマとセミコロンで区切られている
	text := "red,blue;green,yellow;orange"
	// 正規表現パターン：カンマまたはセミコロン
	re := regexp.MustCompile("[,;]")
	// 正規表現に基づいて分割する
	parts := re.Split(text, -1)
	// 結果を表示する
	fmt.Println(parts)
}

[red blue green yellow orange]

カスタムロジックでの分割実装

事前定義された関数で目的を満たせない場合、独自のロジックを実装して文字列を分割する方法もあります。

例えば、特定の条件下で文字列を走査し、区切りとなる部分で手動でスライスを作成することができます。

以下は、文字列の区切り文字が特定の条件に応じて変わるケースのサンプルコードです。

package main
import (
	"fmt"
)
func main() {
	// サンプル文字列：特定のキーワードで分割する例
	text := "dataSTARTsection1dataSTARTsection2dataSTARTsection3"
	// 分割キーワード
	separator := "START"
	var parts []string
	start := 0
	// キーワードが見つかるたびに分割する
	for i := 0; i+len(separator) <= len(text); {
		if text[i:i+len(separator)] == separator {
			// キーワードの手前までを分割結果に追加する
			parts = append(parts, text[start:i])
			// 新しいセクションの開始位置をキーワードの直後に設定する
			i += len(separator)
			start = i
		} else {
			i++
		}
	}
	// 残りの部分を追加する
	parts = append(parts, text[start:])
	// 結果を表示する
	fmt.Println(parts)
}

[data section1data section2data section3]

実践例で確認する文字列分割の活用

コードサンプルと利用シーン

固定区切り文字を用いた分割例

固定の区切り文字を利用してデータを処理するケースは頻繁に発生します。

ログの解析やCSV形式の処理など、決まった形式の文字列データにはこの方法が直感的に使いやすいです。

以下は、固定のカンマ区切り文字を用いたサンプルコードです。

package main
import (
	"fmt"
	"strings"
)
func main() {
	// サンプルCSV形式の文字列
	csvData := "John,Doe,30,Engineer"
	// カンマを区切り文字として分割する
	columns := strings.Split(csvData, ",")
	// 結果を表示する
	fmt.Println(columns)
}

[John Doe 30 Engineer]

複数文字列・パターンでの分割例

実際のアプリケーションでは、複数のパターンに対応して分割を行う必要が出てくることがあります。

こういった場合は、正規表現やカスタムロジックを組み合わせると効果的です。

以下は、カンマとスペースが混在するデータを分割するサンプルコードです。

package main
import (
	"fmt"
	"regexp"
)
func main() {
	// サンプル文字列：カンマとスペースが混在している
	text := "one, two three, four   five"
	// 正規表現パターン：カンマまたは1個以上の空白文字
	re := regexp.MustCompile(",|\\s+")
	// 正規表現に基づいて分割する
	words := re.Split(text, -1)
	// 空文字の要素を除去するため、フィルタリングする
	var result []string
	for _, word := range words {
		if word != "" {
			result = append(result, word)
		}
	}
	// 結果を表示する
	fmt.Println(result)
}