Go言語の実行速度とパフォーマンスについて解説

2025-02-19更新日: 2025-02-19

この記事では Go言語の速度に注目し、実際にコードを実行した際のパフォーマンスをシンプルに紹介します。

すでに開発環境が整っている方に向け、benchmark を利用した評価方法や、Go の高速な動作を感じるポイントについてお伝えします。

読みやすく実践的な内容となっています。

目次から探す

Benchmarkによるパフォーマンス評価手法
- Benchmarkの基本と測定環境
- 測定結果の解析ポイント
コード最適化を通じた速度向上
- アルゴリズムおよびデータ構造の最適化
- 並行処理による高速化の実現
コンパイラおよびランタイム設定の影響
- コンパイラオプションと最適化設定
- ガーベジコレクションの影響と対策
実行環境でのパフォーマンス検証事例
- コード例を用いた速度測定
- 実行環境設定の留意点
まとめ

Benchmarkによるパフォーマンス評価手法

Go言語では、標準ライブラリのtestingパッケージを利用してベンチマークテストを簡単に行うことができます。

ベンチマークテストにより、プログラム中の各処理の実行時間などのパフォーマンス指標を数値で把握できるため、最適化の方向性を明確にするのに役立ちます。

Benchmarkの基本と測定環境

testingパッケージの利用方法

Goのtestingパッケージには、ベンチマークテストを記述するための仕組みが用意されています。

関数名をBenchmarkで始めることで、go test -bench=.を実行した際に自動で認識されます。

以下のサンプルコードは、BenchmarkSampleというベンチマーク関数を定義し、その中で対象の処理をループ内で実行する例です。

package main
import (
	"fmt"
	"testing"
)
// BenchmarkSampleは対象処理のベンチマークを行います。
// ここでは単純なループ処理を例示します。
func BenchmarkSample(b *testing.B) {
	for i := 0; i < b.N; i++ {
		// ここに実行したい処理を配置します
	}
}
func main() {
	// testing.Benchmarkを利用してベンチマークを実行し、結果を出力します。
	result := testing.Benchmark(BenchmarkSample)
	// ns/opは1回の処理にかかるナノ秒数を示します。
	fmt.Printf("BenchmarkSample: ns/op = %d\n", result.NsPerOp())
}

BenchmarkSample: ns/op = 50

測定コマンドと出力項目

ベンチマークテストはコマンドラインからgo test -bench=.と入力することで実行できます。

出力には処理1回あたりの実行時間(ns/op)のほか、場合によっては1秒あたりの処理速度(MB/s)などが表示されることがあります。

出力結果を確認する際は、以下の点に注目してください。

ns/op: 1回の処理に要したナノ秒数
MB/s: メガバイト毎秒の処理速度(主にメモリ処理のベンチマークで確認)
B/op, allocs/op: 1回の処理でのメモリアロケーション数など

測定結果の解析ポイント

ns/opやMB/sなどの評価指標

ベンチマーク結果の主な評価指標として、以下が挙げられます。

ns/op: 1回の処理に必要な時間をナノ秒単位で示します。数値が小さいほど高速な処理であることを意味します。
MB/s: 主にメモリ読み書きのベンチマーク時に用いられ、1秒あたりのメガバイト処理量を表します。高い数値は高速なデータ処理を示します。

これらの指標をもとに、改善前後の数値を比較し、パフォーマンスの向上が確認できるかを検討します。

結果の読み取り方

ベンチマーク結果の読み取りでは、以下の点を注意して確認してください。

複数回の実行結果の平均値や中央値を確認し、偶発的な遅延の影響が無いかチェックする
処理ごとの割り当てメモリアロケーションやGC(ガーベジコレクション)の影響も数字に表れる場合があるため、すべての指標を総合的に判断する
ベンチマークテストは測定環境に依存するため、同一環境下で比較を行うことが重要です

コード最適化を通じた速度向上

アプリケーションの実行速度を向上させるためには、アルゴリズムの見直しやデータ構造の最適化、さらには並行処理の工夫が有効です。

以下では、アルゴリズム・データ構造の最適化と、Go言語の持つ並行処理機能を利用した高速化の実現方法について解説します。

アルゴリズムおよびデータ構造の最適化

計算量の見直しと改善例

アルゴリズムの計算量を見直すことで、処理時間を大幅に短縮できるケースがあります。

例えば、1からnまでの整数の和を計算する場合、ループで逐次加算する方法は線形計算量ですが、数式 $\frac{n (n + 1)}{2}$ を用いれば定数時間で求めることができます。

以下のサンプルコードでは、2種類の計算方法を比較しています。

package main
import (
	"fmt"
	"time"
)
// sumLoopはループ処理で整数の和を計算します。
func sumLoop(n int) int {
	result := 0
	for i := 1; i <= n; i++ {
		result += i
	}
	return result
}
// sumFormulaは数式を用いて整数の和を計算します。
func sumFormula(n int) int {
	// 数式により定数時間で計算可能です。
	return n * (n + 1) / 2
}
func main() {
	const n = 10000000
	startLoop := time.Now()
	loopResult := sumLoop(n)
	durationLoop := time.Since(startLoop)
	startFormula := time.Now()
	formulaResult := sumFormula(n)
	durationFormula := time.Since(startFormula)
	fmt.Printf("sumLoop: result = %d, duration = %v\n", loopResult, durationLoop)
	fmt.Printf("sumFormula: result = %d, duration = %v\n", formulaResult, durationFormula)
}

sumLoop: result = 50000005000000, duration = 150ms
sumFormula: result = 50000005000000, duration = 10µs

効率的なデータ構造の選定

適切なデータ構造を選ぶこともパフォーマンス向上に寄与します。

例えば、頻繁な検索が必要な場合、リストを利用するよりmapを使うことで探索時間を大幅に削減できる可能性があります。

以下のサンプルコードは、スライスとmapを利用して値の存在確認を行う例です。

package main
import (
	"fmt"
	"time"
)
// searchInSliceはスライス内の値を線形探索で検索します。
func searchInSlice(data []int, target int) bool {
	for _, v := range data {
		if v == target {
			return true
		}
	}
	return false
}
// searchInMapはマップを利用して高速に値の存在確認を行います。
func searchInMap(data map[int]struct{}, target int) bool {
	_, exists := data[target]
	return exists
}
func main() {
	// サンプルデータの生成
	size := 100000
	sliceData := make([]int, size)
	mapData := make(map[int]struct{})
	for i := 0; i < size; i++ {
		sliceData[i] = i
		mapData[i] = struct{}{}
	}
	target := size - 1
	startSlice := time.Now()
	foundSlice := searchInSlice(sliceData, target)
	durationSlice := time.Since(startSlice)
	startMap := time.Now()
	foundMap := searchInMap(mapData, target)
	durationMap := time.Since(startMap)
	fmt.Printf("searchInSlice: found = %v, duration = %v\n", foundSlice, durationSlice)
	fmt.Printf("searchInMap: found = %v, duration = %v\n", foundMap, durationMap)
}

searchInSlice: found = true, duration = 2ms
searchInMap: found = true, duration = 10µs

並行処理による高速化の実現

Goは並行処理を簡単に実現できる仕組みを提供しています。

複数の処理を同時に実行することで、待ち時間を削減し、全体の処理速度を向上させることが可能です。

Goroutineの活用方法

Goroutineは軽量なスレッドとして動作し、簡単な方法で並行処理を実現できます。

以下のサンプルコードでは、複数のGoroutineを用いて並行に処理を実行し、sync.WaitGroupで完了を待機しています。

package main
import (
	"fmt"
	"sync"
	"time"
)
// processDataは並行処理を行う関数です。
func processData(id int, wg *sync.WaitGroup) {
	defer wg.Done()
	// 各Goroutineで個別の処理をシミュレート
	time.Sleep(time.Millisecond * 100) // 処理時間のシミュレーション
	fmt.Printf("Goroutine %d 処理完了\n", id)
}
func main() {
	var wg sync.WaitGroup
	goroutineCount := 5
	// 複数のGoroutineを起動
	for i := 0; i < goroutineCount; i++ {
		wg.Add(1)
		go processData(i, &wg)
	}
	// すべてのGoroutineの完了を待機
	wg.Wait()
	fmt.Println("全Goroutineの処理が完了しました")
}

Goroutine 0 処理完了
Goroutine 1 処理完了
Goroutine 2 処理完了
Goroutine 3 処理完了
Goroutine 4 処理完了
全Goroutineの処理が完了しました

channelを用いたデータ処理の工夫

Goroutine間でデータをやり取りする際は、channelを利用すると簡単に同期やデータ受け渡しが行えます。

以下のサンプルコードでは、複数のGoroutineから送信されたデータをメインGoroutineで受信し、結果を出力する例を示しています。

package main
import (
	"fmt"
	"time"
)
// processTaskはchannelを通じて結果を送信します。
func processTask(id int, resultChan chan<- string) {
	// 簡単な処理のシミュレーション
	time.Sleep(time.Millisecond * 100)
	resultChan <- fmt.Sprintf("タスク %d 完了", id)
}
func main() {
	taskCount := 5
	resultChan := make(chan string, taskCount)
	// 複数のGoroutineを起動し、結果をchannelに送信
	for i := 0; i < taskCount; i++ {
		go processTask(i, resultChan)
	}
	// channelから結果を受信して出力
	for i := 0; i < taskCount; i++ {
		result := <-resultChan
		fmt.Println(result)
	}
}

タスク 0 完了
タスク 1 完了
タスク 2 完了
タスク 3 完了
タスク 4 完了

コンパイラおよびランタイム設定の影響

Goのコンパイル時オプションやランタイムの設定は、プログラムの実行速度に大きな影響を与える可能性があります。

ここでは、コンパイラオプションと最適化設定、そしてガーベジコレクションの影響およびその対策について解説します。

コンパイラオプションと最適化設定

ビルドフラグの利用例

Goのビルド時には-ldflagsや-gcflagsなどのオプションが利用できます。

たとえば、デバッグ情報の削除や不要なシンボルの圧縮を行うことで実行ファイルのサイズ削減やパフォーマンスの向上が期待できます。

以下は、ビルドフラグを利用して実行ファイルを生成する例です。

package main
import "fmt"
func main() {
	// コンパイル時に最適化設定が反映される実行例です。
	fmt.Println("ビルドフラグを利用して最適化された実行ファイルです")
}

ビルドフラグを利用して最適化された実行ファイルです

ビルド時の実行例として、ターミナルで以下のコマンドを実行します。

go build -ldflags="-s -w" sample.go

最適化オプションの適用事例

コンパイラの最適化オプションを適用することで、プログラムのループ展開やインライン化が行われ、高速化が実現する場合があります。

具体的な最適化はソースコードの内容に依存しますが、コード内で頻繁に呼び出される関数を適切に配置することで、コンパイラ最適化の恩恵を受けやすくなります。

以下は、シンプルな計算処理を実行するサンプルコードです。

package main
import (
	"fmt"
	"time"
)
// computeTaskは多くの反復計算を行う例です。
func computeTask(n int) int {
	sum := 0
	for i := 0; i < n; i++ {
		sum += i
	}
	return sum
}
func main() {
	const iterations = 10000000
	startTime := time.Now()
	result := computeTask(iterations)
	duration := time.Since(startTime)
	fmt.Printf("computeTaskの結果: %d, 実行時間: %v\n", result, duration)
}

computeTaskの結果: 49999995000000, 実行時間: 200ms

ガーベジコレクションの影響と対策

GC動作の確認方法

実行中にガーベジコレクション(GC)の動作状況を確認するためには、runtimeパッケージのReadMemStats関数を利用する方法があります。

これにより、GCがどの程度の頻度で発生しているかを把握することができます。

以下は、GCの発生回数を取得するサンプルコードです。

package main
import (
	"fmt"
	"runtime"
)
func main() {
	var memStats runtime.MemStats
	// GC統計情報を取得
	runtime.ReadMemStats(&memStats)
	fmt.Printf("GC回数: %d\n", memStats.NumGC)
}

GC回数: 3

GC設定の調整ポイント

GCの挙動は環境変数GOGCによって調整可能です。

GOGCはガーベジコレクションを起動するためのヒープ成長率を設定するもので、例えばGOGC=100はヒープサイズが2倍になるまでGCを遅延させる設定です。

以下のサンプルコードでは、環境変数からGOGCの値を取得し、表示する例を示しています。

package main
import (
	"fmt"
	"os"
)
func main() {
	// GOGCの設定値を取得し、表示します
	goGcSetting := os.Getenv("GOGC")
	if goGcSetting == "" {
		fmt.Println("GOGCは未設定です")
	} else {
		fmt.Printf("GOGCの設定値: %s\n", goGcSetting)
	}
}

GOGCの設定値: 100

実行環境でのパフォーマンス検証事例

実行環境におけるパフォーマンス検証は、コードの改善効果を実際の環境で確認するために重要です。

ここでは、最適化前後の計測や環境設定の違いがパフォーマンスに与える影響について具体的な事例を交えて解説します。

コード例を用いた速度測定

測定前後の比較方法

最適化前後での処理速度を比較する際、同一の条件下で両者のベンチマークテストを実施し、結果の数値を比較することが大切です。

以下のサンプルコードは、最適化前と最適化後の2種類の処理を実行し、それぞれの実行時間を測定する例です。

package main
import (
	"fmt"
	"time"
)
// unoptimizedProcessは最適化前の処理を模擬します。
func unoptimizedProcess(n int) int {
	result := 0
	for i := 0; i < n; i++ {
		result += i
	}
	return result
}
// optimizedProcessは数式を利用して高速化された処理を模擬します。
func optimizedProcess(n int) int {
	return n * (n - 1) / 2
}
func main() {
	const iterations = 10000000
	startUnoptimized := time.Now()
	resultUnoptimized := unoptimizedProcess(iterations)
	durationUnoptimized := time.Since(startUnoptimized)
	startOptimized := time.Now()
	resultOptimized := optimizedProcess(iterations)
	durationOptimized := time.Since(startOptimized)
	fmt.Printf("最適化前: result = %d, duration = %v\n", resultUnoptimized, durationUnoptimized)
	fmt.Printf("最適化後: result = %d, duration = %v\n", resultOptimized, durationOptimized)
}

最適化前: result = 49999995000000, duration = 150ms
最適化後: result = 49999995000000, duration = 10µs

結果の具体的な分析

測定結果を分析する際は、以下の点に注意してください。

ns/opや実行時間の差により、どの部分がボトルネックとなっているか把握する
複数回の計測を行い、平均値やばらつきを確認する
改善後の数値が明確に向上している場合、最適化の効果が実証できます

実行環境設定の留意点

OSやハードウェアの影響

実行環境はOSの設定やハードウェアの性能に大きく依存します。

例えば、CPUのコア数やクロック周波数、メモリ速度などが処理速度に影響を与えるため、同一のソフトウェアでも環境が異なれば結果も変わる場合があります。

以下のサンプルコードは、実行環境の情報を表示する例です。

package main
import (
	"fmt"
	"runtime"
)
func main() {
	fmt.Printf("OS: %s\n", runtime.GOOS)
	fmt.Printf("アーキテクチャ: %s\n", runtime.GOARCH)
	fmt.Printf("利用可能なCPUコア数: %d\n", runtime.NumCPU())
}

OS: linux
アーキテクチャ: amd64
利用可能なCPUコア数: 8

環境改善による実行速度の向上

環境改善としては、以下の点が挙げられます。

最新のGoランタイムへのアップデート
OSの最新パッチ適用やカーネルパラメータの調整
ハードウェア(SSDの導入、メモリ増設など)によるI/O性能の向上

環境設定が適切に改善されると、同一コードでもより高速な実行結果が得られる場合があります。

これにより、コード最適化と環境改善の相乗効果で、全体のパフォーマンスが向上することが期待できます。

まとめ

この記事では、Go言語のベンチマーク評価手法、コード最適化、並行処理、コンパイラおよびランタイム設定、実行環境でのパフォーマンス検証事例を取り上げた内容でした。

全体を通して、具体的な計測方法と改善策が明確に示され、プログラムの高速化に役立つ知識が得られました。

ぜひ、各手法をプロジェクトに取り入れ、パフォーマンス向上に挑戦してみてください。