Pandas

[Python] Pandas – ベクトルの行と列を入れ替える(転置)する方法

2025-04-15更新日: 2025-04-15

Pandasでベクトル(1次元のデータ)や行列(2次元のデータ)の行と列を入れ替えるには、transpose()メソッドまたは.T属性を使用します。

1次元のベクトルSeriesの場合、転置しても変化はありませんが、2次元のデータDataFrameでは行と列が入れ替わります。

例えば、df.TとすることでDataFrameの転置が可能です。

transpose()メソッドも同様に機能します。

目次から探す

Pandasでベクトルの転置を行う方法

Pandasはデータ分析に特化したPythonのライブラリで、データの操作や分析を効率的に行うことができます。

ここでは、Pandasを使用してベクトルの行と列を入れ替える(転置する)方法について解説します。

transpose()メソッドの使い方

transpose()メソッドは、DataFrameやSeriesの行と列を入れ替えるためのメソッドです。

以下のサンプルコードでは、DataFrameの転置を行っています。

import pandas as pd
# サンプルデータの作成
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6]
}
df = pd.DataFrame(data)
# DataFrameの転置
transposed_df = df.transpose()
print(transposed_df)

   0  1  2
A  1  2  3
B  4  5  6

transpose()メソッドを使用することで、行と列が入れ替わったDataFrameが得られます。

.T属性の使い方

.T属性を使用することで、より簡単にDataFrameやSeriesの転置を行うことができます。

以下のサンプルコードでは、同じくDataFrameの転置を行っています。

import pandas as pd
# サンプルデータの作成
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6]
}
df = pd.DataFrame(data)
# DataFrameの転置
transposed_df = df.T
print(transposed_df)

   0  1  2
A  1  2  3
B  4  5  6

.T属性を使うことで、より直感的に転置を行うことができます。

SeriesとDataFrameの転置の違い

SeriesとDataFrameの転置にはいくつかの違いがあります。

以下の表にまとめました。

特徴	Seriesの転置	DataFrameの転置
転置後の形状	変化しない(1次元のまま)	行と列が入れ替わる(2次元)
インデックスの扱い	インデックスはそのまま	カラムがインデックスに変わる
データの型	そのまま	行列のデータ型が変わることも

Seriesは1次元のデータ構造であるため、転置を行っても形状は変わりません。

一方、DataFrameは2次元のデータ構造で、転置を行うことで行と列が入れ替わります。

転置の際のデータ型の変化

転置を行うと、データ型が変化することがあります。

特に、DataFrameの転置では、行と列のデータ型が異なる場合、転置後にデータ型が統一されることがあります。

以下のサンプルコードで確認できます。

import pandas as pd
# 異なるデータ型を持つDataFrameの作成
data = {
    'A': [1, 2, 3],
    'B': ['a', 'b', 'c']
}
df = pd.DataFrame(data)
# DataFrameの転置
transposed_df = df.T
print(transposed_df)
print(transposed_df.dtypes)

   0  1  2
A  1  2  3
B  a  b  c
0    object
1    object
2    object
dtype: object

このように、転置後のDataFrameでは、各列のデータ型が異なることがあるため、注意が必要です。

1次元ベクトル(Series)の転置

PandasのSeriesは1次元のデータ構造で、データとインデックスのペアで構成されています。

ここでは、Seriesの転置について詳しく解説します。

Seriesの転置の基本

Seriesの転置は、transpose()メソッドや.T属性を使用して行うことができますが、1次元のため、実際には形状は変わりません。

以下のサンプルコードでは、Seriesの転置を行っています。

import pandas as pd
# サンプルデータの作成
data = [1, 2, 3]
series = pd.Series(data)
# Seriesの転置
transposed_series = series.transpose()
print(transposed_series)

0    1
1    2
2    3
dtype: int64

このように、Seriesの転置を行っても、出力結果は元のSeriesと同じ形状になります。

Seriesの転置が変化しない理由

Seriesは1次元のデータ構造であるため、転置を行っても行と列の概念が存在しません。

したがって、転置を行っても形状やデータは変わらず、元のSeriesと同じ結果が得られます。

これは、Seriesがインデックスと値のペアで構成されているため、行と列の入れ替えが意味を持たないからです。

Seriesの転置を確認する方法

Seriesの転置を確認するには、転置前後のデータを比較することが重要です。

以下のサンプルコードでは、転置前と転置後のSeriesを表示しています。

import pandas as pd
# サンプルデータの作成
data = [1, 2, 3]
series = pd.Series(data)
# Seriesの転置
transposed_series = series.T
# 転置前と転置後の表示
print("転置前のSeries:")
print(series)
print("\n転置後のSeries:")
print(transposed_series)

転置前のSeries:
0    1
1    2
2    3
dtype: int64

転置後のSeries:
0    1
1    2
2    3
dtype: int64

このように、転置前後のSeriesを比較することで、転置が形状に影響を与えないことを確認できます。

2次元ベクトル(DataFrame)の転置

DataFrameはPandasの2次元データ構造で、行と列から成り立っています。

ここでは、DataFrameの転置について詳しく解説します。

DataFrameの転置の基本

DataFrameの転置は、transpose()メソッドまたは.T属性を使用して行います。

転置を行うことで、行と列が入れ替わります。

以下のサンプルコードでは、DataFrameの転置を示しています。

import pandas as pd
# サンプルデータの作成
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6]
}
df = pd.DataFrame(data)
# DataFrameの転置
transposed_df = df.transpose()
print(transposed_df)

   0  1  2
A  1  2  3
B  4  5  6

このように、transpose()メソッドを使用することで、行と列が入れ替わったDataFrameが得られます。

行と列が入れ替わる仕組み

DataFrameの転置では、行が列に、列が行に変わります。

具体的には、元のDataFrameの行インデックスが新しい列インデックスになり、元の列インデックスが新しい行インデックスになります。

この仕組みにより、データの構造が変わります。

転置後のインデックスとカラムの扱い

転置後、元の行インデックスは新しい列インデックスに、元の列インデックスは新しい行インデックスになります。

以下のサンプルコードで、転置後のインデックスとカラムの扱いを確認できます。

import pandas as pd
# サンプルデータの作成
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6]
}
df = pd.DataFrame(data)
# DataFrameの転置
transposed_df = df.T
# 転置後のインデックスとカラムの表示
print("転置後のインデックス:")
print(transposed_df.index)
print("\n転置後のカラム:")
print(transposed_df.columns)

転置後のインデックス:
Index(['A', 'B'], dtype='object')

転置後のカラム:
RangeIndex(start=0, stop=3, step=1)

このように、転置後のDataFrameでは、元の行インデックスが新しい列インデックスになり、元の列インデックスが新しい行インデックスになります。

転置後のデータ型の確認

転置を行うと、各列のデータ型が変わることがあります。

特に、元のDataFrameの列に異なるデータ型が含まれている場合、転置後にデータ型が統一されることがあります。

以下のサンプルコードで確認できます。

import pandas as pd
# 異なるデータ型を持つDataFrameの作成
data = {
    'A': [1, 2, 3],
    'B': ['a', 'b', 'c']
}
df = pd.DataFrame(data)
# DataFrameの転置
transposed_df = df.T
# 転置後のデータ型の確認
print(transposed_df.dtypes)

0    object
1    object
2    object
dtype: object

このように、転置後のDataFrameでは、各列のデータ型が異なることがあるため、注意が必要です。

転置を行う際は、データ型の変化にも留意しましょう。

転置の応用例

DataFrameの転置は、データの整形や可視化、統計処理、結合など、さまざまな場面で活用できます。

ここでは、転置の具体的な応用例について解説します。

転置を使ったデータの整形

データの整形において、転置は特に役立ちます。

例えば、データを行から列に変換することで、分析や可視化が容易になります。

以下のサンプルコードでは、データを整形するために転置を使用しています。

import pandas as pd
# サンプルデータの作成
data = {
    '年': [2020, 2021, 2022],
    '売上': [100, 150, 200]
}
df = pd.DataFrame(data)
# データの整形(転置)
reshaped_df = df.set_index('年').T
print(reshaped_df)

年   2020  2021  2022
売上   100   150   200

このように、転置を使うことで、年ごとの売上データを行から列に整形することができます。

転置を使ったデータの可視化

転置は、データの可視化にも役立ちます。

特に、行と列の関係を視覚的に表現する際に、転置を行うことで見やすくなることがあります。

以下のサンプルコードでは、転置したデータを使って可視化を行います。

import pandas as pd
import matplotlib.pyplot as plt
# サンプルデータの作成
data = {
    '年': [2020, 2021, 2022],
    '売上': [100, 150, 200]
}
df = pd.DataFrame(data)
# データの整形(転置)
reshaped_df = df.set_index('年').T
# 可視化
reshaped_df.plot(kind='bar')
plt.title('年ごとの売上')
plt.xlabel('年')
plt.ylabel('売上')
plt.show()

このコードを実行すると、年ごとの売上を示す棒グラフが表示されます。

転置を行うことで、可視化が容易になります。

転置を使ったデータの統計処理

転置は、データの統計処理にも利用できます。

特に、行と列の関係を変えることで、異なる視点からデータを分析することが可能です。

以下のサンプルコードでは、転置を使ってデータの平均を計算しています。

import pandas as pd
# サンプルデータの作成
data = {
    '年': [2020, 2021, 2022],
    '売上': [100, 150, 200],
    '利益': [30, 50, 70]
}
df = pd.DataFrame(data)
# データの転置
transposed_df = df.set_index('年').T
# 各年の平均を計算
mean_values = transposed_df.mean(axis=1)
print(mean_values)

売上    150.0
利益     50.0
dtype: float64

このように、転置を行うことで、各指標の平均を簡単に計算することができます。

転置を使ったデータの結合

転置は、異なるデータセットを結合する際にも役立ちます。

特に、行と列の構造が異なるデータを結合する場合、転置を行うことで整合性を持たせることができます。

以下のサンプルコードでは、転置を使ってデータを結合しています。

import pandas as pd
# サンプルデータの作成
data1 = {
    '年': [2020, 2021],
    '売上': [100, 150]
}
data2 = {
    '年': [2021, 2022],
    '利益': [50, 70]
}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
# データの転置
transposed_df1 = df1.set_index('年').T
transposed_df2 = df2.set_index('年').T
# データの結合
combined_df = pd.concat([transposed_df1, transposed_df2], axis=1)
print(combined_df)

年   2020  2021  2022
売上  100  150  NaN
利益  NaN  50  70

このように、転置を使うことで異なるデータセットを結合しやすくなります。

転置はデータの整形や分析において非常に便利な手法です。

転置に関する注意点

DataFrameの転置は非常に便利ですが、いくつかの注意点があります。

ここでは、転置後のデータのメモリ効率、大規模データの転置時のパフォーマンス、欠損値を含むデータの転置について解説します。

転置後のデータのメモリ効率

転置を行うと、元のデータ構造が変わるため、メモリの使用効率に影響を与えることがあります。

特に、データの型や構造が異なる場合、転置後にメモリの使用量が増加することがあります。

以下のサンプルコードで、転置前後のメモリ使用量を確認できます。

import pandas as pd
# サンプルデータの作成
data = {
    'A': [1, 2, 3] * 1000,
    'B': [4, 5, 6] * 1000
}
df = pd.DataFrame(data)
# 転置前のメモリ使用量
print("転置前のメモリ使用量:", df.memory_usage(deep=True).sum())
# DataFrameの転置
transposed_df = df.transpose()
# 転置後のメモリ使用量
print("転置後のメモリ使用量:", transposed_df.memory_usage(deep=True).sum())

出力結果は、転置前後のメモリ使用量を示します。

転置後にメモリ使用量が増加する場合があるため、注意が必要です。

大規模データの転置時のパフォーマンス

大規模なDataFrameを転置する際は、パフォーマンスに影響が出ることがあります。

特に、行数や列数が非常に多い場合、転置処理に時間がかかることがあります。

以下のサンプルコードでは、大規模データの転置を行い、処理時間を計測しています。

import pandas as pd
import time
# 大規模データの作成
data = {f'col_{i}': range(1000000) for i in range(100)}
df = pd.DataFrame(data)
# 転置処理の計測
start_time = time.time()
transposed_df = df.transpose()
end_time = time.time()
print("転置処理にかかった時間:", end_time - start_time, "秒")

このように、大規模データの転置はパフォーマンスに影響を与えるため、必要に応じてデータのサイズを調整することが重要です。

欠損値を含むデータの転置

欠損値を含むDataFrameを転置する場合、転置後のデータにどのように影響するかを理解しておく必要があります。

転置を行うと、欠損値がどのように扱われるかが重要です。

以下のサンプルコードでは、欠損値を含むDataFrameの転置を示しています。

import pandas as pd
import numpy as np
# 欠損値を含むデータの作成
data = {
    'A': [1, 2, np.nan],
    'B': [4, np.nan, 6]
}
df = pd.DataFrame(data)
# DataFrameの転置
transposed_df = df.transpose()
# 転置後のデータを表示
print(transposed_df)

     0    1    2
A  1.0  2.0  NaN
B  4.0  NaN  6.0

このように、転置後も欠損値はそのまま保持されます。

欠損値の処理を行う際は、転置前後でのデータの整合性を確認することが重要です。

転置を行う前に、欠損値の処理を検討することをお勧めします。

まとめ

この記事では、Pandasを使用したデータの転置について、基本的な使い方から応用例、注意点まで幅広く解説しました。

転置はデータの整形や可視化、統計処理、結合などにおいて非常に有用な手法であり、適切に活用することでデータ分析の効率を高めることができます。

今後は、実際のデータ分析において転置を積極的に取り入れ、データの扱い方をさらに向上させていくことをお勧めします。