ITエンジニア ノイのブログ

ITエンジニアのノイです。 YouTubeで ITエンジニアのお勉強という学習用の動画を公開しています。チャンネル登録お願いします!https://m.youtube.com/channel/UCBKfJIMVWXd3ReG_FDh31Aw/playlists

pd.concat

pd.concatとは

pd.concat()は、pandasの関数であり、複数のデータフレームを結合(連結)するために使用されます。データフレームを縦方向または横方向に結合することができます。

使い方

構文

基本的な構文は以下の通りです。

pd.concat(objs, axis=0, join='outer', ignore_index=False)

引数

主な引数は次のとおりです。

  • objs: 結合するデータフレームのシーケンスまたは辞書です。リストやタプルなどの反復可能オブジェクトを指定することもできます。

  • axis: 結合の方向を指定します。axis=0(デフォルト)は縦方向(行方向)の結合を意味し、axis=1は横方向(列方向)の結合を意味します。

  • join: 結合方法を指定します。デフォルトでは'outer'となっており、結合するデータフレームに共通の列名がない場合に欠損値が追加されます。'inner'を指定すると、共通の列名のみが結合されます。

  • ignore_index: デフォルトではFalseとなっており、元のインデックスを維持します。Trueを指定すると、結合したデータフレームに新たな連番のインデックスが割り当てられます。

例(scikit-learnのboston)

display(df_data.head())
df = pd.concat([df_data, pd.DataFrame(boston.target, columns=["MEDV"])], axis=1)
display(df.head())

pd.concatの挙動
MEDVが追加されていることがわかります。

最後に

pd.concat()は、複数のデータフレームを結合する際に便利な方法です。データの縦方向または横方向への結合や、結合方法の指定など、柔軟な操作が可能です。詳細な使用方法やオプションについては、pandasの公式ドキュメントも合わせてご参照ください。

YouTube

youtu.be