LabelBinarizer()でラベル変換 - ITエンジニアノイのブログ

LabelBinarizer()は、scikit-learnライブラリの一部であり、カテゴリカルな目的変数をバイナリベクトルに変換するために使用される変換器です。具体的には、多クラス分類問題において、クラスラベルをバイナリ表現に変換するために使用されます。

クラスラベルをバイナリラベルに変換

LabelBinarizer()を使用すると、与えられたクラスラベルのリストや配列を、それぞれのクラスに対応するバイナリベクトルに変換できます。変換後のバイナリベクトルは、0と1の値で構成され、対応するクラスが1で表されます。

LabelBinarizer()の基本的な使い方

from sklearn.preprocessing import LabelBinarizer

# クラスラベルのリスト
labels = ['red', 'blue', 'green', 'red', 'green']

# LabelBinarizerのインスタンスを作成
binarizer = LabelBinarizer()

# クラスラベルをバイナリベクトルに変換
binary_labels = binarizer.fit_transform(labels)

print(binary_labels)

出力:

[[0 0 1]
 [0 1 0]
 [1 0 0]
 [0 0 1]
 [1 0 0]]

labelsというリストには5つのクラスラベルが含まれています。LabelBinarizer()を使用してこれらのラベルをバイナリベクトルに変換し、binary_labelsという変数に格納しています。変換後のバイナリベクトルは、元のクラスラベルに対応する位置に1が立っている形式となっています。

LabelBinarizer()は、多クラス分類問題でクラスラベルを扱う際に便利な変換器です。一部のアルゴリズムでは、クラスラベルをバイナリ表現に変換する必要があるため、LabelBinarizer()を使用してデータを適切な形式に変換することが重要です。

youtu.be