こんにちは!ノイです! 機械学習でデータセットを用意するとnpzファイルであることもあります。
npzファイル
Numpy独自のバイナリファイルで保存したも のです。 npzファイルは、NumPyライブラリで使用さ れるデータ形式の1つで、複数のNumPy配列 を単一のファイルに保存するために使用されま す。npzファイルは、NumPy配列を圧縮する ことができ、ファイルサイズを小さくすること ができます。 npzファイルは、通常、NumPy配列の大規模 なセットを処理する際に使用されます。たとえ ば、機械学習のトレーニングデータセット、画 像データセット、または科学計算の結果などで す。
npzファイルの作成
npzファイルは、NumPyのsavez関数を使用 して作成できます。以下は、savez関数を使用 してnpzファイルを作成する基本的な例です。
import numpy as np #NumPy配列を作成する array1 np.array([1,2,3]) array2 np.array([4,5,6]) #npzファイルに保存する np.savez('file.npz',array1=array1,array2=array2)
この例では、2つのNumPy配列を作成し、 np.savez数を使用してfile.npzという名前の npzファイルに配列を保存しています。 np.savez関数は、必要な数のNumPy配列を指 定することができます。保存された配列は、 npzファイルから後で読み込むことができま す。
npzファイルの読込み
NumPyを使用して、npzファイルを開くこと ができます。
import numpy as np #npzファイルを読み込みます data np.load('file.npz') #ファイルに含まれる配列を表示します print(data.files) #配列を取得します array1 data['array1'] array2 data['array2']
load関数は、npzファイルを読み込み、data オブジェクトを返します。ファイルに含まれる すべての配列は、data.files属性を使用して表 示できます。そして、dataオブジェクトから必 要な配列を取得することができます。 この例では、array1とarray2の2つの配列が npzファイルに含まれていると仮定していま す。必要に応じて、ファイルに含まれる他の配 列を取得することができます。
※この記事の一部情報にはChatGPTを用いています。