こんにちは!ノイです。
データを活用しようとして、データの保管場所をどのように設計したら良いか悩むことってありますよね…
機械学習エンジニアにとっては、保管場所の設計はなかなか馴染みがないのではないでしょうか?
データの保管にはデータウェアハウスとデータレイクがあります。
データウェアハウスもデータレイクもデータを統合的に保存するという点で同じです。
違いはデータレイクは加工する前の「前」のデータを保存するのに対して、データウェアハウスは加工後のデータを保存します。
データレイクは「データの池」と言われますが、設計を間違えて「データの沼」にならないように気をつけたいですね。
データレイクについてYouTubeで詳しく解説しています!
⬇️
https://youtu.be/ITowjkj7YEA