Apache Hadoop Ozone
Apache Hadoop Ozoneとは、オブジェクトストレージである。
HDFSの後継でありHDFSの様々な問題点を改善しているという。
Kubernetesなどを使ったコンテナ環境でもまともに動くように設計されているらしい。
アクセスにはHDFS互換のJava用のライブラリとAmazon S3互換APIを利用できる。 とりあえずApache Spark、Hive、YARNに関しては変更なしで動かすことができるらしい。
主な用語
- ボリューム = ユーザーアカウントのようなもの。
- バケット = ディレクトリのようなもの。バケットにバケットは格納できない。つまりサブディレクトリという軟弱な概念はない。
- キー = ファイルのようなもの。