「TFRecord」の版間の差分

提供: MonoBook
ナビゲーションに移動 検索に移動
(ページの作成:「'''TFRecord'''とは、tensorflowが推奨しているデータ形式、ファイル形式である。 拡張子は「.tfrecord」としていることが多い…」)
(相違点なし)

2019年5月17日 (金) 04:35時点における版

TFRecordとは、tensorflowが推奨しているデータ形式、ファイル形式である。 拡張子は「.tfrecord」としていることが多い。

概要

TFRecordはCSVJSONなどと同様のテキストに加え、バイナリを効率的に格納できるという代物である。これにより物体検出の機械学習で使用する画像ファイル(バイナリ)、その中の物体を指す矩形座標(数値)、そして物体名のラベル(テキスト)などを1つのファイルに格納できる。

JSONバイナリを格納しようとするとBASE64などを使い無理やりテキスト化して格納する必要があり、これに伴いファイルが肥大化したりと非常に効率が悪い。一方、TFRecordならそんな問題も解決だ。Tensorflow以外の用途でも「テキストとバイナリを同時に扱いたい」という用途では活躍することであろう。

TFRecordの中身は「Protocol Buffers」である。生のProtocol Buffersは面倒すぎるのでTenforflowが簡単に扱えるラッパーライブラリを用意してくれたものがTFRecordである。

関連クラス

  • 保存 = tf.io.TFRecordWriter
  • 読込 = tf.data.TFRecordDataset

関連項目