深度學習-tensorflow基礎-讀取數據-文件讀取流程

一月 1, 2019 tensorflow深度學習本文总阅读量次

Introduction

在tensorflow中讀取文件有既定的流程
不同的文件格式(csv,jpeg,binary_file)，在tensorflow中有不同讀取的API可以使用

流程

我們欲使用的數據可能存在不同的文件中，因此API會進行以下操作

構造一個欲讀取文件的隊列
- 文件隊列中包含路徑+文件名
- 可亂序置入隊列中也可順序置入
讀取(read)隊列文件的內容
- 預設讀取時，只讀取一個樣本
- 讀取的文件格式不一樣，所使用的API也不一樣
- 文件格式：
  - csv文件：讀取一行數據
  - 二進制文件(binary)：指定一個樣本的bytes讀取
  - 圖片文件(jpeg,png…)：一張一張的讀取
解碼(decode)
- 讀取時只返回一個樣本的結果，因此也只解碼一個樣本的內容
批處理
- 構造一隊列
- 將解碼後的文件放入隊列中(A文件A1樣本,A文件A2樣本……)
訓練模型
- 主線程拿取批處理隊列的樣本，進行訓練
  - 手動開啟線程
- 前面四步則由子線程完成

tips

前面提到的隊列，隊列管理器，線程協調器皆有完整的固定API已經封裝好直接調用，不需在自己定義