Python
 Computer >> コンピューター >  >> プログラミング >> Python

Tensorflowを使用して、花のデータセットをトレーニングと検証に分割するにはどうすればよいですか?


花のデータセットは、検証セットの分割率を要求する「image_dataset_from_directory」を使用して、keras前処理APIを使用してトレーニングセットと検証セットに分割できます。

続きを読む: TensorFlowとは何ですか?KerasはTensorFlowとどのように連携してニューラルネットワークを作成しますか?

画像分類子はkeras.Sequentialモデルを使用して作成され、データは preprocessing.image_dataset_from_directoryを使用して読み込まれます。 。データはディスクから効率的にロードされます。過剰適合が特定され、それを軽減するための手法が適用されます。これらの手法には、データ拡張とドロップアウトが含まれます。 3700本の花の画像があります。このデータセットには5つのサブディレクトリが含まれ、クラスごとに1つのサブディレクトリがあります。それらは、デイジー、タンポポ、バラ、ヒマワリ、チューリップです。

以下のコードを実行するためにGoogleColaboratoryを使用しています。 Google ColabまたはColaboratoryは、ブラウザー上でPythonコードを実行するのに役立ち、構成が不要で、GPU(グラフィックプロセッシングユニット)に無料でアクセスできます。 ColaboratoryはJupyterNotebookの上に構築されています。

batch_size = 32
img_height = 180
img_width = 180
print("The data is being split into training and validation set")
train_ds = tf.keras.preprocessing.image_dataset_from_directory(
   data_dir,
   validation_split=0.2,
   subset="training",
   seed=123,
   image_size=(img_height, img_width),
   batch_size=batch_size)

コードクレジット:https://www.tensorflow.org/tutorials/images/classification

出力

The data is being split into training and validation set
Found 3670 files belonging to 5 classes.
Using 2936 files for training.

説明

  • これらのイメージは、image_dataset_from_directoryユーティリティを使用してディスクからロードされます。
  • これは、ディスク上のイメージのディレクトリからtf.data.Datasetに移動します。
  • データがダウンロードされると、ローダー用にいくつかのパラメーターが定義されます。
  • データはトレーニングセットと検証セットに分割されます。

  1. Tensorflowを使用してMNISTデータセットの重みを保存およびロードするにはどうすればよいですか?

    Tensorflowは、Googleが提供する機械学習フレームワークです。これは、Pythonと組み合わせて使用​​されるオープンソースのフレームワークであり、アルゴリズム、深層学習アプリケーションなどを実装します。それは研究および生産目的で使用されます。複雑な数学演算をすばやく実行するのに役立つ最適化手法があります。これは、NumPyと多次元配列を使用しているためです。これらの多次元配列は「テンソル」とも呼ばれます。 「tensorflow」パッケージは、以下のコード行を使用してWindowsにインストールできます- pip install tensorflow Tensorは、Tens

  2. TensorFlowを使用して、PythonでトレーニングされたIMDBデータセットのトレーニングと検証の精度を視覚化するプロットを作成するにはどうすればよいですか?

    Tensorflowは、Googleが提供する機械学習フレームワークです。これは、Pythonと組み合わせて使用​​されるオープンソースのフレームワークであり、アルゴリズム、深層学習アプリケーションなどを実装します。研究や生産目的で使用されます。 「tensorflow」パッケージは、以下のコード行を使用してWindowsにインストールできます- pip install tensorflow 「IMDB」データセットには、5万本を超える映画のレビューが含まれています。このデータセットは通常、自然言語処理に関連する操作で使用されます。 Google Colaboratoryを使用して、以下