update files/datasets download info (#65)

hanjr92 · web-flow · commit 7ef86fcc5a02 · 2023-01-19T15:02:35.000+08:00
diff --git a/tensorlayerx/dataflow/dataloader.py b/tensorlayerx/dataflow/dataloader.py
@@ -68,12 +68,12 @@ def __init__(
     ):
         self.dataset = dataset
         assert num_workers >= 0, "num_workers should be a non_negative integer"
-        if num_workers == 0 and prefetch_factor != 2:
-            raise ValueError("prefetch_factor option should not be specified, when num_workers is 0.")
+        # if num_workers == 0 and prefetch_factor != 2:
+        #     raise ValueError("prefetch_factor option should not be specified, when num_workers is 0.")
         if persistent_workers and num_workers == 0:
             raise ValueError('persistent_workers option needs num_workers > 0')
-        self.num_workers = num_workers
-        self.prefetch_factor = prefetch_factor
+        self.num_workers = 0 # TODO optimizer multiprocess in multi backends
+        self.prefetch_factor = 2
         self.time_out = time_out
         self.worker_init_fn = worker_init_fn
         if isinstance(dataset, IterableDataset):
diff --git a/tensorlayerx/files/dataset_loaders/celebA_dataset.py b/tensorlayerx/files/dataset_loaders/celebA_dataset.py
@@ -3,10 +3,9 @@
 
 import os
 import zipfile
-
 from tensorlayerx import logging
 from tensorlayerx.files.utils import (download_file_from_google_drive, exists_or_mkdir, load_file_list)
-
+logging.set_verbosity(logging.INFO)
 __all__ = ['load_celebA_dataset']
 
 
@@ -21,6 +20,11 @@ def load_celebA_dataset(path='data'):
         The path that the data is downloaded to, defaults is ``data/celebA/``.
 
     """
+    logging.info("The dataset is stored on google drive, if you can't download it from google drive, "
+                  "please download it from the official website manually. " 
+                  "Large-scale CelebFaces Attributes (CelebA) Dataset <http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html>. "
+                  "Please place dataset 'img_align_celeba.zip' under 'data/celebA/' by default.")
+
     data_dir = 'celebA'
     filename, drive_id = "img_align_celeba.zip", "0B7EVK8r0v71pZjFTYXZWM3FlRnM"
     save_path = os.path.join(path, filename)
diff --git a/tensorlayerx/files/dataset_loaders/cifar10_dataset.py b/tensorlayerx/files/dataset_loaders/cifar10_dataset.py
@@ -4,12 +4,11 @@
 import os
 import pickle
 import sys
-
 import numpy as np
 
 from tensorlayerx import logging
 from tensorlayerx.files.utils import maybe_download_and_extract
-
+logging.set_verbosity(logging.INFO)
 __all__ = ['load_cifar10_dataset']
 
 
@@ -46,7 +45,10 @@ def load_cifar10_dataset(shape=(-1, 32, 32, 3), path='data', plotable=False):
 
     """
     path = os.path.join(path, 'cifar10')
-    logging.info("Load or Download cifar10 > {}".format(path))
+    logging.info("If can't download this dataset automatically, "
+                  "please download it from the official website manually."
+                  "CIFAR10 Dataset <https://www.cs.toronto.edu/~kriz/cifar.html>."
+                  "Please place dataset 'cifar-10-python.tar.gz' under 'data/cifar10/' by default.")
 
     #Helper function to unpickle the data
     def unpickle(file):
diff --git a/tensorlayerx/files/dataset_loaders/cyclegan_dataset.py b/tensorlayerx/files/dataset_loaders/cyclegan_dataset.py
@@ -8,7 +8,7 @@
 from tensorlayerx import logging
 from tensorlayerx.vision import load_images
 from tensorlayerx.files.utils import (del_file, folder_exists, load_file_list, maybe_download_and_extract)
-
+logging.set_verbosity(logging.INFO)
 __all__ = ['load_cyclegan_dataset']
 
 
@@ -30,6 +30,11 @@ def load_cyclegan_dataset(filename='summer2winter_yosemite', path='data'):
     path = os.path.join(path, 'cyclegan')
     url = 'https://people.eecs.berkeley.edu/~taesung_park/CycleGAN/datasets/'
 
+    logging.info("If can't download this dataset automatically, "
+                  "please download it from the official website manually."
+                  "cyclegan Dataset <https://people.eecs.berkeley.edu/~taesung_park/CycleGAN/datasets/>."
+                  "Please place dataset under 'data/cyclegan/' by default.")
+
     if folder_exists(os.path.join(path, filename)) is False:
         logging.info("[*] {} is nonexistent in {}".format(filename, path))
         maybe_download_and_extract(filename + '.zip', path, url, extract=True)
diff --git a/tensorlayerx/files/dataset_loaders/flickr_1M_dataset.py b/tensorlayerx/files/dataset_loaders/flickr_1M_dataset.py
@@ -4,8 +4,8 @@
 import os
 
 from tensorlayerx import logging
-from tensorlayerx.vision import load_images
-
+from tensorlayerx.utils import visualize
+logging.set_verbosity(logging.INFO)
 from tensorlayerx.files.utils import (
     del_file, folder_exists, load_file_list, load_folder_list, maybe_download_and_extract, read_file
 )
@@ -30,7 +30,7 @@ def load_flickr1M_dataset(tag='sky', size=10, path="data", n_threads=50, printab
     size : int
         integer between 1 to 10. 1 means 100k images ... 5 means 500k images, 10 means all 1 million images. Default is 10.
     path : str
-        The path that the data is downloaded to, defaults is ``data/flickr25k/``.
+        The path that the data is downloaded to, defaults is ``data/flickr1M/``.
     n_threads : int
         The number of thread to read image.
     printable : boolean
@@ -57,7 +57,10 @@ def load_flickr1M_dataset(tag='sky', size=10, path="data", n_threads=50, printab
     ]
     tag_zip = 'tags.zip'
     url = 'http://press.liacs.nl/mirflickr/mirflickr1m/'
-
+    logging.info("If can't download this dataset automatically, "
+                  "please download it from the official website manually."
+                  "flickr1M Dataset <http://press.liacs.nl/mirflickr/mirflickr1m/>."
+                  "Please place dataset under 'data/flickr1M/' by default.")
     # download dataset
     for image_zip in images_zip[0:size]:
         image_folder = image_zip.split(".")[0]
diff --git a/tensorlayerx/files/dataset_loaders/flickr_25k_dataset.py b/tensorlayerx/files/dataset_loaders/flickr_25k_dataset.py
@@ -5,7 +5,7 @@
 
 from tensorlayerx import logging
 from tensorlayerx.vision import load_images
-
+logging.set_verbosity(logging.INFO)
 from tensorlayerx.files.utils import (
     del_file, folder_exists, load_file_list, maybe_download_and_extract, natural_keys, read_file
 )
@@ -49,7 +49,10 @@ def load_flickr25k_dataset(tag='sky', path="data", n_threads=50, printable=False
 
     filename = 'mirflickr25k.zip'
     url = 'http://press.liacs.nl/mirflickr/mirflickr25k/'
-
+    logging.info("If can't download this dataset automatically, "
+                  "please download it from the official website manually."
+                  "flickr25k Dataset <http://press.liacs.nl/mirflickr/mirflickr25k/>."
+                  "Please place dataset under 'data/flickr25k/' by default.")
     # download dataset
     if folder_exists(os.path.join(path, "mirflickr")) is False:
         logging.info("[*] Flickr25k is nonexistent in {}".format(path))
diff --git a/tensorlayerx/files/dataset_loaders/imdb_dataset.py b/tensorlayerx/files/dataset_loaders/imdb_dataset.py
@@ -6,9 +6,9 @@
 
 import numpy as np
 import six.moves.cPickle as pickle
-
+from tensorlayerx import logging
 from tensorlayerx.files.utils import maybe_download_and_extract
-
+logging.set_verbosity(logging.INFO)
 __all__ = ['load_imdb_dataset']
 
 
@@ -52,7 +52,10 @@ def load_imdb_dataset(
 
     """
     path = os.path.join(path, 'imdb')
-
+    logging.info("If can't download this dataset automatically, "
+                  "please download it from the official website manually."
+                  "imdb Dataset <https://s3.amazonaws.com/text-datasets/imdb.pkl>."
+                  "Please place dataset under 'data/imdb/' by default.")
     filename = "imdb.pkl"
     url = 'https://s3.amazonaws.com/text-datasets/'
     maybe_download_and_extract(filename, path, url)
diff --git a/tensorlayerx/files/dataset_loaders/matt_mahoney_dataset.py b/tensorlayerx/files/dataset_loaders/matt_mahoney_dataset.py
@@ -6,7 +6,7 @@
 
 from tensorlayerx import logging
 from tensorlayerx.files.utils import maybe_download_and_extract
-
+logging.set_verbosity(logging.INFO)
 __all__ = ['load_matt_mahoney_text8_dataset']
 
 
@@ -35,7 +35,10 @@ def load_matt_mahoney_text8_dataset(path='data'):
 
     """
     path = os.path.join(path, 'mm_test8')
-    logging.info("Load or Download matt_mahoney_text8 Dataset> {}".format(path))
+    logging.info("If can't download this dataset automatically, "
+                  "please download it from the official website manually."
+                  "mm_test8 Dataset <http://mattmahoney.net/dc/>."
+                  "Please place dataset under 'data/mm_test8/' by default.")
 
     filename = 'text8.zip'
     url = 'http://mattmahoney.net/dc/'
diff --git a/tensorlayerx/files/dataset_loaders/mnist_dataset.py b/tensorlayerx/files/dataset_loaders/mnist_dataset.py
@@ -2,7 +2,8 @@
 # -*- coding: utf-8 -*-
 
 from tensorlayerx.files.utils import _load_mnist_dataset
-
+from tensorlayerx import logging
+logging.set_verbosity(logging.INFO)
 __all__ = ['load_mnist_dataset']
 
 
@@ -28,4 +29,8 @@ def load_mnist_dataset(shape=(-1, 784), path='data'):
     >>> X_train, y_train, X_val, y_val, X_test, y_test = tlx.files.load_mnist_dataset(shape=(-1,784), path='datasets')
     >>> X_train, y_train, X_val, y_val, X_test, y_test = tlx.files.load_mnist_dataset(shape=(-1, 28, 28, 1))
     """
+    logging.info("If can't download this dataset automatically, "
+                  "please download it from the official website manually."
+                  "mnist Dataset <http://yann.lecun.com/exdb/mnist/>."
+                  "Please place dataset under 'data/mnist/' by default.")
     return _load_mnist_dataset(shape, path, name='mnist', url='http://yann.lecun.com/exdb/mnist/')
diff --git a/tensorlayerx/files/dataset_loaders/mnist_fashion_dataset.py b/tensorlayerx/files/dataset_loaders/mnist_fashion_dataset.py
@@ -2,7 +2,8 @@
 # -*- coding: utf-8 -*-
 
 from tensorlayerx.files.utils import _load_mnist_dataset
-
+from tensorlayerx import logging
+logging.set_verbosity(logging.INFO)
 __all__ = ['load_fashion_mnist_dataset']
 
 
@@ -28,6 +29,11 @@ def load_fashion_mnist_dataset(shape=(-1, 784), path='data'):
     >>> X_train, y_train, X_val, y_val, X_test, y_test = tlx.files.load_fashion_mnist_dataset(shape=(-1,784), path='datasets')
     >>> X_train, y_train, X_val, y_val, X_test, y_test = tlx.files.load_fashion_mnist_dataset(shape=(-1, 28, 28, 1))
     """
+    logging.info("If can't download this dataset automatically, "
+                  "please download it from the official website manually."
+                  "fashion_mnist Dataset <http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/fashion_mnist>."
+                  "Please place dataset under 'data/fashion_mnist/' by default.")
+
     return _load_mnist_dataset(
         shape, path, name='fashion_mnist', url='http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/'
     )
diff --git a/tensorlayerx/files/dataset_loaders/mpii_dataset.py b/tensorlayerx/files/dataset_loaders/mpii_dataset.py
@@ -5,7 +5,7 @@
 
 from tensorlayerx import logging
 from tensorlayerx.files.utils import (del_file, folder_exists, load_file_list, maybe_download_and_extract)
-
+logging.set_verbosity(logging.INFO)
 __all__ = ['load_mpii_pose_dataset']
 
 
@@ -47,8 +47,10 @@ def load_mpii_pose_dataset(path='data', is_16_pos_only=False):
     - `MPII Keyponts and ID <http://human-pose.mpi-inf.mpg.de/#download>`__
     """
     path = os.path.join(path, 'mpii_human_pose')
-    logging.info("Load or Download MPII Human Pose > {}".format(path))
-
+    logging.info("If can't download this dataset automatically, "
+                  "please download it from the official website manually."
+                  "mpii_human_pose Dataset <http://datasets.d2.mpi-inf.mpg.de/andriluka14cvpr/mpii_human_pose_v1_u12_2.zip>."
+                  "Please place dataset under 'data/mpii_human_pose/' by default.")
     # annotation
     url = "http://datasets.d2.mpi-inf.mpg.de/andriluka14cvpr/"
     tar_filename = "mpii_human_pose_v1_u12_2.zip"
diff --git a/tensorlayerx/files/dataset_loaders/nietzsche_dataset.py b/tensorlayerx/files/dataset_loaders/nietzsche_dataset.py
@@ -5,7 +5,7 @@
 
 from tensorlayerx import logging
 from tensorlayerx.files.utils import maybe_download_and_extract
-
+logging.set_verbosity(logging.INFO)
 __all__ = ['load_nietzsche_dataset']
 
 
@@ -30,7 +30,10 @@ def load_nietzsche_dataset(path='data'):
     >>> words = words.split()
 
     """
-    logging.info("Load or Download nietzsche dataset > {}".format(path))
+    logging.info("If can't download this dataset automatically, "
+                 "please download it from the official website manually."
+                 "nietzsche Dataset <https://s3.amazonaws.com/text-datasets/nietzsche.txt>."
+                 "Please place dataset under 'data/nietzsche/' by default.")
     path = os.path.join(path, 'nietzsche')
 
     filename = "nietzsche.txt"
diff --git a/tensorlayerx/logging/tl_logging.py b/tensorlayerx/logging/tl_logging.py
@@ -77,7 +77,7 @@ def _get_logger():
 
             # Add the output handler.
             _handler = _logging.StreamHandler(_logging_target)
-            _handler.setFormatter(_logging.Formatter('[TL] %(message)s'))
+            _handler.setFormatter(_logging.Formatter('[TLX] %(message)s'))
             logger.addHandler(_handler)
 
         _logger = logger