change victorianDataset for ch3

mmminji · mmminji · commit 9341b95ad945 · 2021-01-20T18:46:05.000+09:00
diff --git a/book/chapters/GAN/Ch3-GAN.ipynb b/book/chapters/GAN/Ch3-GAN.ipynb
@@ -39,8 +39,10 @@
     "import torch.utils.data as data\n",
     "import torchvision.datasets as datasets\n",
     "import torchvision.models as models\n",
+    "from torch.utils.data import Dataset, DataLoader\n",
     "from PIL import Image\n",
-    "import PIL\n"
+    "import PIL\n",
+    "import glob"
    ]
   },
   {
@@ -51,12 +53,7 @@
    "source": [
     "gpu = 0\n",
     "batch_size = 32\n",
-    "imsz = 64\n",
-    "max_epoch = 500\n",
-    "\n",
-    "data_dir = '../GANdataset/victorian/'\n",
-    "resized_dir = data_dir + 'resized/'\n",
-    "test_dir = data_dir + 'test/'"
+    "max_epoch = 10"
    ]
   },
   {
@@ -65,28 +62,56 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "# class victorianDataset(object):\n",
-    "#     def __init__(self, path):\n",
-    "#         self.path = path\n",
-    "#         self.imgs = list(sorted(os.listdir(self.path)))\n",
+    "class victorianDataset(Dataset):\n",
+    "    def __init__(self, root, transforms_=None):\n",
+    "        self.transform = transforms.Compose(transforms_)\n",
     "\n",
+    "        self.gray_files = sorted(glob.glob(os.path.join(root, 'gray') + \"/*.*\"))\n",
+    "        self.color_files = sorted(glob.glob(os.path.join(root, 'resized') + \"/*.*\"))\n",
+    "     \n",
+    "    def __getitem__(self, index):\n",
     "\n",
-    "#     def __getitem__(self, idx):\n",
-    "#         file_image = self.imgs[idx]\n",
-    "#         img_path = os.path.join(self.path, file_image)\n",
+    "        gray_img = Image.open(self.gray_files[index % len(self.gray_files)]).convert(\"RGB\")\n",
+    "        color_img = Image.open(self.color_files[index % len(self.color_files)]).convert(\"RGB\")\n",
+    "    \n",
+    "        gray_img = self.transform(gray_img)\n",
+    "        color_img = self.transform(color_img)\n",
     "\n",
-    "#         mean = np.array([0.485, 0.456, 0.406])\n",
-    "#         std = np.array([0.229, 0.224, 0.225])\n",
+    "        return {\"A\": gray_img, \"B\": color_img}\n",
     "\n",
-    "#         image = Image.open(img_path).convert(\"RGB\")\n",
-    "#         image = std * image + mean\n",
-    "#         input_gray = image\n",
-    "#         input_gray = np.dot(input_gray[...,:3], [0.299, 0.587, 0.114])\n",
+    "    def __len__(self):\n",
+    "        return len(self.gray_files)\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "root = '../GANdataset/victorian/'\n",
+    "img_height = 256\n",
+    "img_width = 256"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "transforms_ = [\n",
+    "    # transforms.Resize((img_height, img_width), Image.BICUBIC),\n",
+    "    transforms.ToTensor(),\n",
+    "    # transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),\n",
+    "]\n",
     "\n",
-    "#         return torch.FloatTensor(input_gray.transpose((0,1))), torch.FloatTensor(image.transpose((2,0,1)))\n",
     "\n",
-    "#     def __len__(self):\n",
-    "#         return len(self.imgs)\n"
+    "train_loader = DataLoader(\n",
+    "    victorianDataset(root, transforms_=transforms_),\n",
+    "    batch_size=batch_size,\n",
+    "    shuffle=True\n",
+    ")"
    ]
   },
   {
@@ -95,12 +120,22 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "train_dataset = victorianDataset(resized_dir)\n",
-    "train_loader = data.DataLoader(train_dataset,\n",
-    "                        batch_size=batch_size,\n",
-    "                        shuffle=True,\n",
-    "                        # num_workers=4,\n",
-    "                        pin_memory=True)"
+    "fig = plt.figure(figsize=(10, 5))\n",
+    "rows = 1 \n",
+    "cols = 2\n",
+    "\n",
+    "for X in train_loader:\n",
+    "    \n",
+    "    ax1 = fig.add_subplot(rows, cols, 1)\n",
+    "    ax1.imshow(np.clip(np.transpose(X[\"A\"][0], (1,2,0)), 0, 1))\n",
+    "    ax1.set_title('gray img')\n",
+    "\n",
+    "    ax2 = fig.add_subplot(rows, cols, 2)\n",
+    "    ax2.imshow(np.clip(np.transpose(X[\"B\"][0], (1,2,0)), 0, 1))\n",
+    "    ax2.set_title('color img')    \n",
+    "\n",
+    "    plt.show()\n",
+    "    break"
    ]
   },
   {
@@ -109,20 +144,39 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "test_dataset = victorianDataset(test_dir)\n",
-    "test_loader = data.DataLoader(test_dataset,\n",
-    "                        batch_size=batch_size,\n",
-    "                        shuffle=True,\n",
-    "                        # num_workers=4,\n",
-    "                        pin_memory=True)"
+    "test_root = root + 'test/'\n",
+    "test_batch_size = 6\n",
+    "\n",
+    "test_loader = DataLoader(\n",
+    "    victorianDataset(test_root, transforms_=transforms_),\n",
+    "    batch_size=test_batch_size,\n",
+    "    shuffle=True\n",
+    ")"
    ]
   },
   {
    "cell_type": "code",
    "execution_count": null,
    "metadata": {},
    "outputs": [],
-   "source": []
+   "source": [
+    "fig = plt.figure(figsize=(10, 5))\n",
+    "rows = 1 \n",
+    "cols = 2\n",
+    "\n",
+    "for X in test_loader:\n",
+    "    \n",
+    "    ax1 = fig.add_subplot(rows, cols, 1)\n",
+    "    ax1.imshow(np.clip(np.transpose(X[\"A\"][0], (1,2,0)), 0, 1))\n",
+    "    ax1.set_title('gray img')\n",
+    "\n",
+    "    ax2 = fig.add_subplot(rows, cols, 2)\n",
+    "    ax2.imshow(np.clip(np.transpose(X[\"B\"][0], (1,2,0)), 0, 1))\n",
+    "    ax2.set_title('color img')    \n",
+    "\n",
+    "    plt.show()\n",
+    "    break"
+   ]
   },
   {
    "cell_type": "code",
@@ -134,12 +188,7 @@
     "    inp = inp.numpy().transpose((1,2,0))\n",
     "    print(inp.shape)\n",
     "    inp = np.clip(inp, 0, 1) \n",
-    "    plt.imshow(inp)\n",
-    "\n",
-    "def gray_imshow(inp):\n",
-    "    inp = inp.numpy()#.transpose((1,2,0))\n",
-    "    print(inp.shape)\n",
-    "    plt.imshow(inp,cmap = plt.get_cmap('gray'))\n"
+    "    plt.imshow(inp)"
    ]
   },
   {
@@ -383,11 +432,11 @@
     "for epoch in range(max_epoch):\n",
     "    loss_D = 0.0\n",
     "    for i, data in enumerate(train_loader):\n",
-    "        gray, color = data\n",
-    "        #print(len(data[0]))\n",
-    "        b_size = len(data[0])\n",
+    "        gray, color = data['A'], data['B']\n",
+    "        # print(len(data['A']))\n",
+    "        b_size = len(data['A'])\n",
     "\n",
-    "        color = torch.from_numpy(np.resize(color.numpy(), (b_size, 3, 64, 64))) ### 위에서 normalize 안해서\n",
+    "        color = torch.from_numpy(np.resize(color.numpy(), (b_size, 3, 64, 64))) \n",
     "        # gray >> grays (batch_size * 1 * 64 * 64)\n",
     "        grays = torch.from_numpy(np.resize(gray.numpy(), (b_size, 1, 64, 64)))\n",
     "        \n",
@@ -441,8 +490,7 @@
     "        #print(fake.shape)\n",
     "        fake_img = torchvision.utils.make_grid(fake_img.data)\n",
     "\n",
-    "\n",
-    "    if (epoch + 1) % 50 == 0:\n",
+    "    if (epoch + 1) % 2 == 0:\n",
     "        print('[%d, %5d] real loss: %.4f, fake_loss : %.4f, g_loss : %.4f' % (epoch + 1, i+1, real_loss.item(),fake_loss.item(), g_loss.item()))\n",
     "        imshow(fake_img.cpu())\n",
     "        plt.show()"
@@ -457,19 +505,20 @@
     "Discri.eval()\n",
     "Gener.eval()\n",
     "\n",
-    "fixed_noise = torch.randn(batch_size, 1, 64, 64).uniform_(0,1)\n",
+    "fixed_noise = torch.randn(test_batch_size, 1, 64, 64).uniform_(0,1)\n",
     "\n",
     "for i, data in enumerate(test_loader,0) :\n",
-    "    images, label = data\n",
-    "    \n",
-    "    if len(data[0]) != batch_size:\n",
+    "    images, label = data['A'], data['B']\n",
+    "\n",
+    "    if len(data['A']) != test_batch_size:\n",
     "        continue\n",
-    "        \n",
-    "    grays = torch.from_numpy(np.resize(images.numpy(), (batch_size, 1, 64, 64)))\n",
+    "\n",
+    "    grays = torch.from_numpy(np.resize(images.numpy(), (test_batch_size, 1, 64, 64)))\n",
+    "    print(grays.shape)\n",
     "    \n",
     "    gray = to_variable(torch.cat([grays,fixed_noise],dim = 1))\n",
     "    \n",
-    "    output = Gener(gray)\n",
+    "    # output = Gener(gray)\n",
     "    inputs = torchvision.utils.make_grid(grays)\n",
     "    labels = torchvision.utils.make_grid(label)\n",
     "    out = torchvision.utils.make_grid(output.data)\n",