fix benchmark

vinhngx · narendasan · commit 9bf8a7cf5b05 · 2020-07-13T22:16:45.000-07:00
Signed-off-by: Vinh Nguyen &lt;vinhn@nvidia.com&gt;
diff --git a/notebooks/LeNet-example.ipynb b/notebooks/LeNet-example.ipynb
@@ -2,7 +2,7 @@
  "cells": [
   {
    "cell_type": "code",
-   "execution_count": 9,
+   "execution_count": 1,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -80,7 +80,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 3,
+   "execution_count": 2,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -134,33 +134,44 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 25,
+   "execution_count": 9,
    "metadata": {},
    "outputs": [],
    "source": [
     "import time\n",
     "import numpy as np\n",
     "\n",
+    "import torch.backends.cudnn as cudnn\n",
+    "cudnn.benchmark = True\n",
+    "\n",
     "def benchmark(model, input_shape=(1024, 1, 32, 32), dtype='fp32', nwarmup=50, nruns=10000):\n",
     "    input_data = torch.randn(input_shape)\n",
     "    input_data = input_data.to(\"cuda\")\n",
     "    if dtype=='fp16':\n",
     "        input_data = input_data.half()\n",
     "        \n",
-    "    for _ in range(nwarmup):\n",
-    "        results = model(input_data)\n",
+    "    print(\"Warm up ...\")\n",
+    "    with torch.no_grad():\n",
+    "        for _ in range(nwarmup):\n",
+    "            features = model(input_data)\n",
+    "    torch.cuda.synchronize()\n",
+    "    print(\"Start timing ...\")\n",
+    "    timings = []\n",
+    "    with torch.no_grad():\n",
+    "        for i in range(1, nruns+1):\n",
+    "            start_time = time.time()\n",
+    "            features = model(input_data)\n",
+    "            torch.cuda.synchronize()\n",
+    "            end_time = time.time()\n",
+    "            timings.append(end_time - start_time)\n",
+    "            if i%1000==0:\n",
+    "                print('Iteration %d/%d, ave batch time %.2f ms'%(i, nruns, np.mean(timings)*1000))\n",
+    "\n",
+    "    print(\"Input shape:\", input_data.size())\n",
+    "    print(\"Output features size:\", features.size())\n",
     "    \n",
-    "    start_time = time.time()\n",
-    "    time_arr = []\n",
-    "    for _ in range(1, nruns+1):\n",
-    "        start_time = time.time()\n",
-    "        results = model(input_data)\n",
-    "        time_arr.append(time.time() - start_time)\n",
-    "        \n",
-    "        if _%1000==0:\n",
-    "            print('Iteration %d, ave batch time %.2f ms'%(_, np.mean(time_arr)*1000))\n",
-    "     \n",
-    "    print('Average batch time: %.2f ms'%(np.mean(time_arr)*1000))       "
+    "    print('Average batch time: %.2f ms'%(np.mean(timings)*1000))\n",
+    "    "
    ]
   },
   {
@@ -172,7 +183,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 26,
+   "execution_count": 10,
    "metadata": {},
    "outputs": [
     {
@@ -191,7 +202,7 @@
        ")"
       ]
      },
-     "execution_count": 26,
+     "execution_count": 10,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -203,24 +214,28 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 27,
+   "execution_count": 11,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Iteration 1000, ave batch time 0.91 ms\n",
-      "Iteration 2000, ave batch time 0.90 ms\n",
-      "Iteration 3000, ave batch time 0.90 ms\n",
-      "Iteration 4000, ave batch time 0.90 ms\n",
-      "Iteration 5000, ave batch time 0.90 ms\n",
-      "Iteration 6000, ave batch time 0.90 ms\n",
-      "Iteration 7000, ave batch time 0.90 ms\n",
-      "Iteration 8000, ave batch time 0.90 ms\n",
-      "Iteration 9000, ave batch time 0.90 ms\n",
-      "Iteration 10000, ave batch time 0.90 ms\n",
-      "Average batch time: 0.90 ms\n"
+      "Warm up ...\n",
+      "Start timing ...\n",
+      "Iteration 1000/10000, ave batch time 0.93 ms\n",
+      "Iteration 2000/10000, ave batch time 0.93 ms\n",
+      "Iteration 3000/10000, ave batch time 0.93 ms\n",
+      "Iteration 4000/10000, ave batch time 0.93 ms\n",
+      "Iteration 5000/10000, ave batch time 0.93 ms\n",
+      "Iteration 6000/10000, ave batch time 0.93 ms\n",
+      "Iteration 7000/10000, ave batch time 0.93 ms\n",
+      "Iteration 8000/10000, ave batch time 0.93 ms\n",
+      "Iteration 9000/10000, ave batch time 0.93 ms\n",
+      "Iteration 10000/10000, ave batch time 0.93 ms\n",
+      "Input shape: torch.Size([1024, 1, 32, 32])\n",
+      "Output features size: torch.Size([1024, 10])\n",
+      "Average batch time: 0.93 ms\n"
      ]
     }
    ],
@@ -241,7 +256,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 29,
+   "execution_count": 12,
    "metadata": {},
    "outputs": [
     {
@@ -263,7 +278,7 @@
        ")"
       ]
      },
-     "execution_count": 29,
+     "execution_count": 12,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -275,24 +290,28 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 30,
+   "execution_count": 13,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Iteration 1000, ave batch time 0.66 ms\n",
-      "Iteration 2000, ave batch time 0.66 ms\n",
-      "Iteration 3000, ave batch time 0.66 ms\n",
-      "Iteration 4000, ave batch time 0.65 ms\n",
-      "Iteration 5000, ave batch time 0.65 ms\n",
-      "Iteration 6000, ave batch time 0.65 ms\n",
-      "Iteration 7000, ave batch time 0.65 ms\n",
-      "Iteration 8000, ave batch time 0.65 ms\n",
-      "Iteration 9000, ave batch time 0.65 ms\n",
-      "Iteration 10000, ave batch time 0.65 ms\n",
-      "Average batch time: 0.65 ms\n"
+      "Warm up ...\n",
+      "Start timing ...\n",
+      "Iteration 1000/10000, ave batch time 0.68 ms\n",
+      "Iteration 2000/10000, ave batch time 0.68 ms\n",
+      "Iteration 3000/10000, ave batch time 0.68 ms\n",
+      "Iteration 4000/10000, ave batch time 0.68 ms\n",
+      "Iteration 5000/10000, ave batch time 0.68 ms\n",
+      "Iteration 6000/10000, ave batch time 0.68 ms\n",
+      "Iteration 7000/10000, ave batch time 0.68 ms\n",
+      "Iteration 8000/10000, ave batch time 0.68 ms\n",
+      "Iteration 9000/10000, ave batch time 0.68 ms\n",
+      "Iteration 10000/10000, ave batch time 0.68 ms\n",
+      "Input shape: torch.Size([1024, 1, 32, 32])\n",
+      "Output features size: torch.Size([1024, 10])\n",
+      "Average batch time: 0.68 ms\n"
      ]
     }
    ],
@@ -311,7 +330,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 32,
+   "execution_count": 14,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -321,7 +340,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 33,
+   "execution_count": 15,
    "metadata": {},
    "outputs": [
     {
@@ -343,7 +362,7 @@
        ")"
       ]
      },
-     "execution_count": 33,
+     "execution_count": 15,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -354,24 +373,28 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 35,
+   "execution_count": 16,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Iteration 1000, ave batch time 0.64 ms\n",
-      "Iteration 2000, ave batch time 0.65 ms\n",
-      "Iteration 3000, ave batch time 0.65 ms\n",
-      "Iteration 4000, ave batch time 0.64 ms\n",
-      "Iteration 5000, ave batch time 0.64 ms\n",
-      "Iteration 6000, ave batch time 0.64 ms\n",
-      "Iteration 7000, ave batch time 0.64 ms\n",
-      "Iteration 8000, ave batch time 0.64 ms\n",
-      "Iteration 9000, ave batch time 0.64 ms\n",
-      "Iteration 10000, ave batch time 0.64 ms\n",
-      "Average batch time: 0.64 ms\n"
+      "Warm up ...\n",
+      "Start timing ...\n",
+      "Iteration 1000/10000, ave batch time 0.68 ms\n",
+      "Iteration 2000/10000, ave batch time 0.68 ms\n",
+      "Iteration 3000/10000, ave batch time 0.68 ms\n",
+      "Iteration 4000/10000, ave batch time 0.68 ms\n",
+      "Iteration 5000/10000, ave batch time 0.68 ms\n",
+      "Iteration 6000/10000, ave batch time 0.68 ms\n",
+      "Iteration 7000/10000, ave batch time 0.68 ms\n",
+      "Iteration 8000/10000, ave batch time 0.68 ms\n",
+      "Iteration 9000/10000, ave batch time 0.68 ms\n",
+      "Iteration 10000/10000, ave batch time 0.68 ms\n",
+      "Input shape: torch.Size([1024, 1, 32, 32])\n",
+      "Output features size: torch.Size([1024, 10])\n",
+      "Average batch time: 0.68 ms\n"
      ]
     }
    ],
@@ -398,7 +421,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 8,
+   "execution_count": 17,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -427,24 +450,28 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 37,
+   "execution_count": 18,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Iteration 1000, ave batch time 0.19 ms\n",
-      "Iteration 2000, ave batch time 0.18 ms\n",
-      "Iteration 3000, ave batch time 0.19 ms\n",
-      "Iteration 4000, ave batch time 0.19 ms\n",
-      "Iteration 5000, ave batch time 0.19 ms\n",
-      "Iteration 6000, ave batch time 0.19 ms\n",
-      "Iteration 7000, ave batch time 0.19 ms\n",
-      "Iteration 8000, ave batch time 0.19 ms\n",
-      "Iteration 9000, ave batch time 0.19 ms\n",
-      "Iteration 10000, ave batch time 0.19 ms\n",
-      "Average batch time: 0.19 ms\n"
+      "Warm up ...\n",
+      "Start timing ...\n",
+      "Iteration 1000/10000, ave batch time 0.24 ms\n",
+      "Iteration 2000/10000, ave batch time 0.24 ms\n",
+      "Iteration 3000/10000, ave batch time 0.24 ms\n",
+      "Iteration 4000/10000, ave batch time 0.24 ms\n",
+      "Iteration 5000/10000, ave batch time 0.24 ms\n",
+      "Iteration 6000/10000, ave batch time 0.24 ms\n",
+      "Iteration 7000/10000, ave batch time 0.23 ms\n",
+      "Iteration 8000/10000, ave batch time 0.23 ms\n",
+      "Iteration 9000/10000, ave batch time 0.23 ms\n",
+      "Iteration 10000/10000, ave batch time 0.23 ms\n",
+      "Input shape: torch.Size([1024, 1, 32, 32])\n",
+      "Output features size: torch.Size([1, 10])\n",
+      "Average batch time: 0.23 ms\n"
      ]
     }
    ],
@@ -463,7 +490,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 39,
+   "execution_count": 19,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -492,24 +519,28 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 40,
+   "execution_count": 20,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Iteration 1000, ave batch time 0.18 ms\n",
-      "Iteration 2000, ave batch time 0.18 ms\n",
-      "Iteration 3000, ave batch time 0.18 ms\n",
-      "Iteration 4000, ave batch time 0.18 ms\n",
-      "Iteration 5000, ave batch time 0.18 ms\n",
-      "Iteration 6000, ave batch time 0.18 ms\n",
-      "Iteration 7000, ave batch time 0.18 ms\n",
-      "Iteration 8000, ave batch time 0.18 ms\n",
-      "Iteration 9000, ave batch time 0.18 ms\n",
-      "Iteration 10000, ave batch time 0.18 ms\n",
-      "Average batch time: 0.18 ms\n"
+      "Warm up ...\n",
+      "Start timing ...\n",
+      "Iteration 1000/10000, ave batch time 0.20 ms\n",
+      "Iteration 2000/10000, ave batch time 0.20 ms\n",
+      "Iteration 3000/10000, ave batch time 0.20 ms\n",
+      "Iteration 4000/10000, ave batch time 0.21 ms\n",
+      "Iteration 5000/10000, ave batch time 0.21 ms\n",
+      "Iteration 6000/10000, ave batch time 0.21 ms\n",
+      "Iteration 7000/10000, ave batch time 0.21 ms\n",
+      "Iteration 8000/10000, ave batch time 0.21 ms\n",
+      "Iteration 9000/10000, ave batch time 0.21 ms\n",
+      "Iteration 10000/10000, ave batch time 0.21 ms\n",
+      "Input shape: torch.Size([1024, 1, 32, 32])\n",
+      "Output features size: torch.Size([1, 10])\n",
+      "Average batch time: 0.21 ms\n"
      ]
     }
    ],