docs: [Automated] Regenerating documenation from

TRTorch Github Bot · TRTorch Github Bot · commit 1824cb2c059e · 2021-02-09T22:43:56.000Z
Signed-off-by: TRTorch Github Bot &lt;trtorch.github.bot@nvidia.com&gt;
diff --git a/docs/_cpp_api/program_listing_file_cpp_api_include_trtorch_trtorch.h.html b/docs/_cpp_api/program_listing_file_cpp_api_include_trtorch_trtorch.h.html
@@ -467,6 +467,8 @@ <h1 id="cpp-api-program-listing-file-cpp-api-include-trtorch-trtorch-h--page-roo
 
   <span class="n">DataType</span> <span class="n">op_precision</span> <span class="o">=</span> <span class="n">DataType</span><span class="o">::</span><span class="n">kFloat</span><span class="p">;</span>
 
+  <span class="kt">bool</span> <span class="n">disable_tf32</span> <span class="o">=</span> <span class="nb">false</span><span class="p">;</span>
+
   <span class="kt">bool</span> <span class="n">refit</span> <span class="o">=</span> <span class="nb">false</span><span class="p">;</span>
 
   <span class="kt">bool</span> <span class="n">debug</span> <span class="o">=</span> <span class="nb">false</span><span class="p">;</span>
diff --git a/docs/_cpp_api/structtrtorch_1_1CompileSpec.html b/docs/_cpp_api/structtrtorch_1_1CompileSpec.html
@@ -793,6 +793,29 @@ <h2 id="struct-documentation">
             </p>
            </dd>
           </dl>
+          <dl class="cpp var">
+           <dt id="_CPPv4N7trtorch11CompileSpec12disable_tf32E">
+            <span class="target" id="structtrtorch_1_1CompileSpec_1a0daef036d4cbdac49dda3c9cd284a661">
+            </span>
+            bool
+            <code class="sig-name descname">
+             disable_tf32
+            </code>
+            = false
+            <a class="headerlink" href="#_CPPv4N7trtorch11CompileSpec12disable_tf32E" title="Permalink to this definition">
+             ¶
+            </a>
+            <br/>
+           </dt>
+           <dd>
+            <p>
+             Prevent Float32 layers from using TF32 data format
+            </p>
+            <p>
+             TF32 computes inner products by rounding the inputs to 10-bit mantissas before multiplying, but accumulates the sum using 23-bit mantissas. This is the behavior of FP32 layers by default.
+            </p>
+           </dd>
+          </dl>
           <dl class="cpp var">
            <dt id="_CPPv4N7trtorch11CompileSpec5refitE">
             <span class="target" id="structtrtorch_1_1CompileSpec_1a637f91d7d5b05ad01d7f4a38ab1e4f46">
diff --git a/docs/_notebooks/Resnet50-example.html b/docs/_notebooks/Resnet50-example.html
@@ -675,7 +675,7 @@
         </div>
        </div>
        <p>
-        <img alt="e8cc1e76fbec4ae18bcf6bf7afd29fa5" src="http://developer.download.nvidia.com/compute/machine-learning/frameworks/nvidia_logo.png"/>
+        <img alt="70511f56741d40949896fdabbc794e22" src="http://developer.download.nvidia.com/compute/machine-learning/frameworks/nvidia_logo.png"/>
        </p>
        <h1 id="notebooks-resnet50-example--page-root">
         TRTorch Getting Started - ResNet 50
diff --git a/docs/_notebooks/lenet-getting-started.html b/docs/_notebooks/lenet-getting-started.html
@@ -769,7 +769,7 @@
         </div>
        </div>
        <p>
-        <img alt="6bbcefe2c1b143878ad41f204a6698b5" src="http://developer.download.nvidia.com/compute/machine-learning/frameworks/nvidia_logo.png"/>
+        <img alt="4aab7546fe7547e68f367db08f8f5138" src="http://developer.download.nvidia.com/compute/machine-learning/frameworks/nvidia_logo.png"/>
        </p>
        <h1 id="notebooks-lenet-getting-started--page-root">
         TRTorch Getting Started - LeNet
diff --git a/docs/_notebooks/ssd-object-detection-demo.html b/docs/_notebooks/ssd-object-detection-demo.html
@@ -789,7 +789,7 @@
         </div>
        </div>
        <p>
-        <img alt="e0d693b92c2c4e03921a2b446e3e44d1" src="http://developer.download.nvidia.com/compute/machine-learning/frameworks/nvidia_logo.png"/>
+        <img alt="75476f2f22d44824a3852a4296681786" src="http://developer.download.nvidia.com/compute/machine-learning/frameworks/nvidia_logo.png"/>
        </p>
        <h1 id="notebooks-ssd-object-detection-demo--page-root">
         Object Detection with TRTorch (SSD)
diff --git a/docs/_sources/_cpp_api/program_listing_file_cpp_api_include_trtorch_trtorch.h.rst.txt b/docs/_sources/_cpp_api/program_listing_file_cpp_api_include_trtorch_trtorch.h.rst.txt
@@ -107,6 +107,8 @@ Program Listing for File trtorch.h
    
      DataType op_precision = DataType::kFloat;
    
+     bool disable_tf32 = false;
+   
      bool refit = false;
    
      bool debug = false;
diff --git a/docs/genindex.html b/docs/genindex.html
@@ -1038,6 +1038,11 @@ <h2 id="T">
              [1]
             </a>
            </li>
+           <li>
+            <a href="_cpp_api/structtrtorch_1_1CompileSpec.html#_CPPv4N7trtorch11CompileSpec12disable_tf32E">
+             trtorch::CompileSpec::disable_tf32 (C++ member)
+            </a>
+           </li>
            <li>
             <a href="_cpp_api/structtrtorch_1_1CompileSpec.html#_CPPv4N7trtorch11CompileSpec16EngineCapabilityE">
              trtorch::CompileSpec::EngineCapability (C++ enum)
diff --git a/docs/objects.inv b/docs/objects.inv
diff --git a/docs/py_api/trtorch.html b/docs/py_api/trtorch.html
@@ -721,6 +721,7 @@ <h2 id="functions">
         <span class="s2">"allow_gpu_fallback"</span><span class="p">:</span> <span class="n">false</span><span class="p">,</span> <span class="c1"># (DLA only) Allow layers unsupported on DLA to run on GPU</span>
     <span class="p">},</span>
     <span class="s2">"op_precision"</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">half</span><span class="p">,</span> <span class="c1"># Operating precision set to FP16</span>
+    <span class="s2">"disable_tf32"</span><span class="p">:</span> <span class="kc">False</span><span class="p">,</span> <span class="c1"># Force FP32 layers to use traditional as FP32 format vs the default behavior of rounding the inputs to 10-bit mantissas before multiplying, but accumulates the sum using 23-bit mantissas</span>
     <span class="s2">"refit"</span><span class="p">:</span> <span class="n">false</span><span class="p">,</span> <span class="c1"># enable refit</span>
     <span class="s2">"debug"</span><span class="p">:</span> <span class="n">false</span><span class="p">,</span> <span class="c1"># enable debuggable engine</span>
     <span class="s2">"strict_types"</span><span class="p">:</span> <span class="n">false</span><span class="p">,</span> <span class="c1"># kernels should strictly run in operating precision</span>
@@ -969,7 +970,7 @@ <h2 id="functions">
          <span class="sig-paren">
           )
          </span>
-         → &lt;torch._C.ScriptClass object at 0x7f1a30a16a08&gt;
+         → &lt;torch._C.ScriptClass object at 0x7f927f22e228&gt;
          <a class="headerlink" href="#trtorch.TensorRTCompileSpec" title="Permalink to this definition">
           ¶
          </a>
@@ -1023,6 +1024,7 @@ <h2 id="functions">
             <span class="s2">"allow_gpu_fallback"</span><span class="p">:</span> <span class="n">false</span><span class="p">,</span> <span class="c1"># (DLA only) Allow layers unsupported on DLA to run on GPU</span>
         <span class="p">},</span>
         <span class="s2">"op_precision"</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">half</span><span class="p">,</span> <span class="c1"># Operating precision set to FP16</span>
+        <span class="s2">"disable_tf32"</span><span class="p">:</span> <span class="kc">False</span><span class="p">,</span> <span class="c1"># Force FP32 layers to use traditional as FP32 format vs the default behavior of rounding the inputs to 10-bit mantissas before multiplying, but accumulates the sum using 23-bit mantissas</span>
         <span class="s2">"refit"</span><span class="p">:</span> <span class="kc">False</span><span class="p">,</span> <span class="c1"># enable refit</span>
         <span class="s2">"debug"</span><span class="p">:</span> <span class="kc">False</span><span class="p">,</span> <span class="c1"># enable debuggable engine</span>
         <span class="s2">"strict_types"</span><span class="p">:</span> <span class="kc">False</span><span class="p">,</span> <span class="c1"># kernels should strictly run in operating precision</span>
diff --git a/docs/searchindex.js b/docs/searchindex.js