apache · KellenSunderland · Oct 20, 2019 · Jun 28, 2019 · Jun 28, 2019 · Jun 28, 2019
diff --git a/3rdparty/onnx-tensorrt b/3rdparty/onnx-tensorrt
@@ -41,9 +41,10 @@ popd
 
 # Install TensorRT
 echo "TensorRT build enabled. Installing TensorRT."
-wget -qO tensorrt.deb https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1604/x86_64/nvinfer-runtime-trt-repo-ubuntu1604-5.0.2-ga-cuda10.0_1-1_amd64.deb
+wget -qO tensorrt.deb https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1604/x86_64/nvidia-machine-learning-repo-ubuntu1604_1.0.0-1_amd64.deb
 dpkg -i tensorrt.deb
 apt-get update
-apt-get install -y --allow-downgrades libnvinfer5=5.1.2-1+cuda10.0
-apt-get install -y --allow-downgrades libnvinfer-dev=5.1.2-1+cuda10.0
+apt-get install -y --allow-downgrades libnvinfer5=5.1.5-1+cuda10.0
+apt-get install -y --allow-downgrades libnvinfer-dev=5.1.5-1+cuda10.0
+apt-mark hold libnvinfer5 libnvinfer-dev
 rm tensorrt.deb
@@ -42,6 +42,8 @@ def init_tensorrt_params(sym, arg_params, aux_params):
     :param aux_params: aux_params
     :return arg_params, aux_params: remaining params that are not in TensorRT nodes
     """
+    arg_params = arg_params.copy()
+    aux_params = aux_params.copy()
     for s in sym.get_internals():
         new_params_names = ""
         tensorrt_params = {}

diff --git a/src/operator/subgraph/tensorrt/nnvm_to_onnx-inl.h b/src/operator/subgraph/tensorrt/nnvm_to_onnx-inl.h
@@ -84,7 +84,13 @@ void ConvDeconvConvertHelper(NodeProto *node_proto,
                              ConvDeconvType type);
 
 // Forward declarations
-void ConvertConvolution(NodeProto *node_proto,
+void ConvertIdentity(NodeProto* node_proto,
+                     const NodeAttrs &attrs,
+                     const nnvm::IndexedGraph& ig,
+                     const array_view<IndexedGraph::NodeEntry> &inputs);
+
+void ConvertConvolution(
+                        NodeProto *node_proto,
                         const NodeAttrs &attrs,
                         const nnvm::IndexedGraph &ig,
                         const array_view<IndexedGraph::NodeEntry> &inputs);
@@ -139,12 +145,12 @@ void ConvertElementwiseAdd(NodeProto *node_proto,
                     const nnvm::IndexedGraph &ig,
                     const array_view<IndexedGraph::NodeEntry> &inputs);
 
-void ConvertElementwiseSub(NodeProto *node_proto,
+void ConvertElementwiseMul(NodeProto *node_proto,
                     const NodeAttrs &attrs,
                     const nnvm::IndexedGraph &ig,
                     const array_view<IndexedGraph::NodeEntry> &inputs);
 
-void ConvertElementwiseMul(NodeProto *node_proto,
+void ConvertElementwiseSub(NodeProto *node_proto,
                     const NodeAttrs &attrs,
                     const nnvm::IndexedGraph &ig,
                     const array_view<IndexedGraph::NodeEntry> &inputs);
@@ -168,6 +174,7 @@ std::string ConvertNnvmGraphToOnnx(const nnvm::Graph &g,
     std::unordered_map<std::string, NDArray>* params_map);
 
 static const std::unordered_map<std::string, ConverterFunction> converter_map = {
+  {"_copy", ConvertIdentity},
   {"Activation", ConvertActivation},
   {"BatchNorm", ConvertBatchNorm},
   {"clip", ConvertClip},
@@ -176,8 +183,8 @@ static const std::unordered_map<std::string, ConverterFunction> converter_map =
   {"Concat", ConvertConcatenate},
   {"Dropout", ConvertDropout},
   {"elemwise_add", ConvertElementwiseAdd},
-  {"elemwise_sub", ConvertElementwiseSub},
   {"elemwise_mul", ConvertElementwiseMul},
+  {"elemwise_sub", ConvertElementwiseSub},
   {"Flatten", ConvertFlatten},
   {"FullyConnected", ConvertFullyConnected},
   {"Pad", ConvertPad},

diff --git a/src/operator/subgraph/tensorrt/nnvm_to_onnx.cc b/src/operator/subgraph/tensorrt/nnvm_to_onnx.cc
@@ -171,6 +171,12 @@ std::string ConvertNnvmGraphToOnnx(
   return serialized_onnx_graph;
 }
 
+void ConvertIdentity(NodeProto* node_proto, const NodeAttrs& attrs,
+                     const nnvm::IndexedGraph& /*ig*/,
+                     const array_view<IndexedGraph::NodeEntry>& /*inputs*/) {
+  node_proto->set_op_type("Identity");
+}
+
 template <class ConvDeconvParam>
 void ConvDeconvConvertHelper(NodeProto* node_proto, const NodeAttrs& attrs,
                              const nnvm::IndexedGraph& /*ig*/,
@@ -262,10 +268,12 @@ void ConvertPooling(NodeProto* node_proto, const NodeAttrs& attrs,
   const bool global_pool = pooling_param.global_pool;
 
   if (global_pool) {
-    if (pool_type == 0) {
+    if (pool_type == pool_enum::kMaxPooling) {
       node_proto->set_op_type("GlobalMaxPool");
-    } else {
+    } else if (pool_type == pool_enum::kAvgPooling) {
       node_proto->set_op_type("GlobalAveragePool");
+    } else {
+      LOG(FATAL) << "Pool type of node '" << attrs.name << "' unsupported: " << attrs.name;
     }
     return;
   }
@@ -298,12 +306,29 @@ void ConvertPooling(NodeProto* node_proto, const NodeAttrs& attrs,
     strides->add_ints(static_cast<int64>(kval));
   }
 
-  if (pool_type == 0) {
+  // ceil_mode
+  AttributeProto* const ceil_mode = node_proto->add_attribute();
+  ceil_mode->set_name("ceil_mode");
+  ceil_mode->set_type(AttributeProto::INT);
+  ceil_mode->set_i(static_cast<int64>(pooling_param.pooling_convention == pool_enum::kFull));
+
+  if (pool_type == pool_enum::kMaxPooling) {
     node_proto->set_op_type("MaxPool");
-  } else {
+  } else if (pool_type == pool_enum::kAvgPooling) {
     node_proto->set_op_type("AveragePool");
-  }  // average pooling
-  // not global pooling
+  } else {
+    LOG(FATAL) << "Pool type of node '" << attrs.name << "' unsupported: " << attrs.name;
+  }
+
+  // count_include_pad
+  AttributeProto* const count_include_pad = node_proto->add_attribute();
+  count_include_pad->set_name("count_include_pad");
+  count_include_pad->set_type(AttributeProto::INT);
+  if (pooling_param.count_include_pad.has_value()) {
+    count_include_pad->set_i(pooling_param.count_include_pad.value());
+  } else {
+    count_include_pad->set_i(1);
+  }
 }  // end ConvertPooling
 
 void ConvertRelu(NodeProto* node_proto, const NodeAttrs& /*attrs*/,
@@ -608,7 +633,7 @@ void ConvertOutput(
 void ConvertClip(NodeProto* node_proto, const NodeAttrs& attrs,
                  const nnvm::IndexedGraph& /*ig*/,
                  const array_view<IndexedGraph::NodeEntry>& /*inputs*/) {
-  const auto param = nnvm::get<ClipParam>(attrs.parsed);
+  const auto& param = nnvm::get<ClipParam>(attrs.parsed);
 
   node_proto->set_op_type("Clip");
 
@@ -628,7 +653,7 @@ void ConvertClip(NodeProto* node_proto, const NodeAttrs& attrs,
 void ConvertPad(NodeProto* node_proto, const NodeAttrs& attrs,
                 const nnvm::IndexedGraph& /*ig*/,
                 const array_view<IndexedGraph::NodeEntry>& /*inputs*/) {
-  const auto param = nnvm::get<PadParam>(attrs.parsed);
+  const auto& param = nnvm::get<PadParam>(attrs.parsed);
 
   node_proto->set_op_type("Pad");
 
@@ -647,7 +672,7 @@ void ConvertPad(NodeProto* node_proto, const NodeAttrs& attrs,
       mode->set_s("reflect");
       break;
     default:
-      throw dmlc::Error("Such mode of padding doesn't exist doesn't exist");
+      throw dmlc::Error("Such mode of padding doesn't exist");
   }
 
   // pads

diff --git a/src/operator/subgraph/tensorrt/onnx_to_tensorrt.cc b/src/operator/subgraph/tensorrt/onnx_to_tensorrt.cc
@@ -79,7 +79,7 @@ std::tuple<unique_ptr<nvinfer1::ICudaEngine>,
   auto trt_logger = std::unique_ptr<TRT_Logger>(new TRT_Logger(verbosity));
   auto trt_builder = nvinfer1::createInferBuilder(*trt_logger);
   auto trt_network = trt_builder->createNetwork();
-  auto trt_parser  = InferObject(nvonnxparser::createParser(trt_network, *trt_logger));
+  auto trt_parser  = InferObject(nvonnxparser::createParser(*trt_network, *trt_logger));
   ::ONNX_NAMESPACE::ModelProto parsed_model;
   // We check for a valid parse, but the main effect is the side effect
   // of populating parsed_model

diff --git a/src/operator/subgraph/tensorrt/tensorrt-inl.h b/src/operator/subgraph/tensorrt/tensorrt-inl.h
@@ -34,6 +34,14 @@
 #include <string>
 #include <vector>
 
+#include "../../nn/activation-inl.h"
+#include "../../nn/batch_norm-inl.h"
+#include "../../nn/concat-inl.h"
+#include "../../nn/convolution-inl.h"
+#include "../../nn/deconvolution-inl.h"
+#include "../../nn/dropout-inl.h"
+#include "../../nn/fully_connected-inl.h"
+#include "../../nn/pooling-inl.h"
 #include "../common.h"
 #include "../subgraph_property.h"
 #include "nnvm_to_onnx-inl.h"
@@ -85,18 +93,12 @@ struct TRTEngineParam {
 class TensorrtSelector : public SubgraphSelector {
  public:
   const std::unordered_set<std::string> unconditionalTRTops = {
-    "BatchNorm",
+    "_copy",
     "clip",
-    "Concat",
-    "Convolution",
-    "Deconvolution",
-    "Dropout",
     "elemwise_add",
     "elemwise_sub",
     "elemwise_mul",
     "Flatten",
-    "FullyConnected",
-    "mean",
     "Pad",
     "relu",
     "rsqrt",
@@ -112,13 +114,94 @@ class TensorrtSelector : public SubgraphSelector {
 
   bool isTRTCompatible(const nnvm::Node &n) {
     const std::string op_name = n.op()->name;
+    if (op_name == "FullyConnected") {
+      const auto& param = nnvm::get<FullyConnectedParam>(n.attrs.parsed);
+      return !param.no_bias;
+    }
+
     if (op_name == "Pooling") {
-      return (n.attrs.dict.at("pool_type") == "avg" ||
-          n.attrs.dict.at("pool_type") == "max");
+      const auto& param = nnvm::get<PoolingParam>(n.attrs.parsed);
+      if (param.layout.has_value()) {
+        if (param.layout.value() == mshadow::kNHWC) {
+          LOG(INFO) << "Warning: NHWC layout (node: " << n.attrs.name
+                    << ") is not supported by TensorRT";
+          return false;
+        } else if (param.layout.value() == mshadow::kNDHWC) {
+          LOG(INFO) << "Warning: NDHWC layout (node: " << n.attrs.name
+                    << ") is not supported by TensorRT";
+          return false;
+        }
+      }
+      if (param.pooling_convention != pool_enum::kValid && !param.global_pool)
+        return false;
+      if (param.pool_type == pool_enum::kAvgPooling) {
+        if ((!param.global_pool) &&
+            (!param.count_include_pad.has_value() || param.count_include_pad.value()))
+          return false;
+        return true;
+      } else if (param.pool_type == pool_enum::kMaxPooling) {
+        return true;
+      } else {
+        return false;
+      }
     }
 
-    if (unconditionalTRTops.count(op_name)) {
-      return true;
+    if (op_name == "Convolution") {
+      const auto& param = nnvm::get<ConvolutionParam>(n.attrs.parsed);
+      if (!param.layout.has_value())
+        return true;
+      switch (param.layout.value()) {
+        case mshadow::kNCHW:
+        case mshadow::kNCW:
+        case mshadow::kNCDHW:
+          return true;
+        case mshadow::kNHWC:
+          LOG(INFO) << "Warning: NHWC layout (node: " << n.attrs.name
+                    << ") is not supported by TensorRT";
+          return false;
+        case mshadow::kNDHWC:
+          LOG(INFO) << "Warning: NDHWC layout (node: " << n.attrs.name
+                    << ") is not supported by TensorRT";
+          return false;
+        default:
+          LOG(INFO) << "Warning: Layout (node: " << n.attrs.name
+                    << ") is unknown (so unsupported by TensorRT)";
+          return false;
+      }
+    }
+
+    if (op_name == "Deconvolution") {
+      const auto& param = nnvm::get<DeconvolutionParam>(n.attrs.parsed);
+      if (!param.layout.has_value())
+        return true;
+      switch (param.layout.value()) {
+        case mshadow::kNCHW:
+        case mshadow::kNCW:
+        case mshadow::kNCDHW:
+          return true;
+        case mshadow::kNHWC:
+          LOG(INFO) << "Warning: NHWC layout (node: " << n.attrs.name
+                    << ") is no tsupported by TensorRT";
+          return false;
+        case mshadow::kNDHWC:
+          LOG(INFO) << "Warning: NDHWC layout (node: " << n.attrs.name
+                    << ") is not supported by TensorRT";
+          return false;
+        default:
+          LOG(INFO) << "Warning: Layout (node: " << n.attrs.name
+                    << ") is unknown (so unsupported by TensorRT)";
+          return false;
+      }
+    }
+
+    if (op_name == "Concat") {
+      const auto& param = nnvm::get<ConcatParam>(n.attrs.parsed);
+      return (param.dim != 0);
+    }
+
+    if (op_name == "Dropout") {
+      const auto& param = nnvm::get<DropoutParam>(n.attrs.parsed);
+      return param.mode == dropout::kTraining && param.axes.ndim() == 0;
     }
 
     if (op_name == "Activation") {
@@ -127,6 +210,20 @@ class TensorrtSelector : public SubgraphSelector {
         n.attrs.dict.at("act_type") == "sigmoid";
     }
 
+    if (op_name == "BatchNorm") {
+      const auto& param = nnvm::get<BatchNormParam>(n.attrs.parsed);
+      if (param.axis != 1) {
+        LOG(INFO) << "Warning: Only Layout NC(D)(H)W are supported by TensorRT "
+                  << "(node " << n.attrs.name << ")";
+        return false;
+      }
+      return true;
+    }
+
+    if (unconditionalTRTops.count(op_name)) {
+      return true;
+    }
+
     return false;
   }
 

diff --git a/src/operator/subgraph/tensorrt/tensorrt.cc b/src/operator/subgraph/tensorrt/tensorrt.cc
@@ -131,7 +131,7 @@ inline bool TRTInferType(const nnvm::NodeAttrs& attrs,
     auto it_params = params_map.find(node->attrs.name);
     auto it_inputs = inputs_to_idx.find(node->attrs.name);
     if (it_params != params_map.end()) {
-      types[eid] = it_params->second.dtype();
+      types[eid] = -1;
     } else if (it_inputs != inputs_to_idx.end()) {
       types[eid] = in_types->at(it_inputs->second);
     } else {

diff --git a/tests/python/tensorrt/common.py b/tests/python/tensorrt/common.py
diff --git a/tests/python/tensorrt/lenet5_common.py b/tests/python/tensorrt/lenet5_common.py