update code

PaddlePaddle · Mar 16, 2022 · 11862d4 · 11862d4 · paddle-bot-old · Mar 17, 2022
1 parent d3fa155
commit 11862d4
Show file tree

Hide file tree

Showing 7 changed files with 45 additions and 23 deletions.
diff --git a/paddle/fluid/inference/api/analysis_config.cc b/paddle/fluid/inference/api/analysis_config.cc
@@ -105,11 +105,13 @@ void AnalysisConfig::DisableGpu() {
   Update();
 }
 
-void AnalysisConfig::EnableUseGpuFp16() {
+void AnalysisConfig::Exp_EnableUseGpuFp16(
+    std::unordered_set<std::string> op_list) {
 #if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
   use_gpu_fp16_ = true;
+  gpu_fp16_disabled_op_types_.insert(op_list.begin(), op_list.end());
 #else
-  LOG(ERROR) << "Please compile with gpu to EnableUseGpuFp16()";
+  LOG(ERROR) << "Please compile with gpu to Exp_EnableUseGpuFp16()";
   use_gpu_fp16_ = false;
 #endif
 
@@ -591,12 +593,13 @@ void AnalysisConfig::Update() {
   if (use_gpu_fp16_) {
 #if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
     if (!enable_ir_optim_) {
-      LOG(ERROR)
-          << "EnableUseGpuFp16() only works when IR optimization is enabled.";
+      LOG(ERROR) << "Exp_EnableUseGpuFp16() only works when IR optimization is "
+                    "enabled.";
     } else if (!use_gpu()) {
-      LOG(ERROR) << "EnableUseGpuFp16() only works when use_gpu is enabled.";
+      LOG(ERROR)
+          << "Exp_EnableUseGpuFp16() only works when use_gpu is enabled.";
     } else {
-      pass_builder()->EnableUseGpuFp16();
+      pass_builder()->Exp_EnableUseGpuFp16();
     }
 #endif
   }

diff --git a/paddle/fluid/inference/api/analysis_predictor.cc b/paddle/fluid/inference/api/analysis_predictor.cc
@@ -872,7 +872,7 @@ void AnalysisPredictor::PrepareArgument() {
     argument_.SetDlnneMinSubgraphSize(config_.dlnne_min_subgraph_size_);
   }
 
-  if (config_.use_gpu_fp16()) {
+  if (config_.gpu_fp16_enabled()) {
     argument_.SetUseGPUFp16(true);
     argument_.SetGpuFp16DisabledOpTypes(config_.gpu_fp16_disabled_op_types_);
   }

diff --git a/paddle/fluid/inference/api/analysis_predictor_tester.cc b/paddle/fluid/inference/api/analysis_predictor_tester.cc
@@ -375,6 +375,19 @@ TEST(AnalysisPredictor, enable_onnxruntime) {
   ASSERT_TRUE(!config.use_onnxruntime());
 }
 
+TEST(AnalysisPredictor, exp_enable_use_gpu_fp16) {
+  AnalysisConfig config;
+  config.SwitchIrOptim();
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
+  config.EnableUseGpu(100, 0);
+  config.Exp_EnableUseGpuFp16();
+  ASSERT_TRUE(config.gpu_fp16_enabled());
+#else
+  config.DisableGpu();
+#endif
+  LOG(INFO) << config.Summary();
+}
+
 }  // namespace paddle
 
 namespace paddle_infer {
@@ -434,6 +447,19 @@ TEST(Predictor, EnableONNXRuntime) {
   auto predictor = CreatePredictor(config);
 }
 
+TEST(Predictor, Exp_EnableUseGpuFp16) {
+  Config config;
+  config.SetModel(FLAGS_dirname);
+  config.SwitchIrOptim();
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
+  config.EnableUseGpu(100, 0);
+  config.Exp_EnableUseGpuFp16();
+#else
+  config.DisableGpu();
+#endif
+  auto predictor = CreatePredictor(config);
+}
+
 TEST(Tensor, CpuShareExternalData) {
   Config config;
   config.SetModel(FLAGS_dirname);

diff --git a/paddle/fluid/inference/api/paddle_analysis_config.h b/paddle/fluid/inference/api/paddle_analysis_config.h
@@ -254,26 +254,18 @@ struct PD_INFER_DECL AnalysisConfig {
   ///
   void DisableGpu();
   ///
-  /// \brief Turn on GPU fp16 precision.
-  ///
-  ///
-  void EnableUseGpuFp16();
-  ///
-  /// \brief Specify the operator type list to keep original calculation
-  /// precision.
+  /// \brief Enable GPU fp16 precision computation, in experimental state.
   ///
   /// \param op_list The operator type list.
   ///
-  void SetGpuFp16DisabledOp(std::unordered_set<std::string> op_list) {
-    gpu_fp16_disabled_op_types_.insert(op_list.begin(), op_list.end());
-  }
+  void Exp_EnableUseGpuFp16(std::unordered_set<std::string> op_list = {});
   ///
   /// \brief A boolean state telling whether the GPU fp16 precision is turned
   /// on.
   ///
   /// \return bool Whether the GPU fp16 precision is turned on.
   ///
-  bool use_gpu_fp16() const { return use_gpu_fp16_; }
+  bool gpu_fp16_enabled() const { return use_gpu_fp16_; }
 
   ///
   /// \brief Turn on XPU.

diff --git a/paddle/fluid/inference/api/paddle_pass_builder.cc b/paddle/fluid/inference/api/paddle_pass_builder.cc
@@ -172,7 +172,7 @@ void GpuPassStrategy::EnableCUDNN() {
   use_cudnn_ = true;
 }
 
-void GpuPassStrategy::EnableUseGpuFp16() {
+void GpuPassStrategy::Exp_EnableUseGpuFp16() {
   passes_.assign({
     "is_test_pass",                               //
         "simplify_with_basic_ops_pass",           //

diff --git a/paddle/fluid/inference/api/paddle_pass_builder.h b/paddle/fluid/inference/api/paddle_pass_builder.h
@@ -126,7 +126,7 @@ class PD_INFER_DECL PassStrategy : public PaddlePassBuilder {
   virtual void EnableCUDNN() {}
 
   /// \brief Enable use gpu fp16 kernel.
-  virtual void EnableUseGpuFp16() {}
+  virtual void Exp_EnableUseGpuFp16() {}
 
   /// \brief Enable the use of MKLDNN.
   /// The MKLDNN control exists in both CPU and GPU mode, because there can
@@ -232,7 +232,7 @@ class PD_INFER_DECL GpuPassStrategy : public PassStrategy {
   void EnableCUDNN() override;
 
   /// \brief Enable the use of gpu fp16 kernel.
-  void EnableUseGpuFp16() override;
+  void Exp_EnableUseGpuFp16() override;
 
   /// \brief Not supported in GPU mode yet.
   void EnableMKLDNN() override;

diff --git a/paddle/fluid/pybind/inference_api.cc b/paddle/fluid/pybind/inference_api.cc
@@ -551,8 +551,9 @@ void BindAnalysisConfig(py::module *m) {
       .def("params_file", &AnalysisConfig::params_file)
       .def("enable_use_gpu", &AnalysisConfig::EnableUseGpu,
            py::arg("memory_pool_init_size_mb"), py::arg("device_id") = 0)
-      .def("enable_use_gpu_fp16", &AnalysisConfig::EnableUseGpuFp16)
-      .def("set_gpu_fp16_disabled_op", &AnalysisConfig::SetGpuFp16DisabledOp)
+      .def("exp_enable_use_gpu_fp16", &AnalysisConfig::Exp_EnableUseGpuFp16,
+           py::arg("gpu_fp16_disabled_op_types") =
+               std::unordered_set<std::string>({}))
       .def("enable_xpu", &AnalysisConfig::EnableXpu,
            py::arg("l3_workspace_size") = 16 * 1024 * 1024,
            py::arg("locked") = false, py::arg("autotune") = true,