New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

Added oneDNN reduce_op GRAD kernel #32280

Merged

luotao1 merged 43 commits into PaddlePaddle:develop from jakpiase:reduce_grad

Apr 21, 2021

Contributor

jakpiase commented Apr 14, 2021

PR types

New features

PR changes

OPs

Describe

Added oneDNN reduce_op GRAD fp32 and bf16 kernels (reduce_sum, reduce_mean) for enabling Word2Vec model.
Forward operator PR link: Reduce FWD

Jakub Piasecki and others added 29 commits

December 2, 2020 14:40


          added external reorder to profiler

1ecc4cf


          resolved conflicts

d4f9ad4


          Merge branch 'develop' of https://github.com/PaddlePaddle/Paddle into…

f85e7a3

… reduce_onednn


          added mkldnn reduce op kernel

5c02f89


          Merge branch 'develop' of https://github.com/PaddlePaddle/Paddle into…

7c3b736

… reduce_onednn


          refactored reduce op

4147b25


          reverted old file

726846f


          added clang formatting


          removed unnecessary imports and comments

f2555e5


          minor change

8f80eb5


          Merge branch 'develop' of https://github.com/PaddlePaddle/Paddle into…

539fe3c

… reduce_onednn


          merged with develop

3dfabd9


          Revert "merged with develop"

895f948

This reverts commit 3dfabd9.


          minor change

cd9d2f3


          fixed mispelling

87fc5a1


          Minor refactoring

a75ee12


          minor change

b442889


          importet necessary modules

27dec3a


          minor change

71089fe


          minor formatting change

29097ce


          excluded cuda from bf test

164043a


          fixed static mode in test_resnet_v2

be36f94


          added formatting

424083f


          added support for edge case

87b5b38


          added files for reduce grad

94e4ace


          added grad tests for onednn reduce

9ae1005


          resolved conflicts

cfa2519


          added formatting

7d3797f


          minor changes

782e25c

paddle-bot-old bot commented Apr 14, 2021

Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

jakpiase force-pushed the reduce_grad branch from 1d139ce to bd69270 Compare

April 14, 2021 12:04


          minor formatting change

ffe6156

jakpiase force-pushed the reduce_grad branch from d69c054 to ffe6156 Compare

April 14, 2021 12:55

jakpiase added 6 commits

April 14, 2021 15:21


          minor change

27f8bb7


          Merge branch 'develop' of https://github.com/PaddlePaddle/Paddle into…

2e4ce07

… reduce_grad


          changed test

27355d0


          minor changes

1445bd6


          added formatting

aa5dccd


          minor change

9f9eea9

lidanqing-intel added the Intel label

Contributor Author

jakpiase commented Apr 15, 2021

@jczaja @arogowie-intel Could you please review this code?

jczaja reviewed

View reviewed changes

paddle/fluid/operators/reduce_ops/mkldnn/reduce_mean_mkldnn_op.cc Outdated Show resolved Hide resolved

paddle/fluid/operators/reduce_ops/mkldnn/reduce_mkldnn_op.h Outdated Show resolved Hide resolved

jczaja reviewed

View reviewed changes

paddle/fluid/operators/reduce_ops/mkldnn/reduce_mkldnn_op.h Show resolved Hide resolved

arogowie-intel reviewed

View reviewed changes

paddle/fluid/operators/reduce_ops/mkldnn/reduce_mkldnn_op.h Outdated

+                    case 4:
+                      return mkldnn::memory::format_tag::abcd;
+                    default:
+                      return mkldnn::memory::format_tag::abcde;

Contributor

arogowie-intel Apr 15, 2021

Why 5 dim tensor is a default case?

Contributor Author

jakpiase Apr 15, 2021

I have made a restriction in GetExpectedKernelType that dims must be in range <1,5>. I had to ensure the compiler that there always will be a return value from this function. I can delete the default statement and just leave the instruction outside switch block. What do you think?

Contributor

arogowie-intel Apr 16, 2021

I'd add case 5: and in default statement throw an error that invalid argument passed.

jakpiase added 3 commits

April 15, 2021 21:59


          added suggested changes

996b81e


          added formatting

fce4eb4


          removed doubled memset

24af4d3

arogowie-intel suggested changes

View reviewed changes

paddle/fluid/operators/reduce_ops/mkldnn/reduce_mkldnn_op.h Outdated

+                    case 4:
+                      return mkldnn::memory::format_tag::abcd;
+                    default:
+                      return mkldnn::memory::format_tag::abcde;

Contributor

arogowie-intel Apr 16, 2021

I'd add case 5: and in default statement throw an error that invalid argument passed.

paddle/fluid/operators/reduce_ops/mkldnn/reduce_mkldnn_op.h Outdated

+                void RunKernel(const framework::ExecutionContext& ctx,
+                               dnnl::algorithm binary_type, float scale_x,
+                               float scale_y) const {
+                  auto& dev_ctx =

Contributor

arogowie-intel Apr 16, 2021

Since you're not modifying dev_ctx:

Suggested change

      
                auto& dev_ctx =
          
                const auto& dev_ctx =

paddle/fluid/operators/reduce_ops/mkldnn/reduce_mkldnn_op.h Outdated


		auto dims = ctx.Attr<std::vector<int>>("dim");
		auto* input_dy = ctx.Input<Tensor>(framework::GradVarName("Out"));

Contributor

arogowie-intel Apr 16, 2021

Please remove this blank line.

Suggested change

paddle/fluid/operators/reduce_ops/mkldnn/reduce_mkldnn_op.h Outdated

		auto* output_dx = ctx.Output<Tensor>(framework::GradVarName("X"));

		output_dx->mutable_data<T>(ctx.GetPlace());

Contributor

arogowie-intel Apr 16, 2021

Suggested change

paddle/fluid/operators/reduce_ops/mkldnn/reduce_mkldnn_op.h Outdated


		auto src_dx_memory = handler.AcquireSrcMemory(output_dx);
		const auto src_dy_memory = handler.AcquireSecondSrcMemory(input_dy);

Contributor

arogowie-intel Apr 16, 2021

Suggested change

python/paddle/fluid/tests/unittests/mkldnn/test_reduce_mkldnn_op.py Outdated

@@ @@ -83,8 +71,8 @@ def setUp(self): @@
                       }
-              @skip_check_grad_ci(reason="not implemented")
-              class TestReduceSum5DReduceAllKeepDimsONEDNNOp(TestReduceSumDefaultONEDNNOp):
+              class TestReduceSum5DReduceAllKeepDimsONEDNNOp(

Contributor

arogowie-intel Apr 16, 2021

Suggested change

      
            class TestReduceSum5DReduceAllKeepDimsONEDNNOp(
          
            class TestReduceSum5DReduceAllKeepDimsOneDNNOp(

python/paddle/fluid/tests/unittests/mkldnn/test_reduce_mkldnn_op.py Outdated

    
              @skip_check_grad_ci(reason="not implemented")

              class TestReduceSum5DReduceAllKeepDimsONEDNNOp(TestReduceSumDefaultONEDNNOp):

              class TestReduceSum5DReduceAllKeepDimsONEDNNOp(

                      TestReduceDefaultWithGradONEDNNOp):

Contributor

arogowie-intel Apr 16, 2021

Suggested change

      
                    TestReduceDefaultWithGradONEDNNOp):
          
                    TestReduceDefaultWithGradOneDNNOp):

python/paddle/fluid/tests/unittests/mkldnn/test_reduce_mkldnn_op.py Outdated

@@ @@ -95,8 +83,7 @@ def setUp(self): @@
                       }
-              @skip_check_grad_ci(reason="not implemented")
-              class TestReduceSum4DReduceAllONEDNNOp(TestReduceSumDefaultONEDNNOp):
+              class TestReduceSum4DReduceAllONEDNNOp(TestReduceDefaultWithGradONEDNNOp):

Contributor

arogowie-intel Apr 16, 2021

Suggested change

      
            class TestReduceSum4DReduceAllONEDNNOp(TestReduceDefaultWithGradONEDNNOp):
          
            class TestReduceSum4DReduceAllOneDNNOp(TestReduceDefaultWithGradOneDNNOp):

python/paddle/fluid/tests/unittests/mkldnn/test_reduce_mkldnn_op.py Outdated

@@ @@ -154,8 +141,7 @@ def setUp(self): @@
                       }
-              @skip_check_grad_ci(reason="not implemented")
-              class TestReduceMean3DONEDNNOp(TestReduceSumDefaultONEDNNOp):
+              class TestReduceMean3DONEDNNOp(TestReduceDefaultWithGradONEDNNOp):

Contributor

arogowie-intel Apr 16, 2021

Suggested change

      
            class TestReduceMean3DONEDNNOp(TestReduceDefaultWithGradONEDNNOp):
          
            class TestReduceMean3DOneDNNOp(TestReduceDefaultWithGradOneDNNOp):

python/paddle/fluid/tests/unittests/mkldnn/test_reduce_mkldnn_op.py Outdated

@@ @@ -166,8 +152,7 @@ def setUp(self): @@
                       }
-              @skip_check_grad_ci(reason="not implemented")
-              class TestReduceMean4DReduceAllONEDNNOp(TestReduceSumDefaultONEDNNOp):
+              class TestReduceMean4DReduceAllONEDNNOp(TestReduceDefaultWithGradONEDNNOp):

Contributor

arogowie-intel Apr 16, 2021

Suggested change

      
            class TestReduceMean4DReduceAllONEDNNOp(TestReduceDefaultWithGradONEDNNOp):
          
            class TestReduceMean4DReduceAllOneDNNOp(TestReduceDefaultWithGradOneDNNOp):

jakpiase added 3 commits

April 19, 2021 13:43


          added suggested changes

02dc16d


          reverted one change


          changed formatting

jczaja approved these changes

View reviewed changes

Contributor

jczaja left a comment

LGTM

Contributor Author

jakpiase commented Apr 20, 2021

@arogowie-intel I have implemented all your suggestions except one. Could you please re-review?

arogowie-intel approved these changes

View reviewed changes

Contributor

arogowie-intel left a comment

Good job!

Contributor Author

jakpiase commented Apr 20, 2021

@luotao1 Could you please start your review?

jczaja assigned luotao1

luotao1 approved these changes

View reviewed changes

luotao1 merged commit ead8342 into PaddlePaddle:develop

lidanqing-intel mentioned this pull request

Enable BF16 on Paddle Parameter Server Distributed Training #30560

Closed

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels