Fixed the batchnorm backwards generation

chewxy · chewxy · commit ae067c3d3d7a · 2018-08-18T12:36:29.000+10:00
diff --git a/cmd/cudatest/main.go b/cmd/cudatest/main.go
@@ -1,3 +1,4 @@
+// cudatest tests the existence of CUDA by running a simple Go program that uses CUDA.
 package main
 
 import (
@@ -22,5 +23,4 @@ func main() {
 		fmt.Printf("Memory    :\t%v bytes\n", mem)
 		fmt.Printf("Compute   : \t%d.%d\n", maj, min)
 	}
-
 }
diff --git a/cmd/gencudnn/declarations.go b/cmd/gencudnn/declarations.go
@@ -57,6 +57,7 @@ var ctypes2GoTypes = map[string]string{
 
 var alphaBetaParams = []string{
 	"alpha", "alpha1", "alpha2", "alpha3", "beta", "beta1",
+	"alphaDataDiff", "alphaParamDiff", "betaDataDiff", "betaParamDiff",
 }
 
 var builtins = map[string]string{
diff --git a/cmd/gencudnn/generatethis.go b/cmd/gencudnn/generatethis.go
@@ -40,14 +40,14 @@ func generateMappings(appendCurrent bool) {
 		fmt.Fprintln(buf, initfn)
 		bindgen.GenNameMap(buf, t, "fnNameMap", processNameBasic, functions, true)
 		bindgen.GenNameMap(buf, t, "enumMappings", processNameBasic, enums, true)
-		generateAlphaBeta(buf, t)
 
 		generateCRUD(buf, t, "create")
 		generateCRUD(buf, t, "set")
 		generateCRUD(buf, t, "destroy")
 		generateCRUD(buf, t, "methods")
 		fmt.Fprintln(buf, "}\n")
 	}
+	generateAlphaBeta(buf, t)
 	fmt.Fprintln(buf, initfn)
 	fmt.Fprintln(buf, "}\n")
 }
diff --git a/cmd/gencudnn/main.go b/cmd/gencudnn/main.go
@@ -51,7 +51,7 @@ func goimports(filename string) error {
 }
 
 func main() {
-	// pkg := parsePkg(false)
+	pkg := parsePkg(false)
 
 	// Step 0: run parse.py to get more sanity about inputs and outputs
 	// Step 1: Explore
@@ -66,19 +66,19 @@ func main() {
 
 	// Step 3: generate enums, then edit the file in the dnn package.
 	// generateEnums()
-	generateEnumStrings()
+	// generateEnumStrings()
 	// generateStubs(false, pkg) // true/false indicates debug mode
 
 	// Step 4: manual fix for inconsistent names (Spatial Transforms)
 
 	// step 5:
-	// generateFunctions(pkg)
+	generateFunctions(pkg)
 
 	// report things that aren't done yet
-	// pkg = parsePkg(true)
-	// reportPotentialNils(pkg)
-	// reportUnconvertedFns(pkg, hdrfile, functions)
-	// reportUnconvertedTypes(pkg, hdrfile, otherTypes, enums)
+	pkg = parsePkg(true)
+	reportPotentialNils(pkg)
+	reportUnconvertedFns(pkg, hdrfile, functions)
+	reportUnconvertedTypes(pkg, hdrfile, otherTypes, enums)
 
 }
 
diff --git a/cmd/gencudnn/mappings.go b/cmd/gencudnn/mappings.go
@@ -360,6 +360,7 @@ func init() {
 		"cudnnDivisiveNormalizationBackward":      {10: "beta", 3: "alpha"},
 		"cudnnBatchNormalizationForwardTraining":  {3: "beta", 2: "alpha"},
 		"cudnnBatchNormalizationForwardInference": {3: "beta", 2: "alpha"},
+		"cudnnBatchNormalizationBackward":         {5: "betaParamDiff", 4: "alphaParamDiff", 3: "betaDataDiff", 2: "alphaDataDiff"},
 		"cudnnSpatialTfSamplerForward":            {6: "beta", 2: "alpha"},
 		"cudnnSpatialTfSamplerBackward":           {5: "beta", 2: "alpha"},
 	}
diff --git a/dnn/generated_API.go b/dnn/generated_API.go
@@ -16,6 +16,23 @@ func (dr *Dropout) RestoreDropoutDescriptor(handle *Context, dropout float32, st
 	return result(C.cudnnRestoreDropoutDescriptor(dr.internal, handle.internal, C.float(dropout), states.Pointer(), C.size_t(stateSizeInBytes), C.ulonglong(seed)))
 }
 
+// Derives a secondary tensor descriptor for BatchNormalization scale, invVariance, bnBias, bnScale subtensors from the layer's x data descriptor. Use the tensor descriptor produced by this function as the bnScaleBiasMeanVarDesc and bnScaleBiasDiffDesc parameters in Spatial and Per-Activation Batch Normalization forward and backward functions. Resulting dimensions will be 1xC(x1)x1x1 for BATCHNORM_MODE_SPATIAL and 1xC(xD)xHxW for BATCHNORM_MODE_PER_ACTIVATION (parentheses for 5D). For HALF input data type the resulting tensor descriptor will have a FLOAT type. For other data types it will have the same type as the input data.
+func (te *TensorDescriptor) DeriveBNTensorDescriptor(mode BatchNormMode) (derivedBnDesc *TensorDescriptor, err error) {
+	// TODO: xDesc cudnnTensorDescriptor_t
+	// call cudnnDeriveBNTensorDescriptor
+	err = result(C.cudnnDeriveBNTensorDescriptor(te.internal, xDesc.internal, mode.C()))
+	return
+}
+
+// DropoutGetReserveSpaceSize is used to query the amount of reserve needed to run dropout with the input dimensions given by xDesc. The same reserve space is expected to be passed to cudnnDropoutForward and cudnnDropoutBackward, and its contents is expected to remain unchanged between cudnnDropoutForward and cudnnDropoutBackward calls.
+func (te *TensorDescriptor) DropoutGetReserveSpaceSize() (sizeInBytes uintptr, err error) {
+	var sizeInBytesC C.size_t
+	// call cudnnDropoutGetReserveSpaceSize
+	err = result(C.cudnnDropoutGetReserveSpaceSize(te.internal, &sizeInBytesC))
+	sizeInBytes = uintptr(sizeInBytesC)
+	return
+}
+
 // TransformTensor copies the scaled data from one tensor to another tensor with a different layout. Those descriptors need to have the same dimensions but not necessarily the same strides. The input and output tensors must not overlap in any way (i.e., tensors cannot be transformed in place). TransformTensor can be used to convert a tensor with an unsupported format to a supported one.
 func (co *Context) TransformTensor(alpha float64, xDesc *TensorDescriptor, x Memory, beta float64, yDesc *TensorDescriptor, y Memory) error {
 	// DOUBLECHECK: "cudnnTransformTensor" returns Memory type in Parameter 6
@@ -534,8 +551,10 @@ func (co *Context) LRNCrossChannelBackward(normDesc *LRN, lrnMode LRNMode, alpha
 	default:
 		return errors.Errorf("Unsupported data type: %v", yDesc.dataType)
 	}
+	// TODO: dxDesc cudnnTensorDescriptor_t
 	// call cudnnLRNCrossChannelBackward
-	return result(C.cudnnLRNCrossChannelBackward(co.internal, normDesc.internal, lrnMode.C(), alphaC, yDesc.internal, y.Pointer(), dyDesc.internal, dy.Pointer(), xDesc.internal, x.Pointer(), betaC, dxDesc.internal, dx.Pointer()))
+	err = result(C.cudnnLRNCrossChannelBackward(co.internal, normDesc.internal, lrnMode.C(), alphaC, yDesc.internal, y.Pointer(), dyDesc.internal, dy.Pointer(), xDesc.internal, x.Pointer(), betaC, dxDesc.internal, dx.Pointer()))
+	return
 }
 
 // DivisiveNormalizationForward performs the forward spatial DivisiveNormalization layer computation. It divides every value in a layer by the standard deviation of it's spatial neighbors as described in `What is the Best Multi-Stage Architecture for Object Recognition`, Jarrett 2009, Local Contrast Normalization Layer section. Note that Divisive Normalization only implements the x/max(c, sigma_x) portion of the computation, where sigma_x is the variance over the spatial neighborhood of x. The full LCN (Local Contrastive Normalization) computation can be implemented as a two-step process:
@@ -634,9 +653,34 @@ func (co *Context) BatchNormalizationForwardInference(mode BatchNormMode, alpha
 }
 
 // BatchNormalizationBackward performs the backward BatchNormalization layer computation.
-func (co *Context) BatchNormalizationBackward(mode BatchNormMode, alphaDataDiff Memory, betaDataDiff Memory, alphaParamDiff Memory, betaParamDiff Memory, xDesc *TensorDescriptor, x Memory, dyDesc *TensorDescriptor, dy Memory, dxDesc *TensorDescriptor, dx Memory, dBnScaleBiasDesc *TensorDescriptor, bnScale Memory, dBnScaleResult Memory, dBnBiasResult Memory, epsilon float64, savedMean Memory, savedInvVariance Memory) error {
+func (co *Context) BatchNormalizationBackward(mode BatchNormMode, alphaDataDiff float64, betaDataDiff float64, alphaParamDiff float64, betaParamDiff float64, xDesc *TensorDescriptor, x Memory, dyDesc *TensorDescriptor, dy Memory, dxDesc *TensorDescriptor, dx Memory, dBnScaleBiasDesc *TensorDescriptor, bnScale Memory, dBnScaleResult Memory, dBnBiasResult Memory, epsilon float64, savedMean Memory, savedInvVariance Memory) error {
+	var alphaDataDiffC, betaDataDiffC, alphaParamDiffC, betaParamDiffC unsafe.Pointer
+	switch xDesc.dataType {
+	case Float, Half:
+		var alphaDataDiffF, betaDataDiffF, alphaParamDiffF, betaParamDiffF C.float
+		alphaDataDiffF = C.float(float32(alphaDataDiff))
+		betaDataDiffF = C.float(float32(betaDataDiff))
+		alphaParamDiffF = C.float(float32(alphaParamDiff))
+		betaParamDiffF = C.float(float32(betaParamDiff))
+		alphaDataDiffC = unsafe.Pointer(&alphaDataDiffF)
+		betaDataDiffC = unsafe.Pointer(&betaDataDiffF)
+		alphaParamDiffC = unsafe.Pointer(&alphaParamDiffF)
+		betaParamDiffC = unsafe.Pointer(&betaParamDiffF)
+	case Double:
+		var alphaDataDiffF, betaDataDiffF, alphaParamDiffF, betaParamDiffF C.double
+		alphaDataDiffF = C.double(alphaDataDiff)
+		betaDataDiffF = C.double(betaDataDiff)
+		alphaParamDiffF = C.double(alphaParamDiff)
+		betaParamDiffF = C.double(betaParamDiff)
+		alphaDataDiffC = unsafe.Pointer(&alphaDataDiffF)
+		betaDataDiffC = unsafe.Pointer(&betaDataDiffF)
+		alphaParamDiffC = unsafe.Pointer(&alphaParamDiffF)
+		betaParamDiffC = unsafe.Pointer(&betaParamDiffF)
+	default:
+		return errors.Errorf("Unsupported data type: %v", xDesc.dataType)
+	}
 	// call cudnnBatchNormalizationBackward
-	return result(C.cudnnBatchNormalizationBackward(co.internal, mode.C(), alphaDataDiff.Pointer(), betaDataDiff.Pointer(), alphaParamDiff.Pointer(), betaParamDiff.Pointer(), xDesc.internal, x.Pointer(), dyDesc.internal, dy.Pointer(), dxDesc.internal, dx.Pointer(), dBnScaleBiasDesc.internal, bnScale.Pointer(), dBnScaleResult.Pointer(), dBnBiasResult.Pointer(), C.double(epsilon), savedMean.Pointer(), savedInvVariance.Pointer()))
+	return result(C.cudnnBatchNormalizationBackward(co.internal, mode.C(), alphaDataDiffC, betaDataDiffC, alphaParamDiffC, betaParamDiffC, xDesc.internal, x.Pointer(), dyDesc.internal, dy.Pointer(), dxDesc.internal, dx.Pointer(), dBnScaleBiasDesc.internal, bnScale.Pointer(), dBnScaleResult.Pointer(), dBnBiasResult.Pointer(), C.double(epsilon), savedMean.Pointer(), savedInvVariance.Pointer()))
 }
 
 // SpatialTfGridGeneratorForward generates a grid of coordinates in the input tensor corresponding to each pixel from the output tensor.

Original file line number	Diff line number	Diff line change
`@@ -1,3 +1,4 @@`
	`1`	`+// cudatest tests the existence of CUDA by running a simple Go program that uses CUDA.`
`1`	`2`	`package main`
`2`	`3`
`3`	`4`	`import (`
`@@ -22,5 +23,4 @@ func main() {`
`22`	`23`	`fmt.Printf("Memory :\t%v bytes\n", mem)`
`23`	`24`	`fmt.Printf("Compute : \t%d.%d\n", maj, min)`
`24`	`25`	`}`
`25`		`-`
`26`	`26`	`}`
Original file line number	Diff line number	Diff line change
`@@ -57,6 +57,7 @@ var ctypes2GoTypes = map[string]string{`
`57`	`57`
`58`	`58`	`var alphaBetaParams = []string{`
`59`	`59`	`"alpha", "alpha1", "alpha2", "alpha3", "beta", "beta1",`
	`60`	`+ "alphaDataDiff", "alphaParamDiff", "betaDataDiff", "betaParamDiff",`
`60`	`61`	`}`
`61`	`62`
`62`	`63`	`var builtins = map[string]string{`
Original file line number	Diff line number	Diff line change
`@@ -360,6 +360,7 @@ func init() {`
`360`	`360`	`"cudnnDivisiveNormalizationBackward": {10: "beta", 3: "alpha"},`
`361`	`361`	`"cudnnBatchNormalizationForwardTraining": {3: "beta", 2: "alpha"},`
`362`	`362`	`"cudnnBatchNormalizationForwardInference": {3: "beta", 2: "alpha"},`
	`363`	`+ "cudnnBatchNormalizationBackward": {5: "betaParamDiff", 4: "alphaParamDiff", 3: "betaDataDiff", 2: "alphaDataDiff"},`
`363`	`364`	`"cudnnSpatialTfSamplerForward": {6: "beta", 2: "alpha"},`
`364`	`365`	`"cudnnSpatialTfSamplerBackward": {5: "beta", 2: "alpha"},`
`365`	`366`	`}`