JuliaDiff · devmotion · Apr 2, 2025 · Apr 2, 2025 · Apr 2, 2025 · Apr 2, 2025
diff --git a/src/apiutils.jl b/src/apiutils.jl
@@ -53,6 +53,22 @@ function seed!(duals::AbstractArray{Dual{T,V,N}}, x,
     return duals
 end
 
+# Triangular matrices
+function _nonzero_indices(x::UpperTriangular)
+    n = size(x, 1)
+    return (CartesianIndex(i, j) for j in 1:n for i in 1:j)
+end
+function _nonzero_indices(x::LowerTriangular)
+    n = size(x, 1)
+    return (CartesianIndex(i, j) for j in 1:n for i in j:n)
+end
+function seed!(duals::Union{LowerTriangular{Dual{T,V,N}},UpperTriangular{Dual{T,V,N}}}, x, seeds::NTuple{N,Partials{N,V}}) where {T,V,N}
+    for (idx, seed) in zip(_nonzero_indices(duals), seeds)
+        duals[idx] = Dual{T,V,N}(x[idx], seed)
+    end
+    return duals
+end
+
 function seed!(duals::AbstractArray{Dual{T,V,N}}, x, index,
                seed::Partials{N,V} = zero(Partials{N,V})) where {T,V,N}
     offset = index - 1

diff --git a/src/gradient.jl b/src/gradient.jl
@@ -65,6 +65,14 @@ end
 extract_gradient!(::Type{T}, result::AbstractArray, y::Real) where {T} = fill!(result, zero(y))
 extract_gradient!(::Type{T}, result::AbstractArray, dual::Dual) where {T}= copyto!(result, partials(T, dual))
 
+# Triangular matrices
+function extract_gradient!(::Type{T}, result::Union{UpperTriangular,LowerTriangular}, dual::Dual) where {T}
+    for (idx, p) in zip(_nonzero_indices(result), partials(T, dual))
+        result[idx] = p
+    end
+    return result
+end
+
 function extract_gradient_chunk!(::Type{T}, result, dual, index, chunksize) where {T}
     offset = index - 1
     for i in 1:chunksize

diff --git a/test/GradientTest.jl b/test/GradientTest.jl
@@ -226,4 +226,13 @@ end
     @test dx ≈ sum(a * b)
 end
 
+# issue #738
+@testset "LowerTriangular and UpperTriangular" begin
+    M = rand(3, 3)
+    for T in (LowerTriangular, UpperTriangular)
+        @test ForwardDiff.gradient(sum, T(randn(3, 3))) == T(ones(3, 3))
 # seed work vectors 
 xdual = cfg.duals 
 seeds = cfg.seeds 
 seed!(xdual, x) 
 # do first chunk manually to calculate output type 
 seed!(xdual, x, 1, seeds) 
 ydual = f(xdual) 
 $(result_definition) 
 extract_gradient_chunk!(T, result, ydual, 1, N) 
 seed!(xdual, x, 1) 
 # do middle chunks 
 for c in middlechunks 
     i = ((c - 1) * N + 1) 
     seed!(xdual, x, i, seeds) 
     ydual = f(xdual) 
     extract_gradient_chunk!(T, result, ydual, i, N) 
     seed!(xdual, x, i) 
 end 
 # do final chunk 
 seed!(xdual, x, lastchunkindex, seeds, lastchunksize) 
 ydual = f(xdual) 
 extract_gradient_chunk!(T, result, ydual, lastchunkindex, lastchunksize) 
 function Chunk(input_length::Integer, threshold::Integer = DEFAULT_CHUNK_THRESHOLD) 
     N = pickchunksize(input_length, threshold) 
     Base.@nif 12 d->(N == d) d->(Chunk{d}()) d->(Chunk{N}()) 
 end 
 # seed work vectors 
 xdual = cfg.duals 
 seeds = cfg.seeds 
 seed!(xdual, x) 
  
 # do first chunk manually to calculate output type 
 seed!(xdual, x, 1, seeds) 
 ydual = f(xdual) 
 $(result_definition) 
 extract_gradient_chunk!(T, result, ydual, 1, N) 
 seed!(xdual, x, 1) 
  
 # do middle chunks 
 for c in middlechunks 
     i = ((c - 1) * N + 1) 
     seed!(xdual, x, i, seeds) 
     ydual = f(xdual) 
     extract_gradient_chunk!(T, result, ydual, i, N) 
     seed!(xdual, x, i) 
 end 
  
 # do final chunk 
 seed!(xdual, x, lastchunkindex, seeds, lastchunksize) 
 ydual = f(xdual) 
 extract_gradient_chunk!(T, result, ydual, lastchunkindex, lastchunksize) 
 function Chunk(input_length::Integer, threshold::Integer = DEFAULT_CHUNK_THRESHOLD) 
     N = pickchunksize(input_length, threshold) 
     Base.@nif 12 d->(N == d) d->(Chunk{d}()) d->(Chunk{N}()) 
 end 
+        @test ForwardDiff.gradient(x -> dot(M, x), T(randn(3, 3))) == T(M)
+    end
+end
+
 end # module