necst
diff --git a/‎CHANGELOG.md
+11 b/‎CHANGELOG.md
+11
diff --git a/‎grcuda-data b/‎grcuda-data
diff --git a/‎projects/com.nvidia.grcuda.test/src/com/nvidia/grcuda/test/cudalibraries/CUBLASTest.java
+7-6 b/‎projects/com.nvidia.grcuda.test/src/com/nvidia/grcuda/test/cudalibraries/CUBLASTest.java
+7-6
diff --git a/‎projects/com.nvidia.grcuda.test/src/com/nvidia/grcuda/test/cudalibraries/CUSPARSETest.java
+507 b/‎projects/com.nvidia.grcuda.test/src/com/nvidia/grcuda/test/cudalibraries/CUSPARSETest.java
+507
diff --git a/‎projects/com.nvidia.grcuda.test/src/com/nvidia/grcuda/test/util/GrCUDATestUtil.java
-2 b/‎projects/com.nvidia.grcuda.test/src/com/nvidia/grcuda/test/util/GrCUDATestUtil.java
-2
diff --git a/‎projects/com.nvidia.grcuda/src/com/nvidia/grcuda/GrCUDAContext.java
+8-1 b/‎projects/com.nvidia.grcuda/src/com/nvidia/grcuda/GrCUDAContext.java
+8-1
diff --git a/‎projects/com.nvidia.grcuda/src/com/nvidia/grcuda/GrCUDAOptionMap.java
+8 b/‎projects/com.nvidia.grcuda/src/com/nvidia/grcuda/GrCUDAOptionMap.java
+8
diff --git a/‎projects/com.nvidia.grcuda/src/com/nvidia/grcuda/GrCUDAOptions.java
+10-2 b/‎projects/com.nvidia.grcuda/src/com/nvidia/grcuda/GrCUDAOptions.java
+10-2
diff --git a/‎projects/com.nvidia.grcuda/src/com/nvidia/grcuda/cudalibraries/CUDALibraryFunction.java
+1-1 b/‎projects/com.nvidia.grcuda/src/com/nvidia/grcuda/cudalibraries/CUDALibraryFunction.java
+1-1
diff --git a/‎projects/com.nvidia.grcuda/src/com/nvidia/grcuda/cudalibraries/cublas/CUBLASRegistry.java
+2-2 b/‎projects/com.nvidia.grcuda/src/com/nvidia/grcuda/cudalibraries/cublas/CUBLASRegistry.java
+2-2
@@ -1,3 +1,13 @@
+# 2021-11-21
+
+* Enabled support for cuSPARSE
+  * Operations with sparse matrices from cuSPARSE library are now supported
+  * **Known limitation:** Not all data types are supported: in particular Tgemvi does not support double data types 
+  (both complex and not)
+  * Concurrent operations on parallel streams were analyzed using Nvidia Profiler
+
+=======
+
 # 2021-11-17
 
 * Added the support of precise timing of kernels, for debugging and complex scheduling policies
@@ -22,6 +32,7 @@
 * Changed all the print in the source code in log events, with different logging levels
 * Added documentation about logging in docs
 
+
 # 2021-10-13
 
 * Enabled support for cuBLAS and cuML in the async scheduler
 
@@ -40,13 +40,14 @@
 import java.util.Collection;
 import java.util.function.Function;
 
-import com.nvidia.grcuda.runtime.executioncontext.ExecutionPolicyEnum;
-import com.nvidia.grcuda.test.util.GrCUDATestUtil;
+import org.graalvm.polyglot.Context;
+import org.graalvm.polyglot.Value;
 import org.junit.Test;
 import org.junit.runner.RunWith;
 import org.junit.runners.Parameterized;
-import org.graalvm.polyglot.Context;
-import org.graalvm.polyglot.Value;
+
+import com.nvidia.grcuda.runtime.executioncontext.ExecutionPolicyEnum;
+import com.nvidia.grcuda.test.util.GrCUDATestUtil;
 
 @RunWith(Parameterized.class)
 public class CUBLASTest {
@@ -243,8 +244,8 @@ public static void assertOutputVectorIsCorrect(int len, Value deviceArray,
         }
     }
 
-    private void assertOutputVectorIsCorrect(int len, Value deviceArray,
-                    Function<Integer, Integer> outFunc) {
+    void assertOutputVectorIsCorrect(int len, Value deviceArray,
+                                     Function<Integer, Integer> outFunc) {
         CUBLASTest.assertOutputVectorIsCorrect(len, deviceArray, outFunc, this.typeChar);
     }
 
 
@@ -127,5 +127,3 @@ private static boolean isOptionRedundantForSync(GrCUDATestOptionsStruct options)
         return false;
     }
 }
-
-
@@ -37,6 +37,7 @@
 
 import com.nvidia.grcuda.cudalibraries.cublas.CUBLASRegistry;
 import com.nvidia.grcuda.cudalibraries.cuml.CUMLRegistry;
+import com.nvidia.grcuda.cudalibraries.cusparse.CUSPARSERegistry;
 import com.nvidia.grcuda.cudalibraries.tensorrt.TensorRTRegistry;
 import com.nvidia.grcuda.functions.BindAllFunction;
 import com.nvidia.grcuda.functions.BindFunction;
@@ -151,6 +152,11 @@ public GrCUDAContext(Env env) {
             namespace.addNamespace(trt);
             new TensorRTRegistry(this).registerTensorRTFunctions(trt);
         }
+        if (grCUDAOptionMap.isCuSPARSEEnabled()) {
+            Namespace sparse = new Namespace(CUSPARSERegistry.NAMESPACE);
+            namespace.addNamespace(sparse);
+            new CUSPARSERegistry(this).registerCUSPARSEFunctions(sparse);
+        }
         this.rootNamespace = namespace;
     }
 
@@ -196,6 +202,7 @@ public ConcurrentHashMap<Class<?>, CallTarget> getMapCallTargets() {
         return uncachedMapCallTargets;
     }
 
+
     /**
      * Compute the maximum number of concurrent threads that can be spawned by GrCUDA.
      * This value is usually smaller or equal than the number of logical CPU threads available on the machine.
@@ -215,4 +222,4 @@ public GrCUDAOptionMap getOptions() {
     public void cleanup() {
         this.grCUDAExecutionContext.cleanup();
     }
-}
+}
@@ -166,6 +166,14 @@ public String getCuMLLibrary(){
         return (String) getOptionValueFromOptionKey(GrCUDAOptions.CuMLLibrary);
     }
 
+    public Boolean isCuSPARSEEnabled(){
+        return (Boolean) getOptionValueFromOptionKey(GrCUDAOptions.CuSPARSEEnabled);
+    }
+
+    public String getCuSPARSELibrary(){
+        return (String) getOptionValueFromOptionKey(GrCUDAOptions.CuSPARSELibrary);
+    }
+
     public ExecutionPolicyEnum getExecutionPolicy(){
         return (ExecutionPolicyEnum) getOptionValueFromOptionKey(GrCUDAOptions.ExecutionPolicy);
     }
 
@@ -42,6 +42,7 @@
 import com.nvidia.grcuda.cudalibraries.cublas.CUBLASRegistry;
 import com.nvidia.grcuda.cudalibraries.cuml.CUMLRegistry;
 import com.nvidia.grcuda.cudalibraries.tensorrt.TensorRTRegistry;
+import com.nvidia.grcuda.cudalibraries.cusparse.CUSPARSERegistry;
 import com.oracle.truffle.api.Option;
 
 @Option.Group(GrCUDALanguage.ID)
@@ -50,13 +51,13 @@ public final class GrCUDAOptions {
     @Option(category = OptionCategory.USER, help = "Enable cuBLAS support.", stability = OptionStability.STABLE) //
     public static final OptionKey<Boolean> CuBLASEnabled = new OptionKey<>(true);
 
-    @Option(category = OptionCategory.USER, help = "Set the location of the cublas library.", stability = OptionStability.STABLE) //
+    @Option(category = OptionCategory.USER, help = "Set the location of the cuBLAS library.", stability = OptionStability.STABLE) //
     public static final OptionKey<String> CuBLASLibrary = new OptionKey<>(CUBLASRegistry.DEFAULT_LIBRARY);
 
     @Option(category = OptionCategory.USER, help = "Enable cuML support.", stability = OptionStability.STABLE) //
     public static final OptionKey<Boolean> CuMLEnabled = new OptionKey<>(true);
 
-    @Option(category = OptionCategory.USER, help = "Set the location of the cuml library.", stability = OptionStability.STABLE) //
+    @Option(category = OptionCategory.USER, help = "Set the location of the cuML library.", stability = OptionStability.STABLE) //
     public static final OptionKey<String> CuMLLibrary = new OptionKey<>(CUMLRegistry.DEFAULT_LIBRARY);
 
     @Option(category = OptionCategory.USER, help = "Choose the scheduling policy of GrCUDA computations", stability = OptionStability.EXPERIMENTAL) //
@@ -86,6 +87,13 @@ public final class GrCUDAOptions {
     @Option(category = OptionCategory.USER, help = "Set the location of the TensorRT library.", stability = OptionStability.STABLE) //
     public static final OptionKey<String> TensorRTLibrary = new OptionKey<>(TensorRTRegistry.DEFAULT_LIBRARY);
 
+    @Option(category = OptionCategory.USER, help = "Enable cuSPARSE support.", stability = OptionStability.STABLE) //
+    public static final OptionKey<Boolean> CuSPARSEEnabled = new OptionKey<>(true);
+
+    @Option(category = OptionCategory.USER, help = "Set the location of the cuSPARSE library.", stability = OptionStability.EXPERIMENTAL) //
+    public static final OptionKey<String> CuSPARSELibrary = new OptionKey<>(CUSPARSERegistry.DEFAULT_LIBRARY);
+
     @Option(category = OptionCategory.USER, help = "Log the kernels execution time.", stability = OptionStability.STABLE) //
     public static final OptionKey<Boolean> TimeComputation = new OptionKey<>(GrCUDAOptionMap.DEFAULT_TIME_COMPUTATION);
 }
+
@@ -46,7 +46,7 @@
  */
 public abstract class CUDALibraryFunction extends Function {
 
-    private final List<ComputationArgument> computationArguments;
+    protected final List<ComputationArgument> computationArguments;
 
     /**
      * Constructor, it takes the name of the wrapped function and its NFI signature,
 
@@ -116,7 +116,7 @@ public Object call(Object[] arguments) throws ArityException {
                 }
             };
 
-            // create wrapper for cublasDestroy: cublasError_t cublasDestroy(long handle) -> void
+            // create wrapper for cublasDestroy: cublasError_t cublasDestroy(long handle)
             // cublasDestroy(long handle)
             cublasDestroyFunction = new Function(CUBLAS_CUBLASDESTROY.getName()) {
                 @Override
@@ -190,7 +190,6 @@ public void registerCUBLASFunctions(Namespace namespace) {
                 @TruffleBoundary
                 protected Object call(Object[] arguments) {
                     ensureInitialized();
-
                     try {
                         if (nfiFunction == null) {
                             CompilerDirectives.transferToInterpreterAndInvalidate();
@@ -265,4 +264,5 @@ private static String cublasReturnCodeToString(int returnCode) {
                             "(sint64, sint32, sint32, sint32, sint32, sint32, pointer, pointer, sint32, pointer, sint32, pointer, pointer, sint32): sint32"));
         }
     }
+
 }
Original file line number	Diff line number	Diff line change
`@@ -127,5 +127,3 @@ private static boolean isOptionRedundantForSync(GrCUDATestOptionsStruct options)`
`127`	`127`	`return false;`
`128`	`128`	`}`
`129`	`129`	`}`
`130`		`-`
`131`		`-`
Original file line number	Diff line number	Diff line change
`@@ -166,6 +166,14 @@ public String getCuMLLibrary(){`
`166`	`166`	`return (String) getOptionValueFromOptionKey(GrCUDAOptions.CuMLLibrary);`
`167`	`167`	`}`
`168`	`168`
	`169`	`+ public Boolean isCuSPARSEEnabled(){`
	`170`	`+ return (Boolean) getOptionValueFromOptionKey(GrCUDAOptions.CuSPARSEEnabled);`
	`171`	`+ }`
	`172`	`+`
	`173`	`+ public String getCuSPARSELibrary(){`
	`174`	`+ return (String) getOptionValueFromOptionKey(GrCUDAOptions.CuSPARSELibrary);`
	`175`	`+ }`
	`176`	`+`
`169`	`177`	`public ExecutionPolicyEnum getExecutionPolicy(){`
`170`	`178`	`return (ExecutionPolicyEnum) getOptionValueFromOptionKey(GrCUDAOptions.ExecutionPolicy);`
`171`	`179`	`}`
Original file line number	Diff line number	Diff line change
`@@ -116,7 +116,7 @@ public Object call(Object[] arguments) throws ArityException {`
`116`	`116`	`}`
`117`	`117`	`};`
`118`	`118`
`119`		`- // create wrapper for cublasDestroy: cublasError_t cublasDestroy(long handle) -> void`
	`119`	`+ // create wrapper for cublasDestroy: cublasError_t cublasDestroy(long handle)`
`120`	`120`	`// cublasDestroy(long handle)`
`121`	`121`	`cublasDestroyFunction = new Function(CUBLAS_CUBLASDESTROY.getName()) {`
`122`	`122`	`@Override`
`@@ -190,7 +190,6 @@ public void registerCUBLASFunctions(Namespace namespace) {`
`190`	`190`	`@TruffleBoundary`
`191`	`191`	`protected Object call(Object[] arguments) {`
`192`	`192`	`ensureInitialized();`
`193`		`-`
`194`	`193`	`try {`
`195`	`194`	`if (nfiFunction == null) {`
`196`	`195`	`CompilerDirectives.transferToInterpreterAndInvalidate();`
`@@ -265,4 +264,5 @@ private static String cublasReturnCodeToString(int returnCode) {`
`265`	`264`	`"(sint64, sint32, sint32, sint32, sint32, sint32, pointer, pointer, sint32, pointer, sint32, pointer, pointer, sint32): sint32"));`
`266`	`265`	`}`
`267`	`266`	`}`
	`267`	`+`
`268`	`268`	`}`