Cassandra Analytics

Cassandra Spark Bulk Reader

The open-source repository for the Cassandra Spark Bulk Reader. This library allows integration between Cassandra and Spark job, allowing users to run arbitrary Spark jobs against a Cassandra cluster securely and consistently.

This project contains the necessary open-source implementations to connect to a Cassandra cluster and read the data into Spark.

For example usage, see the example repository; sample steps:

import org.apache.cassandra.spark.sparksql.CassandraDataSource
import org.apache.spark.sql.SparkSession

val sparkSession = SparkSession.builder.getOrCreate()
val df = sparkSession.read.format("org.apache.cassandra.spark.sparksql.CassandraDataSource")
                          .option("sidecar_contact_points", "localhost,localhost2,localhost3")
                          .option("keyspace", "sbr_tests")
                          .option("table", "basic_test")
                          .option("DC", "datacenter1")
                          .option("createSnapshot", true)
                          .option("numCores", 4)
                          .load()

Cassandra Spark Bulk Writer

The Cassandra Spark Bulk Writer allows for high-speed data ingest to Cassandra clusters running Cassandra 3.0 and 4.0.

Developers interested in contributing to the Analytics library, please see the DEV-README.

Getting Started

For example usage, see the example repository. This example covers both setting up Cassandra 4.0, Apache Sidecar, and running a Spark Bulk Reader and Spark Bulk Writer job.

Name		Name	Last commit message	Last commit date
Latest commit History 95 Commits
.circleci		.circleci
cassandra-analytics-cdc-codec		cassandra-analytics-cdc-codec
cassandra-analytics-cdc		cassandra-analytics-cdc
cassandra-analytics-common		cassandra-analytics-common
cassandra-analytics-core-example		cassandra-analytics-core-example
cassandra-analytics-core		cassandra-analytics-core
cassandra-analytics-integration-framework		cassandra-analytics-integration-framework
cassandra-analytics-integration-tests		cassandra-analytics-integration-tests
cassandra-analytics-spark-converter		cassandra-analytics-spark-converter
cassandra-analytics-spark-four-zero-converter		cassandra-analytics-spark-four-zero-converter
cassandra-bridge		cassandra-bridge
cassandra-four-zero-bridge		cassandra-four-zero-bridge
cassandra-four-zero-types		cassandra-four-zero-types
cassandra-four-zero		cassandra-four-zero
cassandra-three-zero		cassandra-three-zero
config/checkstyle		config/checkstyle
githooks		githooks
gradle/wrapper		gradle/wrapper
ide/idea		ide/idea
profiles		profiles
scripts		scripts
.asf.yaml		.asf.yaml
.gitignore		.gitignore
CHANGES.txt		CHANGES.txt
DEV-README.md		DEV-README.md
LICENSE.txt		LICENSE.txt
NOTICE.txt		NOTICE.txt
README.md		README.md
build.gradle		build.gradle
code_version.sh		code_version.sh
gradle.properties		gradle.properties
gradlew		gradlew
settings.gradle		settings.gradle

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Cassandra Analytics

Cassandra Spark Bulk Reader

Cassandra Spark Bulk Writer

Getting Started

About

Releases

Packages

Contributors 10

Languages

License

apache/cassandra-analytics

Folders and files

Latest commit

History

Repository files navigation

Cassandra Analytics

Cassandra Spark Bulk Reader

Cassandra Spark Bulk Writer

Getting Started

About

Resources

License

Code of conduct

Security policy

Stars

Watchers

Forks

Releases

Packages 0

Contributors 10

Languages

Packages