apache · huaxingao · Jul 16, 2019 · Jul 17, 2019 · Jul 17, 2019 · Jul 17, 2019
diff --git a/python/pyspark/sql/readwriter.py b/python/pyspark/sql/readwriter.py
@@ -765,7 +765,9 @@ def insertInto(self, tableName, overwrite=False):
 
         Optionally overwriting any existing data.
         """
-        self._jwrite.mode("overwrite" if overwrite else "append").insertInto(tableName)
+        if (overwrite):
+            self._jwrite.mode("overwrite")
+        self._jwrite.insertInto(tableName)
 
     @since(1.4)
     def saveAsTable(self, name, format=None, mode=None, partitionBy=None, **options):

diff --git a/python/pyspark/sql/tests/test_readwriter.py b/python/pyspark/sql/tests/test_readwriter.py
@@ -141,6 +141,25 @@ def count_bucketed_cols(names, table="pyspark_bucket"):
                 .mode("overwrite").saveAsTable("pyspark_bucket"))
             self.assertSetEqual(set(data), set(self.spark.table("pyspark_bucket").collect()))
 
+    def test_insert_into(self):
+        df = self.spark.createDataFrame([("a", 1), ("b", 2)], ["C1", "C2"])
+        df.write.saveAsTable("test_table")
+        self.assertEqual(2, self.spark.sql("select * from test_table").count())
+
+        df.write.insertInto("test_table")
+        self.assertEqual(4, self.spark.sql("select * from test_table").count())
+
+        df.write.mode("overwrite").insertInto("test_table")
+        self.assertEqual(2, self.spark.sql("select * from test_table").count())
+
+        df.write.insertInto("test_table", True)
+        self.assertEqual(2, self.spark.sql("select * from test_table").count())
+
+        df.write.insertInto("test_table", False)
+        self.assertEqual(4, self.spark.sql("select * from test_table").count())
+
+        self.spark.sql("drop table test_table")
+
 
 if __name__ == "__main__":
     import unittest