Use SPARK_INDEX_NAME_FORMAT in combine_frames to avoid ambiguity. #1650

ueshin · 2020-07-14T01:48:49Z

Use SPARK_INDEX_NAME_FORMAT in utils.combine_frames to avoid ambiguity.

>>> ks.options.compute.ops_on_diff_frames = True
>>> kdf = ks.DataFrame({"a": [1, 2, 3], "Koalas": [0, 1, 2]}).set_index("Koalas", drop=False)
>>> kdf.index.name = None
>>> kdf["NEW"] = ks.Series([100, 200, 300])
>>> kdf
Traceback (most recent call last):
...
pyspark.sql.utils.AnalysisException: Reference 'Koalas' is ambiguous, could be: Koalas, Koalas.;

Related to #1647 as well.

itholic · 2020-07-14T09:40:39Z

LGTM

Use SPARK_INDEX_NAME_FORMAT in combine_frames to avoid ambiguity.

e3d67ff

ueshin requested a review from HyukjinKwon July 14, 2020 01:48

Fix.

ffaa47b

HyukjinKwon approved these changes Jul 15, 2020

View reviewed changes

HyukjinKwon merged commit 156a4f5 into databricks:master Jul 15, 2020

ueshin deleted the combine_frames branch July 15, 2020 13:52

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Use SPARK_INDEX_NAME_FORMAT in combine_frames to avoid ambiguity. #1650

Use SPARK_INDEX_NAME_FORMAT in combine_frames to avoid ambiguity. #1650

ueshin commented Jul 14, 2020 •

edited

Loading

itholic commented Jul 14, 2020

Use SPARK_INDEX_NAME_FORMAT in combine_frames to avoid ambiguity. #1650

Use SPARK_INDEX_NAME_FORMAT in combine_frames to avoid ambiguity. #1650

Conversation

ueshin commented Jul 14, 2020 • edited Loading

itholic commented Jul 14, 2020

ueshin commented Jul 14, 2020 •

edited

Loading