pyspark.sql.DataFrame.distinct¶

DataFrame.distinct() → pyspark.sql.dataframe.DataFrame[source]¶

Returns a new DataFrame containing the distinct rows in this DataFrame.

New in version 1.3.0.

Examples

>>> df.distinct().count()
2