pyspark.pandas.Index.drop_duplicates¶

Index.drop_duplicates() → pyspark.pandas.indexes.base.Index[source]¶

Return Index with duplicate values removed.

Returns

See also

Examples

Generate an pandas.Index with duplicate values.

>>> idx = ps.Index(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'])

>>> idx.drop_duplicates().sort_values()
Index(['beetle', 'cow', 'hippo', 'lama'], dtype='object')

pyspark.pandas.Index.drop

pyspark.pandas.Index.min