Lecture 11

pandas Basics - Missing Values; Duplicates

Byeong-Hak Choe

SUNY Geneseo

February 21, 2025

Dealing with Missing Values

Let’s read employment.csv as emp.

import pandas as pd
# Below is for an interactive display of DataFrame in Colab
from google.colab import data_table
data_table.enable_dataframe_formatter()

emp = pd.read_csv("https://bcdanl.github.io/data/employment.csv")

Dealing with Duplicates

1 / 20

Lecture 11 pandas Basics - Missing Values; Duplicates Byeong-Hak Choe bchoe@geneseo.edu SUNY Geneseo February 21, 2025

Lecture 11
Dealing with Missing Values
Dealing with Missing Values
Dealing with Missing Values
Dealing with Missing Values: The isna() and notna() methods
Dealing with Missing Values: The isna() and notna() methods
Dealing with Missing Values: The value_counts(dropna = False) method
Dealing with Missing Values: The dropna() method
Dealing with Missing Values: The dropna() method with how
Dealing with Missing Values: The dropna() method with subset
Dealing with Missing Values: The dropna() method with subset
Dealing with Duplicates
Dealing with Duplicates with the duplicated() method
Dealing with Duplicates with the duplicated() method
Dealing with Duplicates with the drop_duplicates() method
Dealing with Duplicates with the drop_duplicates() method
Dealing with Duplicates with the drop_duplicates() method
Dealing with Duplicates with the drop_duplicates() method
Dealing with Duplicates with the drop_duplicates() method
Pandas Basics

Lecture 11

Dealing with Missing Values

Dealing with Missing Values

Dealing with Missing Values

Dealing with Missing Values: The `isna()` and `notna()` methods

Dealing with Missing Values: The `isna()` and `notna()` methods

Dealing with Missing Values: The `value_counts(dropna = False)` method

Dealing with Missing Values: The `dropna()` method

Dealing with Missing Values: The `dropna()` method with `how`

Dealing with Missing Values: The `dropna()` method with `subset`

Dealing with Missing Values: The `dropna()` method with `subset`

Dealing with Duplicates

Dealing with Duplicates with the `duplicated()` method

Dealing with Duplicates with the `duplicated()` method

Dealing with Duplicates with the `drop_duplicates()` method

Dealing with Duplicates with the `drop_duplicates()` method

Dealing with Duplicates with the `drop_duplicates()` method

Dealing with Duplicates with the `drop_duplicates()` method

Dealing with Duplicates with the `drop_duplicates()` method

Pandas Basics