Website-Suche

Überprüfen, ob ein Wert in einem DataFrame vorhanden ist, mithilfe der Operatoren „in“ und „not in“ in Python Pandas


Pandas ist eine leistungsstarke Python-Bibliothek, die häufig zur Datenbearbeitung und -analyse verwendet wird. Bei der Arbeit mit DataFrames muss häufig überprüft werden, ob ein bestimmter Wert im Datensatz vorhanden ist. In diesem Tutorial erfahren Sie, wie Sie die Operatoren „in“ und „not in“ in Pandas verwenden, um das Vorhandensein oder Fehlen eines Werts in einem DataFrame zu bestimmen.

Mit dem „in“-Operator nach einem Wert suchen

Der „in“-Operator in Python wird verwendet, um zu prüfen, ob ein Wert in einem iterierbaren Objekt vorhanden ist. Im Kontext von Pandas können wir den „in“-Operator verwenden, um zu überprüfen, ob ein Wert in einem DataFrame vorhanden ist. Betrachten wir zwei Beispiele, die die Verwendung des „in“-Operators veranschaulichen, um die Existenz eines Werts in einem Datenrahmen zu überprüfen.

Beispiel 1: Suchen nach einem Wert in einer DataFrame-Spalte

In diesem Beispiel erstellen wir einen DataFrame mit zwei Spalten: „Name“ und „Alter“. Wir wollen prüfen, ob der Wert „Alice“ in der Spalte „Name“ vorhanden ist. Mithilfe des „in“-Operators vergleichen wir den Wert mit den Werten in der Spalte „Name“ mithilfe des Attributs „.values“.

Betrachten Sie den unten gezeigten Code.

import pandas as pd

# Create a DataFrame
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]})

# Check if a value exists in the 'Name' column
value = 'Alice'
if value in df['Name'].values:
   print(f"{value} exists in the DataFrame.")
else:
   print(f"{value} does not exist in the DataFrame.")

Ausgabe

Wenn der Wert gefunden wird, wird die entsprechende Meldung angezeigt; andernfalls wird eine andere Nachricht gedruckt.

Wenn Sie diesen Code ausführen, wird die folgende Ausgabe erzeugt:

Alice exists in the DataFrame.

Beispiel 2: Überprüfung auf einen Wert in einem DataFrame

In diesem Beispiel möchten wir prüfen, ob der Wert „28“ irgendwo im DataFrame vorhanden ist. Wir verwenden den „in“-Operator, um den Wert mit allen Werten im DataFrame zu vergleichen, indem wir das „.values“-Attribut verwenden.

Betrachten Sie den unten gezeigten Code −

import pandas as pd

# Create a DataFrame
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]})

# Check if a value exists in the DataFrame
value = 28
if value in df.values:
   print(f"{value} exists in the DataFrame.")
else:
   print(f"{value} does not exist in the DataFrame.")

Ausgabe

Wenn der Wert vorhanden ist, wird die entsprechende Meldung angezeigt; andernfalls wird eine andere Nachricht gedruckt.

Wenn Sie diesen Code ausführen, wird die folgende Ausgabe erzeugt:

28 exists in the DataFrame.

Mit dem „not in“-Operator auf einen Wert prüfen

In diesem Beispiel erstellen wir einen DataFrame mit zwei Spalten: „Name“ und „Alter“. Unser Ziel ist es zu prüfen, ob der Wert „Michael“ in der Spalte „Name“ nicht vorhanden ist.

Mithilfe des Operators „nicht in“ vergleichen wir den Wert mit den Werten in der Spalte „Name“ unter Verwendung des Attributs „.values“.

Betrachten Sie den unten gezeigten Code.

import pandas as pd

# Create a DataFrame
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]})

# Check if a value does not exist in the 'Name' column
value = 'Michael'
if value not in df['Name'].values:
   print(f"{value} does not exist in the DataFrame.")
else:
   print(f"{value} exists in the DataFrame.")

Ausgabe

Wenn der Wert nicht gefunden wird, wird die entsprechende Meldung angezeigt; andernfalls wird eine andere Nachricht gedruckt.

Wenn Sie diesen Code ausführen, wird die folgende Ausgabe erzeugt:

Michael does not exist in the DataFrame.

Abschluss

In diesem Tutorial haben wir untersucht, wie man die „in“- und „not in“-Operatoren in Pandas verwendet, um zu prüfen, ob ein Wert in einem DataFrame vorhanden ist oder nicht. Durch die Nutzung dieser Operatoren können wir effizient das Vorhandensein oder Fehlen von Werten in bestimmten Spalten oder im gesamten DataFrame bestimmen

Anhand der bereitgestellten Codebeispiele haben wir gezeigt, wie Sie den „in“-Operator verwenden, um zu prüfen, ob ein Wert in einer DataFrame-Spalte oder im gesamten DataFrame vorhanden ist. Darüber hinaus haben wir die Verwendung des „not in“-Operators gezeigt, um zu prüfen, ob ein Wert nicht vorhanden ist.

Mithilfe dieser Operatoren können Analysten und Datenwissenschaftler das Vorhandensein oder Fehlen von Daten effektiv validieren und so fundierte Entscheidungen auf der Grundlage der verfügbaren Informationen in ihren DataFrame-Strukturen treffen.

Zusammenfassend lässt sich sagen, dass die „in“- und „not in“-Operatoren in Pandas leistungsstarke Tools für die Prüfung auf Existenz und Nichtexistenz von Werten bieten und eine effiziente Datenexploration und -analyse ermöglichen.

Verwandte Artikel: