Один способов — использование функции contains.
Рассмотрим простой пример.
Для начала сформируем список из 100 словарей с ключом text, значение которого выбирается случайно из вариантов 'добрый день', 'здравствуйте', 'привет' и 'приветствую'. После этого из полученного списка создадим датафрейм pandas:
import random
import pandas
texts = [
'добрый день',
'здравствуйте',
'привет',
'приветствую'
]
data = []
while len(data) < 100:
data.append({'text': random.choice(texts)})
df = pandas.DataFrame(data)
Теперь, чтобы выбрать все строки, в которых, например, присутствует слово 'день' можно воспользоваться функцией contains:
df[df['text'].str.contains('день')]
Стоит отметить, что в качестве аргумента contains можно использовать не только обычные строки, но и регулярные выражения. Например, чтобы выбрать все строки, которые содержат только слово 'привет', но не являются частью 'приветствую', можно воспользоваться следующим выражением:
df[df['text'].str.contains('привет$')]