Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Как найти ключевые слова в тексте одного столбца DataFrame?

ПрограммированиеData science+3
Анонимный вопрос
  ·   · 13,8 K
Python-разработчик и data scientist в компании...  · 6 мая 2022
Один способов — использование функции contains.
Рассмотрим простой пример. 
Для начала сформируем список из 100 словарей с ключом text, значение которого выбирается случайно из вариантов 'добрый день', 'здравствуйте', 'привет' и 'приветствую'. После этого из полученного списка создадим датафрейм pandas:
import random

import pandas

texts = [
    'добрый день',
    'здравствуйте',
    'привет',
    'приветствую'
]
data = []

while len(data) < 100:
    data.append({'text': random.choice(texts)})

df = pandas.DataFrame(data)
Теперь, чтобы выбрать все строки, в которых, например, присутствует слово 'день' можно воспользоваться функцией contains:
df[df['text'].str.contains('день')]
Стоит отметить, что в качестве аргумента contains можно использовать не только обычные строки, но и регулярные выражения. Например, чтобы выбрать все строки, которые содержат только слово 'привет', но не являются частью 'приветствую', можно воспользоваться следующим выражением:
df[df['text'].str.contains('привет$')]
Мой текущий проект: kpmi.ru — профориентация методами искусственного интеллекта.Перейти на kpmi.ru
Программист. ML, DataSience, Python  · 6 мая 2022
Например, у нас есть такой датафрейм: df = pd.DataFrame(data={'eng': ['one', 'two', 'three'], 'jap': ['ichi', 'ni', 'san']}, columns=['eng','jap']) Просто найти значения можно... Читать далее
1 эксперт согласен