Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Как посчитать одинаковые строки между несколькими файлами CSV в Pandas?

ПрограммированиеData science+3
Анонимный вопрос
  ·   · 8,4 K
Программирование как хобби. Python, SQL и т.д.  · 2 сент 2022
Привет.
Вопрос очень общий и не понятно, что конкретно, с какими вида данными Вы работаете. В общем случае можно поступить так:
Считать файлы CSV в датафреймы с помощью команды read_csv
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
…..
Добавить в них колонку с именем загружаемого файла или другим отличительным признаком.
Слить датафреймы с помощью команды concat
df = pd.concat([df1, df2, …], axis=1)
Далее можно воспользоваться командой groupby
 df.groupby(df.columns.tolist(),as_index=False).size()
1 эксперт согласен
Openstack DevOps and IBM/Informix Certified DBA...  · 2 сент 2022
Задачу можно решить, используя  pandas.merge(d1,d2,how = 'inner').   Пример кода приведен ниже для двух датафреймов.  Смотри тест в блоге https://informatics-ege.blogspot.com/2022/09/count-same-rows-between-multiple-csv.html В... Читать далее