Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Можно ли как-то с помощью Python парсить именно «количество», допустим, карточек товара без сохранения HTML?

ПрограммированиеЛайфхак+2
Александр Н.
  ·   · 10,9 K
Программист, математик, инженер.  · 5 мар 2021

Разумеется можно.

Берём питон, берём urllib.request, делаем запрос на интересующий нас сайт, получаем строку html-кода и парсим её регулярными выражениями, извлекая теги с данными карточек.

Если сайт чуть более сложный, со всякими ajax'ами - смотрим в режиме разработчика производимые браузером запросы, и повторяем их, с необходимыми параметрами, получая данные карточек. Далее можно делать всё что угодно: подсчитывать количество, качество, сохранять извлечённые данные в удобном нам виде и т.д.

1 эксперт согласен

а зачем мучаться с регексом, если есть простые решения? например bs4

работа на коммерцию и на фри-софтваре. прошлое:...  · 26 июн 2021
парсинг html через регекспы или через вхождения - вкорне неверный способ и не гарантирует правильности результатов, потому что такой способ требует дополнительных условий для того кто предоставляет данные. на полном серьёзе... Читать далее
Боюсь что вы начитались модных современных методик разработки, и теперь тащите их повсюду. На своём продашкне... Читать дальше
Исправляю старые баги, добавляю новые  · 5 мар 2021
Дополню. Вы можете найти паттерн кода для карточки товара. Это может быть класс, например, "product-item". Далее вы просто ищите количество вхождений подстроки в строку как для обычного текста. При этом нет необходимости... Читать далее
Дополню 2.0: если сайт активно защищается от парсинга, может потребоваться cefpython, для эмуляции пользовательских... Читать дальше