Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

научите пользоваться bs4

Как с помощью bs4 я могу получить в список все data-src="ссылка" ???

<div id="main">
            <ul class="wookmark-initialised" id="tiles">
                <li class="thumbwook"><a class="rel-link" href="/paw/" data-mid="1710"><span class="h2">PAW</span><img src="...." data-src="ссылка" alt="описание" width="300" height="450"></a>
                </li>

                <li class="thumbwook"><a class="rel-link" href="/rooppp/" data-mid="1710"><span class="h2">rooppp</span><img src="...." data-src="ссылка" alt="описание" width="300" height="450"></a>
                </li>

                <li class="thumbwook"><a class="rel-link" href="/qweqwe/" data-mid="1710"><span class="h2">qweqwe</span><img src="...." data-src="ссылка" alt="описание" width="300" height="450"></a>
                </li>

</ul>
</div>
Заранее спасибо.
ПрограммированиеИгры+4
python-user
  ·   · 269
Лучший
Без обработки исключений и прочих мелочей:
from bs4 import BeautifulSoup

html = """
<div id="main">
            <ul class="wookmark-initialised" id="tiles">
                <li class="thumbwook"><a class="rel-link" href="/paw/" data-mid="1710"><span class="h2">PAW</span><img src="...." data-src="ссылка1" alt="описание" width="300" height="450"></a>
                </li>

                <li class="thumbwook"><a class="rel-link" href="/rooppp/" data-mid="1710"><span class="h2">rooppp</span><img src="...." data-src="ссылка2" alt="описание" width="300" height="450"></a>
                </li>

                <li class="thumbwook"><a class="rel-link" href="/qweqwe/" data-mid="1710"><span class="h2">qweqwe</span><img src="...." data-src="ссылка3" alt="описание" width="300" height="450"></a>
                </li>

</ul>
</div>
"""

links = []

bs = BeautifulSoup(html, 'html.parser')
thumbwooks = bs.findAll('li', {'class': 'thumbwook'})
for thumbwook in thumbwooks:
    images = thumbwook.findAll('img')
    for image in images:
        links.append(image['data-src'])

print(links)
Считаю нужным пояснить код: Импортируем класс BeatifulSoap из библиотеки bs4; Python позволяет использовать для... Читать дальше
Эксперт it research, компьютерный рынок. Https://...  · 14 нояб 2021
Не понтяно: Вы хотите получить список объектов bs4 содержащих data-src? Тогда что-то типа этого: import re bs4_obj = BeatifulSoup(...) href_img = re.compile(r'https*') exit_ = bs4_obj.find_all({"data-src": href_img} ) короче... Читать далее
Вечный студент  · 16 нояб 2021
Вам принципиально bs4? Для простых задач нет необходимости его использовать. Проще связка requests+re. Получаете страницу, находите выражения по шаблону, сохраняете в список. Полагаю это проще для Вашей задачи, если только Вы... Читать далее
1 эксперт не согласен
возиться с регулярными выражениями - зачастую гораздо сложнее, чем с find c find_all bs4.