Специальное предложение
- +5
Программирование
Бесплатный вебинар
22 ноября 2022Парсер на Python: добываем данные с помощью Selenium
День 2 из 3: Интенсив Python с нуля: пишем парсер данных за 3 дня
Алексей Коновалов
Старший разработчик ООО «МТС-Диджитал»
Бесплатный вебинар «Парсер на Python: добываем данные с помощью Selenium». Вы узнаете, как с помощью API и библиотек для парсинга получать данные с веб-сайтов. Научитесь анализировать HTML-содержимое, писать скрипты для входа на сайт, перехода к нужному URL-адресу и загрузки содержимого.
Этот вебинар идеально подойдёт новичкам без опыта в программировании, тем, кто хочет изучить Python подробнее.
Рассмотрим:
- добычу данных в браузере с помощью Selenium;
- работу с API и файлами формата JSON, CSV;
- получение данных через API;
- устройство динамических веб-сайтов;
- библиотеку для парсинга Beautiful Soup.
Спикер — Алексей Коновалов, старший разработчик ООО «МТС-Диджитал». Выпускник курса от Skillbox «Python-разработчик с нуля». Ведёт личный проект по парсингу сайта и анализу данных.
Другие видео интенсива
Рекомендованные
Запуск Linux в виртуальной машине
30.01.2023 2092Введение в SQL
30.01.2023 2268Лёгкий старт в профессии тестировщика: подводим итоги
25.01.2023 738Что такое API и зачем этот инструмент нужен тестировщику
24.01.2023 1630Кто такой тестировщик и чем он занимается?
23.01.2023 2739Программируем на Java: подводим итоги
21.01.2023 399Работаем с коллекциями и файлами в Java
20.01.2023 779Знакомимся с Java: синтаксис и основы ООП
19.01.2023 2017Белый хакинг — с нуля до первого пентеста за 3 дня: подводим итоги
18.01.2023 656Анализ данных в Data Science: подводим итоги
18.01.2023 580Сложные виды атак: XSS и СSRF
17.01.2023 973Анализ данных в Data Science: техники исследования
17.01.2023 1212Пробуем подобрать пароль к веб-сервису с помощью Python
16.01.2023 2215Анализ данных в Data Science: знакомимся с Python
16.01.2023 3004Готовимся начать карьеру
14.01.2023 1223
189 комментариев
Skillbox.Live
Телеграм-чат интенсива - https://t.me/+AuHxK2idlhY1OTli
Дмитрий Саютин
22:59Спасибо.
Виталий
22:59Спасибо!
Anver AHA
22:59Спасибо!
Артур Амирян
22:58Спасибо очень доходчиво!
Антон
22:57Спасибо!
Александр Мукминов
22:57Благодарю за урок
Александр Мукминов
22:56Пока
Nikolay Serotkinn
22:56спасибо
Дмитрий Харитонов
22:56Спасибо, было интересно!
Roman Smirnov
22:56Спасибо
Kioion
22:56Спасибо.
Алексей Грачёв
22:56Спасибо.
Skivy
22:55Можете, пожалуйста, побуквенно XD показать как вы нашли тот элемент в нетворке на авто ру
Дмитрий Березин
22:55webdriver для яндекса не выдает вариант
Дмитрий Березин
22:51у меня с яндекс-браузером не получилось.
Дмитрий Харитонов
22:51да, события - клики мышки, прокрутка и прочее
Артем Мовчан
22:51а если задача потестить что то допустим применяя подключение расширения (кошелек метамаск например), селениум позволяет это сделать?
Алексей Савкин
22:50обновите плиз блокнот
Дмитрий Харитонов
22:48а в selenium есть возможность эмулировать events в браузере?
Алексей Грачёв
22:48Вопрос в том, что я пришёл сюда за подсказкой, как сделать перебор. У меня через .find только первый результат выдаёт, а если .find_all - пустой list
Алексей Грачёв
22:45Давайте распарсим названия вакансий, фирму, выложившую вакансию, и запихнём их в json?
Ruslan Javakov
22:38Алексей спасибо
Ruslan Javakov
22:38удачи всем со змеем
Марат Цховребов
22:36можно ли после окончания учебы идти на стажировку или джуном? Хватит ли этого?
Александр Иванович
22:36rjdsxrf
Alexander Zaryuta
22:36в начале отключить время открытия
Дмитрий Харитонов
22:35можно потом код обновить в colab?
Дмитрий Харитонов
22:34да-да, я просто написал еще одно решение
Дмитрий Харитонов
22:32прекрасно сабмитит форму
Дмитрий Харитонов
22:32search_input.submit()
Дмитрий Харитонов
22:23хотя, браузер открылся
Дмитрий Харитонов
22:23DeprecationWarning: executable_path has been deprecated, please pass in a Service object browser = webdriver.Chrome('./chromedriver.exe')
Алексей Грачёв
22:22А как открыть браузер в фоне, чтоб кушал меньше ресурсов?
Дмитрий Харитонов
22:21chromedriver_binary - _binary - признак включения файла извне?
Ruslan Javakov
22:15и все будет ок
Ruslan Javakov
22:15Алексей скачайте от сюда https://chromedriver.chromium.org
ZX Spectator
22:15Там pip надо обновить
Ян Савицкий
22:15Может пип обновить?
Ruslan Javakov
22:14опять ошибка