Специальное предложение
- +5
Программирование
Бесплатный вебинар
22 ноября 2022Парсер на Python: добываем данные с помощью Selenium
День 2 из 3: Интенсив Python с нуля: пишем парсер данных за 3 дня
Алексей Коновалов
Старший разработчик ООО «МТС-Диджитал»
Бесплатный вебинар «Парсер на Python: добываем данные с помощью Selenium». Вы узнаете, как с помощью API и библиотек для парсинга получать данные с веб-сайтов. Научитесь анализировать HTML-содержимое, писать скрипты для входа на сайт, перехода к нужному URL-адресу и загрузки содержимого.
Этот вебинар идеально подойдёт новичкам без опыта в программировании, тем, кто хочет изучить Python подробнее.
Рассмотрим:
- добычу данных в браузере с помощью Selenium;
- работу с API и файлами формата JSON, CSV;
- получение данных через API;
- устройство динамических веб-сайтов;
- библиотеку для парсинга Beautiful Soup.
Спикер — Алексей Коновалов, старший разработчик ООО «МТС-Диджитал». Выпускник курса от Skillbox «Python-разработчик с нуля». Ведёт личный проект по парсингу сайта и анализу данных.
Другие видео интенсива
Рекомендованные
Автоматизируем рутину с помощью Python
13.09.2023 1327Data Mining: выделяем тренды в описании вакансий с помощью Python
12.09.2023 1256Что умеет Python-фрилансер. Учимся собирать информацию в интернете
11.09.2023 29481С-разработчик: подведение итогов
09.09.2023 519Решаем бизнес-задачи в 1С
08.09.2023 875Кто такой программист 1С и чем он занимается
07.09.2023 1261Telegram-бот на Java: подводим итоги
02.08.2023 873Пишем универсального бота для тестов на Java
01.08.2023 1712Знакомимся с Java и продумываем логику Telegram-бота
31.07.2023 1133Анализ данных в Data Science: подводим итоги
26.07.2023 878Анализ данных в Data Science: техники исследования
25.07.2023 1442Анализ данных в Data Science: знакомимся с Python
24.07.2023 1725Карьера в IT: готовимся к собеседованию и учимся составлять резюме
07.06.2023 538Пробуем себя в анализе данных и мобильной разработке
06.06.2023 528Знакомимся с Java, Python, фронтенд-разработкой и тестированием
05.06.2023 1338
189 комментариев
Skillbox.Live
Телеграм-чат интенсива - https://t.me/+AuHxK2idlhY1OTli
Дмитрий Саютин
22:59Спасибо.
Виталий
22:59Спасибо!
Anver AHA
22:59Спасибо!
Артур Амирян
22:58Спасибо очень доходчиво!
Антон
22:57Спасибо!
Александр Мукминов
22:57Благодарю за урок
Александр Мукминов
22:56Пока
Nikolay Serotkinn
22:56спасибо
Дмитрий Харитонов
22:56Спасибо, было интересно!
Roman Smirnov
22:56Спасибо
Kioion
22:56Спасибо.
Алексей Грачёв
22:56Спасибо.
Skivy
22:55Можете, пожалуйста, побуквенно XD показать как вы нашли тот элемент в нетворке на авто ру
Дмитрий Березин
22:55webdriver для яндекса не выдает вариант
Дмитрий Березин
22:51у меня с яндекс-браузером не получилось.
Дмитрий Харитонов
22:51да, события - клики мышки, прокрутка и прочее
Артем Мовчан
22:51а если задача потестить что то допустим применяя подключение расширения (кошелек метамаск например), селениум позволяет это сделать?
Алексей Савкин
22:50обновите плиз блокнот
Дмитрий Харитонов
22:48а в selenium есть возможность эмулировать events в браузере?
Алексей Грачёв
22:48Вопрос в том, что я пришёл сюда за подсказкой, как сделать перебор. У меня через .find только первый результат выдаёт, а если .find_all - пустой list
Алексей Грачёв
22:45Давайте распарсим названия вакансий, фирму, выложившую вакансию, и запихнём их в json?
Ruslan Javakov
22:38Алексей спасибо
Ruslan Javakov
22:38удачи всем со змеем
Марат Цховребов
22:36можно ли после окончания учебы идти на стажировку или джуном? Хватит ли этого?
Александр Иванович
22:36rjdsxrf
Alexander Zaryuta
22:36в начале отключить время открытия
Дмитрий Харитонов
22:35можно потом код обновить в colab?
Дмитрий Харитонов
22:34да-да, я просто написал еще одно решение
Дмитрий Харитонов
22:32прекрасно сабмитит форму
Дмитрий Харитонов
22:32search_input.submit()
Дмитрий Харитонов
22:23хотя, браузер открылся
Дмитрий Харитонов
22:23DeprecationWarning: executable_path has been deprecated, please pass in a Service object browser = webdriver.Chrome('./chromedriver.exe')
Алексей Грачёв
22:22А как открыть браузер в фоне, чтоб кушал меньше ресурсов?
Дмитрий Харитонов
22:21chromedriver_binary - _binary - признак включения файла извне?
Ruslan Javakov
22:15и все будет ок
Ruslan Javakov
22:15Алексей скачайте от сюда https://chromedriver.chromium.org
ZX Spectator
22:15Там pip надо обновить
Ян Савицкий
22:15Может пип обновить?
Ruslan Javakov
22:14опять ошибка