Получи специальное предложение Получить
  • Максим Лукашов
  • andrey semenov
  • Дмитрий Михалевич
  • Павел Самойлов
  • +8
Оставили заявки

Анализ данных в Data Science: техники исследования

27 апреля 2021 2391
Анастасия Борнева

Анастасия Борнева

Ведущий исследователь данных в Сбере
 Обсудим:
  • какие задачи решает анализ данных;
  • статистические методы на Python.
72 комментария
  • Skillbox.Live

    Skillbox.Live

  • Роман Алексеев

    Роман Алексеев

    20:35

    Обалденно. Спасибо, было очень интересно. Надеюсь, что это даст мне толчок к дальнейшему изучению.

  • Michael

    Michael

    20:34

    смотрю с запозданием. rolling все же аномалии не отсекает, а учитывает их с меньшим весовым коэфициентом

    • Сообщение удалено
  • Владимир Силкин

    Владимир Силкин

    20:34

    Что означает выражение "температура выросла в среднем на ..." ? Если я правильно понял, мы вычитаем из начального значения линейной функции конечное значение линейной функции. Но это значение -- это не есть среднее за год. Это вообще никакое не среднее. В нем есть физический смысл? :))))

    • Роман Алексеев

      Роман Алексеев

      20:42
      Владимир Силкин

      мы же смотрели начальное и конечное значение тренда, так что "в среднем" тут вполне применимо. То есть температура выросла и зимой на эту разницу и летом...

  • Emil Alibekov

    Emil Alibekov

    20:31

    Глобальное потепление, получается?

    • Vadim Zhukov

      Vadim Zhukov

      20:31
      Emil Alibekov

      за 5 лет сложно сказать) главный вопрос здесь - температура линейно растет или экспоненциально)

    • Егор Петров

      Егор Петров

      20:32
      Emil Alibekov

      Рыба вернулась в реки, дельфины в моря, смог ушёл - корона всех победила. Не будет потепления - снег сегодня везде)

    • Emil Alibekov

      Emil Alibekov

      20:34
      Егор Петров

      ахаха, да, погодка лютая сегодня, все зеленое и снег идет

  • Vadim Zhukov

    Vadim Zhukov

    20:28

    предсказанная модель подозрительно похожа на прошлый год)

  • Vadim Zhukov

    Vadim Zhukov

    20:25

    почему в качестве индекса выбраны номера строк данных а не datetime?

  • Владимир Силкин

    Владимир Силкин

    20:16

    Почему минимизируется сумма квадратов, а не сумма модулей или сумма длин перпендикуляров до прямой?

  • Stanislav Malakhov

    Stanislav Malakhov

    20:12

    не только экономисты :)

  • Владимир Силкин

    Владимир Силкин

    20:12

    Есть ли способ (функция в python), как из дискретной функции сделать непрерывную? Функция скользящего среднего она ведь тоже дискретная?

    • Vadim Zhukov

      Vadim Zhukov

      20:17
      Владимир Силкин

      не совсем понятно что такое непрерывная функция с точки зрения данных? Формально любая функция построенная на данных - дискретная

  • Егор Петров

    Егор Петров

    20:09

    в итоге дом строим под -8 - +23 градуса? М ыэто выяснили?

    • Vadim Zhukov

      Vadim Zhukov

      20:11
      Егор Петров

      нет, время от времени возможны пики колебаний и жить в доме будет некомфортно

  • Владимир Силкин

    Владимир Силкин

    20:06

    Корреляция падает в 0 при больших лагах, потому что данных для сравнения становится меньше (из-за сдвига) или по другой причине?

  • Stanislav Malakhov

    Stanislav Malakhov

    20:04

    Бывает ли, что сезонность не видна на графике данных, но заметна по автокорреляции ?

  • Сергей Титко

    Сергей Титко

    19:59

    Возможно ли как-то найти lag, чтобы корреляция была максимально высокой и в тоже время правильной?

  • Владимир Силкин

    Владимир Силкин

    19:58

    Lag (задержка) - это просто период функции?

    • Владимир Силкин

      Владимир Силкин

      20:04
      Владимир Силкин

      Понял.

  • Dmitry Ryapolov

    Dmitry Ryapolov

    19:49

    1.0

  • Сергей Титко

    Сергей Титко

    19:49

    1

  • Olga Dream_about

    Olga Dream_about

    19:49

    1

  • Umidjon Sadatov

    Umidjon Sadatov

    19:49

    единице конечно

  • Sergey Ivanov

    Sergey Ivanov

    19:49

    1

  • Ivan Aleksandrovich

    Ivan Aleksandrovich

    19:49

    в 3 примере корреляция не х у, а х w

  • Emil Alibekov

    Emil Alibekov

    19:49

    1

    • Emil Alibekov

      Emil Alibekov

      19:49
      Emil Alibekov

      абсолютная 1

  • Роман Алексеев

    Роман Алексеев

    19:49

    1

  • Sasha Egorova

    Sasha Egorova

    19:49

    1

  • Владимир Силкин

    Владимир Силкин

    19:49

    Ровно 1

  • Olga Dream_about

    Olga Dream_about

    19:41

    Диплом на русском языке?

  • Владимир Силкин

    Владимир Силкин

    19:41

    Функция quantile() работает только по верхней границе? То есть quantile(n%) означает такую температуру, что n% точек имеют температуру меньше. А есть какая-то обратная функция, которая показывает температуру, что n% точек имеют температуру больше?

    • Emil Alibekov

      Emil Alibekov

      19:41
      Владимир Силкин

      хороший вопрос! надеюсь, ответят на него

    • Роман Алексеев

      Роман Алексеев

      19:42
      Emil Alibekov

      Так показали же - тот же quantile(100-x%)

    • Владимир Силкин

      Владимир Силкин

      19:46
      Роман Алексеев

      Спасибо!!!

  • Егор Петров

    Егор Петров

    19:32

    какие форматы документов поддерживается колабом?

    • Егор Петров

      Егор Петров

      19:49
      Егор Петров

      1

  • Yarina Duplika

    Yarina Duplika

    19:27

    Анастасия является преподавателем курса?

    • Sasha Egorova

      Sasha Egorova

      19:28
      Yarina Duplika

      нет

    • Skillbox.Live

      Skillbox.Live

      19:28
      Yarina Duplika

      к сожалению нет

    • Yarina Duplika

      Yarina Duplika

      19:30
      Skillbox.Live

      а почему ведут не те, кто будут преподавать на курсе?

    • Skillbox.Live

      Skillbox.Live

      19:31
      Yarina Duplika

      Анастасия - приглашенный преподаватель, цель интенсива - ввести в профессию, ознакомить с общими задачами

    • Сообщение удалено
  • Yarina Duplika

    Yarina Duplika

    19:27

    у вас диплом гособразца?

    • Skillbox.Live

      Skillbox.Live

      19:28
      Yarina Duplika

      диплом не гос.образца, но для работодателей в 98% случаев важен именно опыт и портфолио - а это мы обеспечиваем

    • Yarina Duplika

      Yarina Duplika

      19:29
      Skillbox.Live

      а какой собственно диплом?

    • Skillbox.Live

      Skillbox.Live

      19:30
      Yarina Duplika

      диплом Skillbox

  • Владимир Силкин

    Владимир Силкин

    19:27

    Каким образом можно понять, какие данные подчиняются нормальному распределению, а какие нет? Почему распределение температур не подчиняется нормальному распределению, а распределение количеств участков голосования по количеству голосов за или против подчиняется?

    • Роман Алексеев

      Роман Алексеев

      19:39
      Владимир Силкин

      Хороший вопрос. =) Имеется ввиду до того, как есть данные, да? Потому что при наличии данных очевидно - hist() =)

    • Владимир Силкин

      Владимир Силкин

      19:42
      Роман Алексеев

      Да. Именно. Можно ли с ходу предсказать, будет ли распределение нормальным? Какими качествами должны обладать данные для нормального распределения?

  • Skillbox.Live

    Skillbox.Live

    19:19

    вопрос с рестрима: ​Без профильного образования, возможно трудоустроится пройдя ваши курсы?

  • Елена Пчелинцева

    Елена Пчелинцева

    19:12

    Добрый вечер!

  • wildfarecool

    wildfarecool

    19:04

    Здравствуйте. Второй день

  • Роман Алексеев

    Роман Алексеев

    19:02

    Добрый вечер. Видео и звук в порядке. Второй день.

  • Stanislav Malakhov

    Stanislav Malakhov

    19:02

    Всё работает, второй день

  • Dmitry Ryapolov

    Dmitry Ryapolov

    19:02

    Всё ок, второй день

  • Павел Самойлов

    Павел Самойлов

    19:02

    Добрый вечер, все нормально, 2 день

  • Kamila Garaeva

    Kamila Garaeva

    19:02

    Добрый вечер. Все отлично. Смотрю второй день