Получи специальное предложение Получить
Оставили заявки

Алгоритмы классификации текстов

26 мая 2020 37542
Никита Левашов

Никита Левашов

CTO Lia
Продолжаем наш интенсив «Чат-бот с искусственным интеллектом на Python». Основы для простого бота изучены, пора сконцентрировать свое внимание на текстах. В прямом эфире мы: - разберём ДЗ #1 и подготовка датасета; - рассмотрим алгоритмы сравнения текстов; - введение в машинное обучение; - рассмотрим процесс векторизации текстов; - напишем алгоритм классификации текстов; - измерим качество классификатора; - обучим модель классификации намерений на собранном в ДЗ #1 датасете и вставим в чат-бота; - обучим такую же модель на внешнем датасете и подключим ее в качестве болталки.
375 комментариев
  • Алина Вейнкрот

    Алина Вейнкрот

    21:47

    А когда будет код с домашкой?

  • Анастасия

    18:48

    По-моему, надо с качеством примеров играться. )

  • Игорь Туренков

    Игорь Туренков

    18:51

    Кто нахуй это делает , я так в еб@ло дам этому ёбаному роботу

  • Валерий

    18:50

    а сам ноутбук с кодом скинут в телеграм?

  • Игорь Туренков

    Игорь Туренков

    18:50

    Бл@т , кто мои коментарии удаляет .Пизды дам нахуй!!!

  • Наталья

    18:49

    а пришлете файл юпитера?

    • Виктория Тулупова

      Виктория Тулупова

      18:50
      Наталья

      Написали что ВСЕ материалы будут в телеге!!

    • Наталья

      18:50
      Наталья

      Более подробная информация будет выложена в ТГ-чате

    • Яцкина Елена

      18:51
      Наталья

      наверняка в тг чате

  • Игорь Туренков

    Игорь Туренков

    18:49

    Здравствуйте , а сколько ещё будет ийдти трансляция(примерно)???

  • Игорь Туренков

    Игорь Туренков

    18:48

    Здравствуйте , а сколько ещё будет ийдти трансляция(примерно)???

  • орень

    орень

    18:48

    никто не хочет попробовать совместно написать что то подобное? Это обмен опытом и практика которая так нужна.

    • Яцкина Елена

      18:49
      орень

      идея хорошая

    • орень

      орень

      18:50
      Яцкина Елена

      есть у вас почта, вк или что то подобное?)

  • Роман Егоров

    Роман Егоров

    18:48

    Может увеличить обучающий сет, уменьшить тестовый?

  • Валерий

    18:54

    чем отличается питон разработчик от аналитика или датасаентиста? можно ли сказать, что питонист - это универсальный "боец"?

    • Мария

      18:58
      Валерий

      датасайнс не обязательно на питоне реализуется. Если брать курс чисто по питону, то большой упор на веб разработку идет, в том числе с Джанго. А в датасайнс больше работа с алгоритмами, знание питона требуется минимальное.

  • Яцкина Елена

    18:46

    можно ссылку на библиотеку склёрн?

    • Игорь Туренков

      Игорь Туренков

      18:46
      Яцкина Елена

      Новерно , да

    • Наталья

      18:47
      Яцкина Елена

      Более подробная информация будет выложена в ТГ-чате

    • Яцкина Елена

      18:50
      Наталья

      scikit-learn: machine learning in Python — scikit-learn 0.23.1 ...scikit-learn.org ?

    • Galina

      18:52
      Яцкина Елена

      Да, это она

  • Ольга

    18:45

    0.129 мдаааа

  • Игорь Туренков

    Игорь Туренков

    18:45

    А можно выразить все эмоции 1-му человеку!

  • Анастасия Пухова

    18:45

    Домашка это улучшить вероятность?

    • Наталья

      18:46
      Анастасия Пухова

      Расскажем чуть позже)

  • Валерий

    18:43

    векторайзер нужно прописывать только для Х?

  • Ульяна Шнайдер

    Ульяна Шнайдер

    18:42

    Будет ли датасет доступен для работы с ним?

    • Наталья

      18:43
      Ульяна Шнайдер

      да, в ТГ-чате

    • Яцкина Елена

      18:44
      Ульяна Шнайдер

      мы все можем скинуть свои ботконфиги и слить их воедино самостоятельно

    • Ульяна Шнайдер

      Ульяна Шнайдер

      18:47
      Яцкина Елена

      То же вариант, когда есть достаточно времени, но с другой стороны - хорошо бы все попробовать. Вчера было все знакомо, сегодня - все новое

  • Лариса

    18:42

    Почему vectorizer не в этом же цикле?

    • Ольга Полетаева

      Ольга Полетаева

      18:44
      Лариса

      А зачем каждый раз векторизовать все данные? мы их векторизовали и делим каждый раз по новой уже в цикле

  • Игорь Туренков

    Игорь Туренков

    18:51

    Кто нахуй это делает , я так в еб@ло дам этому ёбаному роботу

  • Мария

    18:55

    Правильно ли понимаю, что помимо алгоритмов классификации можно использовать и алгоритмы регрессии? Если да, что по вашему опыту лучшие результаты работы с текстом дает?

    • Наталья

      18:56
      Мария

      расскажем чуть позже

  • Алексей

    19:27

    Коллеги, дайте, плиз код 1-го урока.

  • Людмила

    19:14

    победит тот кто первый пришлет, в случае одинакового результата?

  • Ульяна Шнайдер

    Ульяна Шнайдер

    19:22

    Спасибо!!!

  • Alex Yang

    Alex Yang

    19:17

    Что означает надпись: «Skillbox + Lia ASSISTANT» в левом верхнем углу на слайдах у докладчика? 🙄

    • Наталья

      19:24
      Alex Yang

      Никита - основатель Lia

  • Елена

    19:16

    Спасибо, сегодня было очень интересно!

  • Яцкина Елена

    19:16

    всем спасибо

  • Влада

    19:16

    Спасибо, Настя и Никита!

  • Артем Провороцкий

    Артем Провороцкий

    19:15

    Благодарю!

  • Маргарита

    19:15

    для выполнения ДЗ можно пользоваться любыми библиотеками или только sklearn?

  • Наталья

    19:13

    ТГ-чат - https://u.to/RmSFGA <br /> Если не срабатывает, либо напишет «ссылка устарела или недействительна» - скопируйте ссылку https://t.me/joinchat/SRgBLk68Urxmf7l3R3bmJQ, сохраните ее в ТГ в Избранное - и достаточно будет по ней кликнуть, точно сработает!

  • Amir

    18:56

    как у Вас с высшей математикой? Для понимания гиперпараметров без нее никак?

  • София

    19:11

    Куда и как присылать ДЗ?

    • Наталья

      19:12
      София

      в ТГ-чат, ссылку на него сейчас выложим в комментарии

  • Яцкина Елена

    19:09

    есть вопрос. вчера задавал,но без ответа:<br /> что с глубиной контекста? а то каждый вопрос боты воспринимают отдельно от всего, что раньше говорилось...

    • Наталья

      19:11
      Яцкина Елена

      Более подробно этот вопрос можно будет рассмотреть в ТГ-чате

    • Роман Егоров

      Роман Егоров

      19:11
      Яцкина Елена

      В данном случае рассматриваются только отдельные вопросы.

    • Яцкина Елена

      19:14
      Роман Егоров

      да, Максим, это по коду очевидно. но и все Алисы с Гугл ассистантами болеют тем же

  • Виктория Тулупова

    Виктория Тулупова

    19:07

    дайте телегу!!!

    • Наталья

      19:08
      Виктория Тулупова

      https://u.to/RmSFGA<br /> Но лучше дождитесь ДЗ

  • София

    19:06

    Давайте домашнее задание

    • Наталья

      19:09
      София

      даем

  • Regina

    19:03

    Извините,Надо было отойти,можно скачать все что было сегодня на интенсиве?

    • Наталья

      19:04
      Regina

      Да, запись эфира останется на этой странице

    • Regina

      19:04
      Наталья

      А код в тг будет? Или кода особо не было?

    • Наталья

      19:05
      Regina

      Макар, материалы будут выложены в ТГ-чат

    • Ульяна Маршанкина

      Ульяна Маршанкина

      19:04
      Regina

      Можно, но тебе это вряд ли поможет

  • Татьяна

    19:03

    Что по оплате, если передумаешь учиться спустя несколько месяцев?

    • Анастасия

      19:06
      Татьяна

      Там контракт. Придется платить за все. Разбиение на курсы, похоже, не предусмотрено.

    • Татьяна

      19:09
      Анастасия

      Не круто. Сделали бы хотя бы скидку на другие курсы

  • Роман Егоров

    Роман Егоров

    18:59

    Лэндинг по брифу - на Питоне?

    • Мария

      19:00
      Роман Егоров

      на питоне только бэк может быть

    • Роман Егоров

      Роман Егоров

      19:03
      Мария

      оттого и вопрос

  • Яцкина Елена

    18:58

    у меня ноут не выдержал - ребут)

  • Irina Mansurova

    18:41

    экран поменьше не видно где пишет

    • Виктория Тулупова

      Виктория Тулупова

      18:42
      Irina Mansurova

      пониже может?

    • Игорь Туренков

      Игорь Туренков

      18:42
      Irina Mansurova

      Всем видно , а тебе нет?