Алгоритмы классификации текстов
14 марта 2020
16570

Никита Левашов
Технический директор в Lia
Продолжаем наш интенсив «Чат-бот с искусственным интеллектом на Python». Основы для простого бота изучены, пора сконцентрировать свое внимание на текстах.
В прямом эфире мы:
- разберём ДЗ #1 и подготовка датасета;
- рассмотрим алгоритмы сравнения текстов;
- введение в машинное обучение;
- рассмотрим процесс векторизации текстов;
- напишем алгоритм классификации текстов;
- измерим качество классификатора;
- обучим модель классификации намерений на собранном в ДЗ #1 датасете и вставим в чат-бота;
- обучим такую же модель на внешнем датасете и подключим ее в качестве болталки.
Рекомендованные
1 час практики разработки на PHP с нуля
10.07.2018 8193100 вопросов программисту
28.07.2020 5290100 вопросов программисту
20.08.2020 31641С: делаем онлайн-сервис для мониторинга курсов валют
05.11.2020 95121С: делаем онлайн-сервис погоды
06.11.2020 50901С. Поднимаем CRM
30.08.2019 34381С. С чего начнём?
29.08.2019 5382Алгоритмы классификации текстов
21.07.2020 6323Алгоритмы классификации текстов
16.10.2020 7475Алгоритмы классификации текстов
18.08.2020 5429Алгоритмы классификации текстов
22.09.2020 3479Алгоритмы классификации текстов
26.05.2020 39327Алгоритмы классификации текстов
19.06.2020 16329Аналитика данных на Python
02.07.2019 5372Анализ данных в Data Science: подводим итоги
02.12.2020 3522
Алексей
22:40Сп. ночи!
Alex Cute
22:30Спасибо
Ризабек Джуасов
22:30Никита-ТОП
Марина Тельманова
22:30Ждем запись
Игорь
22:30Спасибо! Доброй ночи!
Yulia Pereskokova
22:29а если не хочу питон разрабом быть а дата сенс, но не знаю питона
консилиум
22:29пока!)
Екатерина
22:29Спасибо за урок!
Nazar Nastasovsky
22:29Датасет нужно использовать тот же самый обязательно?
Богдан Шевченко
22:28ТГ-чат - https://t.me/joinchat/Di59WRmZizWvI_Kgn9mVew или https://teleg.run/joinchat/Di59WRmZizWvI_Kgn9mVew<br /> <br /> Сам Telegram иногда врёт, что «ссылка устарела или недействительна» - НЕ ВЕРЬТЕ! Пишите модератору @brybger, добавим вручную
Владимир
22:27дайте ссылку на скай кит лерн
Вероника
22:28https://scikit-learn.org/
Анастасия
22:27Можно ссылки к Д/З скинуть, чтобы понятно было из чего искать?
Евгения
22:24Если убрать повторы в классах, то очень сильно вырастет качество, т.к. сейчас между повторами путается + выборка меньше. А так неплохо
Вероника
22:22А дайте пожалуйста датасет сейчас чтобы сразу с вами пробовать всё это
Ирина Ерошенко
22:21Теперь комментарии новые не листаются
Alex Cute
22:16Ты бот?
Данис
22:16Ты куришь?
Ирина Ерошенко
22:16Этот бот - наш коллективный разум на Питоне :)
Sergey Mits
22:15Можно ли выставить ответы на вопросы боту, например: А тебе есть 16 либо 18?
Sergey Mits
22:17То есть, что бы он на то, что он считает ненормативной лексикой задавал такой вопрос
Ризабек Джуасов
22:15А могли бы оставить ссылку на все датасеты которые вам отправляли?Или залить датасеты на гугл диск.
Рустам
22:15сделайте ошибку
Олег Чернов
22:15стих пушкина
Екатерина
22:14У меня одного комментарии барахлят? (это не к боту)
Влад
22:14включи музыку
kamilgvardia
22:14Какой курс доллара?
Yulia Pereskokova
22:14что почитать?
Алексей Ефремов
22:14Как успехи?
Никита Марков
22:14мораль или аморальное поведение?
Nurislam Mukhtaruly
22:14можно комплимент от бота
Оксана Тимофеева
22:14муж или женщина?
Ризабек Джуасов
22:14Вы видимо добавили не все датасеты
Nazar Nastasovsky
22:14курс доллара?
Игорь
22:13У тебя есть семья?
Наталия Мареева
22:13Который час?
Екатерина
22:13какое сейчас время года?
Ризабек Джуасов
22:13Это не мое<br /> У меня написано мое имя )
Оксана Тимофеева
22:13кто от муж или жен
Данис
22:13расскажешь анекдот?
Илья Николаевич
22:13Курс доллара
Владимир
22:12за кого болеешь?