Слайды и текст доклада
Pic.1
Лекция 4 задача классификации. Метод деревьев решений
Pic.2
Основные положения метода Метод деревьев решений (decision tree) для задачи классификации состоит в том, чтобы осуществлять процесс деления исходных данные на группы, пока не будут получены …
Pic.3
Основные понятия Дерево решений – это модель, представляющая собой совокупность правил для принятия решений. Графически её можно представить в виде древовидной структуры, где моменты принятия решений …
Pic.4
Идея метода Метод деревьев решений реализует принцип так называемого «рекурсивного деления» (recursive partitioning). Эта стратегия также называется «Разделяй и властвуй» («Divide and conquer»). В …
Pic.5
Пример В кинокомпании стол редактора завален сценариями кинофильмов, нужно разложить их по трём ящикам: Популярные («mainstream hits»); Не популярные у зрителей, но получившие высокую оценку …
Pic.6
Пример 1) Количество снимавшихся в фильме звёзд как первый из признаков, по которому производится разбиение данных
Pic.7
Пример Продолжать процесс разделения данных можно и дальше, пока не получим очень «мелкое» разделение (может оказаться, что каждая группа будет содержать лишь по одному элементу), однако понятно, что …
Pic.9
Численные алгоритмы метода деревьев решений, допускающие компьютерную реализацию Существуют различные численные алгоритмы построения деревьев решений: CART, C4. 5, CHAID, CN2, NewId, ITrule и другие. …
Pic.10
Функция оценки качества разбиения, которая используется для выбора оптимального правила, - индекс Gini . Данная оценочная функция основана на идее уменьшения неопределенности в узле: Функция оценки …
Pic.11
Механизм отсечения - minimal cost-complexity tree pruning, алгоритм CART принципиально отличается от других алгоритмов конструирования деревьев решений. Механизм отсечения - minimal cost-complexity …
Pic.12
Алгоритм C4. 5 Алгоритм C4. 5 Алгоритм C4. 5 строит дерево решений с неограниченным количеством ветвей у узла. Данный алгоритм может работать только с дискретным зависимым атрибутом и поэтому может …
Pic.13
Алгоритм (С5. 0) автоматизированного построения дерева решений Фактически алгоритм C5. 0 представляет собой стандарт процедуры построения деревьев решений. Эта программа реализуется на коммерческой …
Pic.14
Энтропия как мера чистоты групп Энтропия как мера чистоты групп Если у системы всего 2 возможных состояния, то её энтропия – функция одной переменной p , график которой имеет вид:
Pic.15
Алгоритм может выбрать тот признак, разбиение по которому даст самую чистую группу (т. е. группу, имеющую наименьшую энтропию). Эти вычисления называются «information gain» (буквально «усиление …
Pic.16
Может возникнуть ситуация, когда группы окажутся слишком мелкими, а точек ветвления будет слишком много – в этом случае говорят, что модель «is overfitted», т. е. переопределена. Может возникнуть …
Pic.18
задача классификации. Дискриминантный анализ
Pic.19
Дискриминантный анализ Дискриминантный анализ является разделом многомерного статистического анализа, который включает в себя методы классификации многомерных наблюдений по принципу максимального …
Pic.20
Дискриминантный анализ Дискриминантный анализ – это общий термин, относящийся к нескольким тесно связанным статистическим процедурам. Эти процедуры можно разделить на методы интерпретации …
Pic.21
Дискриминация Основной целью дискриминации является нахождение такой линейной комбинации переменных (в дальнейшем эти переменные будем называть дискриминантными переменными), которая бы оптимально …
Pic.22
Дискриминация Коэффициенты βi первой канонической дискриминантной функции d выбираются таким образом, чтобы центроиды различных групп как можно больше отличались друг от друга. Коэффициенты второй …
Скачать презентацию
Если вам понравился сайт и размещенные на нем материалы, пожалуйста, не забывайте поделиться этой страничкой в социальных сетях и с друзьями! Спасибо!