Лекция 10. Кластеризация: распространённые методы. Brown clustering

Описание к видео Лекция 10. Кластеризация: распространённые методы. Brown clustering

Лекция №10 курса «Введение в обработку естественного языка » (осень 2019).
Преподаватель — Антон Михайлович Алексеев
Страница лекции на сайте CSC: https://bit.ly/2ke7nrT

21:13 На самом деле формула purity на слайде верна. Для каждого предсказанного кластера вычисляется мощность наибольшего пересечения с кластером из "истинных". Затем эти величины не усредняются, а делятся на N — то есть число кластеризуемых объектов.

1:23:59 Речь о тексте Себастиана по мотивам EMNLP-2017. Вот он: http://ruder.io/highlights-of-emnlp-2...

Комментарии

Информация по комментариям в разработке