Очистка и фильтрация
После сбора семантики в проекте обычно оказываются нерелевантные фразы, мусор и дубли. Этот раздел описывает, как привести список в порядок перед кластеризацией.
Статьи раздела
| Статья | Что делает |
|---|---|
| Фильтрация фраз | Убрать фразы по частотности, словам, длине |
| Поиск и удаление дублей | Найти явные и неявные дубли |
Что дальше
Очищенный список готов для кластеризации.