Ну, почему же?
Приведу пример. Допустим, слова relax, relaxed, relaxing - все всречаются ровно по 4 раза. С точки зрения и Шаттера (он оставит одно), и Айса (он предложит одно и тоже слово на замену) - они дубликаты. Поэтому хорошо бы сгруппировать их вместе, что бы ты сразу такое видел и оставлял только одно уже на стадии отбора, а не потом фильтрации этого отбора.
Пока писал, подумал, что можно пойти еще дальше: отсортировать слова сразу по алфавиту и только так. При этом функционал выборки топ 30, 50 и 80 останется неизменным, только выбранные слова будут вразброс. Это позволит избежать дубликатов уже на стадии выборки наиболее эффективно. Опять же, функционал сортировки выбранных ключевых останется прежним: по популярности или по алфавиту. Дабы визуально облегчить задачу, можно количество повторений ключевого выделять разными цветами. Сакжем, от 80% до 100% - красным, 60% - 80% - оранжевым, 40% - 60% - желтым, меньше - зелёным. Что вы на это скажете?