Обосновать выбор количества кластеров
Был проведен соц.опрос. Количество респондентов - 700. Количество вопросов (показателей) - 33. Оцениваемая шкала - от 0 до 10. Сначала был проведен факторный анализ для снижения размерности методом главных компонент. На выходе получено 5 факторов. Дальше требуется выполнить кластерный анализ по результатам факторного анализа, т.е. по 5 факторам. Предполагается применение метод k-средних. Но затрудняет вопрос с выбором (и обоснованием этого выбора) количества кластеров. Вычисления проводятся с помощью SPSS 20.
Возможно ли обосновать выбор количества кластеров с помощью псевдо-f статистики (pseudo-F statistics) и критерием кубеческой кластеризации (CCC - cubic clustering criterion) с помощью SPSS 20? И как все-таки обосновать выбор количества кластеров в данном случае? |
Это какая-то ересь
|
Цитата:
|
Цитата:
|
Цитата:
|
Цитата:
|
banitl, гадание на дендрограмме пробовали?
|
Прочитал уйма материалов на счет псевдо-f статистики и критерия кубеческой кластеризации, и во всех этих материалах они использовались в процессе расчетов и только в виде формул. Так как я провожу расчеты с помощью программы SPSS, то там не существует этих критериев. И мне потребовалось хоть какое-то обоснование их использования. Еще и подумал, а может есть другой путь обоснования выбора количества кластеров.
|
Цитата:
|
Цитата:
|
Текущее время: 19:43. Часовой пояс GMT +3. |
Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2024, «Аспирантура. Портал аспирантов»