Цінна книга, яка змінює уявлення про аналіз соціологічних даних. (Принаймні, у мене змінила).
По-перше, автор "громить" всі традиційні коефіцієнти кореляції для категоріальних даних. І його позиція доволі обґрунтована: ці коефіцієнти часто або є залежними від розміру вибірки (тобто якщо мати достатньо велику вибірку, то будь-який коефіцієнт стає статистично значимим), або не мають змістової інтерпретації. (Більш детально про це написано в Статистические методы анализа информации в социологических исследованиях, де показано, що значення коефіцієнтів зростають нелінійно і часто не досягають 1). Крім того, ці коефіцієнти описують залежності між двома змінними, але для більшої кількості їх застосовувати неможливо.
По-друге, автор подає огляд лог-лінійних моделей. Насправді, це дуже гарний вступ до проблематики, з описом основних методологічних проблем та переваг. І це дуже цікаво, адже виявляється, що лог-лінійні моделі - це аналог дисперсійного аналізу та множинних кореляцій для категоріальних даних. Звісно, автор не подає огляду логістичних регресій, але і наявного матеріалу достатньо.
В книзі наявні певні недоліки: автор не уточнює, що його огляд коефіцієнтів стосується змінних, які мають однакову кількість категорій. Але вони на зміст праці суттєво не впливають.
І останній висновок: порядкові дані найбільш дискриміновані, бо для метричних є дуже добрі розроблені методи, для номінальних - також. А от порядкові або слід зводити до номінальних (і втрачати значну частину інформації), або вважати їх метричними (і робити методологічну помилку).