Данная книга - результат переворота в методологии анализа таблиц сопряженности признаков, связанного с именем профессора Чикагского университета Лео Гудмена, который ввел так называемую логарифмически-линейную модель. Его идея, оказавшаяся очень богатой, совсем проста. Если учтены все важные признаки, то естественно предположить, что частота в некоторой ячейке пропорциональна произведению частот самих признаков, образующих эту ячейку. Тогда получится модель, линейная относительно логарифма частоты. Именно такой подход позволил объединить многочисленные и многообразные результаты в единую стройную теорию. В предлагаемой Вашему вниманию книге Г. Аптону удалось трансформировать большой и сложный материал так, что он стал вполне доступным для конкретного специалиста, знакомого с азами статистической теории.
Цінна книга, яка змінює уявлення про аналіз соціологічних даних. (Принаймні, у мене змінила).
По-перше, автор "громить" всі традиційні коефіцієнти кореляції для категоріальних даних. І його позиція доволі обґрунтована: ці коефіцієнти часто або є залежними від розміру вибірки (тобто якщо мати достатньо велику вибірку, то будь-який коефіцієнт стає статистично значимим), або не мають змістової інтерпретації. (Більш детально про це написано в Статистические методы анализа информации в социологических исследованиях, де показано, що значення коефіцієнтів зростають нелінійно і часто не досягають 1). Крім того, ці коефіцієнти описують залежності між двома змінними, але для більшої кількості їх застосовувати неможливо.
По-друге, автор подає огляд лог-лінійних моделей. Насправді, це дуже гарний вступ до проблематики, з описом основних методологічних проблем та переваг. І це дуже цікаво, адже виявляється, що лог-лінійні моделі - це аналог дисперсійного аналізу та множинних кореляцій для категоріальних даних. Звісно, автор не подає огляду логістичних регресій, але і наявного матеріалу достатньо.
В книзі наявні певні недоліки: автор не уточнює, що його огляд коефіцієнтів стосується змінних, які мають однакову кількість категорій. Але вони на зміст праці суттєво не впливають.
І останній висновок: порядкові дані найбільш дискриміновані, бо для метричних є дуже добрі розроблені методи, для номінальних - також. А от порядкові або слід зводити до номінальних (і втрачати значну частину інформації), або вважати їх метричними (і робити методологічну помилку).