Пропустить общее меню / Skip Global Navigation

+7 (495) 229-56-11  Квадрат SPSS  info@predictive.ru

Что нового в IBM SPSS Statistics 27?

В июне 2020 года выпущена новая версия IBM SPSS Statistics – 27. Эксперты Predictive Solutions изучили нововведения очередного релиза и подготовили небольшой обзор.

Статистические процедуры

Больше функционала в базовой редакции

Вы, вероятно, знаете, что SPSS Statistics – пакет модульный. А еще у него есть разные редакции (Editions), которые различаются набором модулей. Ранее в базовую редакцию (IBM SPSS Statistics Base) входил лишь базовый модуль пакета – Statistics base, но теперь в ней находятся еще 2 модуля: Data Preparation и Bootstrap. Так что, приобретая лицензию на SPSS Statistics начального уровня, Вы получаете больше функционала, чем раньше. Data Preparation и Bootstrapping содержат полезные процедуры, для освоения которых не требуется специальных знаний:

  • Data Preparation. Набор процедур помогающий подготовить данные к анализу: выявить невалидные или аномальные наблюдения, исключить из анализа переменные, несущие в себе мало информации, преобразовать данные к нормальному виду, срезать выбросы, отобрать потенциально полезные предикторы для прогностической модели, выполнить оптимальный бининг (разбиение количественной переменной на категории).
  • Bootstrappping. Бутстреп – это простая оценка параметров генеральной совокупности, не требующая выполнения предположений параметрических методов. Доверительные интервалы строятся на основе множества случайных подвыборок из существующей выборки и могут быть построены для широкого перечня статистик: средних, дисперсий, процентилей, долей, параметров линейных моделей и т.д.

Редакции IBM SPSS Statistics: Base, Standard, Professional Premium. Среди прочего указано, что в состав редакции Base входят модули Statistics base, Bootstrapping, Data Preparation. Источник: IBM Corp., 2020

Редакции IBM SPSS Statistics 27. Источник: IBM Corp., 2020
 

Анализ мощности

Начиная с IBM SPSS Statistics 27 в базовый функционал пакета входят процедуры расчета мощности статистических критериев при разных объемах выборок и, наоборот, расчета объемов выборок для желаемой мощности критерия.

Эти процедуры помогут исследователям на этапе сбора данных оценить, сколько наблюдений необходимо иметь для проверки той или иной гипотезы. В общем случае для оценки объема выборки исследователю необходимо выбрать вид эффекта (например, это может быть гипотеза о среднем значении, о доле, о коэффициенте корреляции, или о влиянии предиктора в регрессионной модели), указать ожидания величины эффекта в стандартизированных или абсолютных значениях, пороговый уровень значимости, при котором нулевая гипотеза должна быть отвергнута, и желаемую мощность (т.е. надежность достижения порогового уровня значимости в том случае, если эффект указанного размера действительно присутствует в генеральной совокупности). На выходе Вы получаете оценку требуемого размера выборки. Можно действовать обратным порядком: задать плановый объем выборки и получить оценку мощности, т.е., опять же, вероятности успешного отвержения нулевой гипотезы в том случае, если искомый эффект действительно присутствует в генеральной совокупности.

Диалог процедуры Power Analysis: Pearson Correlation

Диалог процедуры анализа мощности для оценки корреляции Пирсона. Требуемая мощность: 0,8, ожидаемый выборочных коэффициент 0,25, гипотезируемый коэффициент 0, двусторонняя проверка, уровень значимости 0,05. IBM SPSS Statistics 27
 

Результата выполнения процедуры Power Analysis: Pearson Correlation

Результат процедуры анализа мощности для оценки корреляции Пирсона. Требуемый объем выборки при заданных параметрах (Test Assumptions) – 123. Фактическая мощность при данном объеме составит 0,802. IBM SPSS Statistics 27
 

Расчет объема выборки/мощности доступен для следующих видов гипотез:

  • Об одном среднем значении
  • О двух выборочных средних в независимых выборках
  • О двух выборочных средних в связанных выборках
  • О значимости фактора в однофакторной ANOVA (включая контрасты и парные сравнения)
  • Об одной доле
  • О двух долях в связанных выборках
  • О двух долях в независимых выборках
  • О величине коэффициента корреляции Пирсона
  • О ранговой корреляции Спирмена
  • О частной корреляции
  • О влиянии предиктора в модели линейной регрессии

Величина эффекта

В процедуры сравнения средних и однофакторную ANOVA добавлен расчет стандартизированных мер величины эффекта. Когда мы проверяем статистическую гипотезу, считаем статистику критерия и ее значимость, мы пытаемся доказать факт наличия эффекта (отличий, различий, корреляции).

В отличие от статистической значимости, меры эффекта не пытаются доказать существование эффекта, а пытаются оценить его размер. Эффект может измеряться в абсолютном выражении, а может быть стандартизирован. Мы хорошо привыкли, например, к такой стандартизированной мере, как коэффициент корреляции Пирсона. Но сравнительно реже приходится сталкиваться со стандартизированными мерами различий в средних. Стандартизированные меры эффекта для средних позволяют говорить о различиях как о «незначительных», «умеренных», «больших», не вдаваясь в конкретные единицы измерения. Между тем, меры эффекта для средних играют большую роль в современных исследованиях. С их помощью на основе опубликованных результатов исследований осуществляется мета-анализ и выводятся более надежные оценки тех или иных явлений.

4 примера различий двух средних Гауссовых распределений с разной величиной эффекта. При наименьшем (d=0.5) эффекте кривые плотности вероятности почти наложены друг на друга, при наибольшем (d=3) широко разнесены по горизонтальной оси. Источник – Wikipedia, Effect size

Визуализация разных величин Cohen’s d на примере различий в средних двух нормальных распределений. Источник: Wikipedia, Effect size
 

В IBM SPSS Statistics размер эффекта для средних и ранее оценивался в некоторых «продвинутых» процедурах линейных моделей, однако с 27 версии наиболее популярные тесты для средних из базового модуля также могут возвращать оценку величины эффекта и ее 95% доверительный интервал. Изменения коснулись следующих процедур:

  • t-проверка для одной выборки
  • t-проверка для независимых выборок
  • t-проверка для связанных выборок
  • Однофакторный дисперсионный анализ (One-way ANOVA) и оцениваемые контрасты.

Для разности 2-х средних и контрастов рассчитываются эффекты, основанные на нормированной разности средних:

  • Cohen’s d
  • Hedges’ correction (g)
  • Glass’s delta

Для фактора в дисперсионном анализе рассчитываются эффекты, основанные на % объясненной дисперсии:

  • Eta-squared
  • Epsilon-squared
  • Omega-squared Fixed-effect
  • Omega-squared Random-effect

Диалог One-Sample T Test с установленным флагом Estimate effect sizes

Запрос вывода оценки величины эффекта при проверке гипотезе о среднем значении. IBM SPSS Statistics 27
 

Вывод процедуры One-Sample T Test с оценками величины эффекта

Оценки величины эффекта – Cohens’ d и Hedges’ g и их доверительные интервалы в выводе процедуры t-критерия для среднего. IBM SPSS Statistics 27
 

Взвешенная Каппа Коэна

Каппа Коэна – распространенная мера согласованности двух классификаций. С ее помощью можно измерить, насколько схожи два эксперта в классификации объектов на заданное число групп. Или, например, насколько соответствует классификация, сделанная прогностической моделью реальным классам объектов. В SPSS Statistics каппа Коэна была доступна довольно давно. Располагается она в диалоге расчета таблиц сопряженности.

В 27-й версии появилась взвешенная каппа Коэна, при расчете которой учитывается порядок категорий. Что имеется в виду?

Для простой Каппы для каждого конкретного наблюдения имеет значение лишь факт совпадения или несовпадения его класса согласно двум источникам классификации. Однако если классы как-либо упорядочены, то очевидно, что у возможной ошибки (рассогласования категорий) появляется как бы свой вес. Назначение объекта разными экспертами в соседствующие классы – это меньшая рассогласованность, чем определение объектов в классы на разных полюсах шкалы. Взвешенная каппа Коэна позволяет это учитывать и по-разному «штрафовать» несогласованности разной величины. Соответственно, и результат (собственно – значение каппа) будет отличаться от невзвешенной каппы. И в случае, если мы имеем дело с упорядоченными категориями, в 27-й версии Statistics нам доступна более точная мера согласованности классификаций.

Диалог запросы вывода Взвешенной каппы: Weighted Kappa. IBM SPSS Statistics 27

Диалоговое окно процедуры Взвешенной каппы Коэна. IBM SPSS Statistics 27
 

Дополнения в ряде процедур

Новые функции в процедуре MATRIX. Матричный язык SPSS может использоваться опытными пользователями SPSS для разработки новых процедур с вычислениями по принципам линейной алгебры. У этого языка нет диалогового интерфейса. Тем, кто работает с языком MATRIX, будет интересно узнать, что в IBM SPSS Statistics 27 в язык MATRIX добавлены функции для работы с распределениями вероятности и со случайными числами. Ранее для использования таких функций требовалось прибегать к команде COMPUTE непосредственно в наборе данных.

Управление оценками параметров распределений в критерии Колмогорова-Смирнова. Были изменены диалоги и команды синтаксиса критерия Колмогорова-Смирнова, используемого для оценки соответствия фактического распределения переменной заданному распределению. Модифицированы диалоги и синтаксис как в старой (NPAR TESTS), так и в новой (NP TESTS) непараметрических процедурах. Теперь в каждой из них можно указать конкретно, хотим ли мы оценить параметры распределения из данных, либо задать свои. И в случае оценки из данных — указать количество выборок для оценки методом Монте-Карло и желаемый доверительный интервал для статистической значимости.

Сетка оцениваемых квантилей в квантильной регрессии. В процедуре квантильной регрессии появился режим задания сетки оцениваемых квантилей. Стало проще задать необходимость оценки сразу нескольких квантилей, например, от 0,10 до 0,9 с шагом 0,1.

Диаграммы и оформление результатов

Новые опции форматирования популярных таблиц

Начиная с 27-й версии SPSS пользователь может запрашивать построение матрицы корреляций, где элементы, симметричные относительно главной диагонали, не дублируются. Т.е. верхний треугольник матрицы остается пустым. Для этого требуется установить флажок в обновленном диалоговом окне. Дополнительно можно сделать матрицу еще более компактной, убрав элементы главной диагонали, не несущие в себе полезной информации. Соответствующие модификации коснулись и команды синтаксиса CORRELATE: в ней появились новые ключевые слова, ответственные за вид корреляционной матрицы.

Для популярных процедур построения частотных таблиц и кросстабуляций также появилась возможность в один клик делать вывод более компактным, а получаемые таблицы – готовыми к публикации. Это флажок Create APA style table. APA – аббревиатура American Psychological Association, которая разработала правила стилизации публикаций, широко признанные научным сообществом. При выставлении этого флага выходная таблица очищается от вспомогательных элементов и заголовков строк и столбцов, а статистики получают компактные наименования.

Новые параметры OUTPUT MODIFY

Команда OUTPUT MODIFY была введена еще в 22-й версии SPSS и является мощным средством для финишной настройки вывода. C ее помощью можно форматировать вывод, не прибегая к скриптам и оставаясь в рамках синтаксиса SPSS. Эта команда была расширена в 27-й версии, и теперь в ней можно дополнительно вращать таблицу (т.е. осуществлять так называемый pivoting), группировать/разгруппировывать заголовки строк и столбцов (т.е. делать таблицу более простой по структуре, а это желательно, если мы, например, хотим выгрузить ее в Word), а также находить и преобразовывать столбцы, содержащие конкретные статистики. Сделано это было как раз для применения к таблицам частот и кросс-табуляций APA-стиля, но с помощью расширенной команды пользователи могут преобразовывать также таблицы, генерируемые другими процедурами.

Пузырьковая диаграмма

В построителе диаграмм (Chart Builder) появился новый встроенный шаблон для создания пузырьковых диаграмм. Это диаграммы разброса, на которых можно отразить связь сразу 4-х переменных: две количественных переменных задают оси диаграммы, еще одна количественная - задает размер точки (или в данном случае — пузырька). А с помощью категориальной переменной пузырьки можно раскрасить по категориям. Возможность построения таких диаграмм в SPSS была давно, но для этого требовалось использовать встроенный язык GPL (Graphic Production Language). Теперь построить диаграмму можно без написания кода.

В диалоге Chart Builder видно поле Задать размер для выбора переменной, которая будет управлять размером пузырька. IBM SPSS Statistics 27

Диалог построителя диаграмм с настройками размера пузырька для диаграммы разброса. IBM SPSS Statistics 27
 

Больше опций для форматирования диаграмм

В опциях SPSS, в установках по умолчанию для форматирования диаграмм появился предпросмотр диаграмм. Меняя ту или иную установку, пользователь сразу видит, как, приблизительно, она отразится на внешнем виде будущей диаграммы.

Появилась сразу несколько предустановленных стилей диаграмм, между которыми удобно переключаться. Нужный стиль можно выставить как в глобальных настройках системы, так и выбрать индивидуально в диалоге построителя диаграмм. Например, зная, что диаграмму вам предстоит опубликовать в черно-белом исполнении, можно выбрать предустановленный стиль Publication Gray. При этом, разумеется, сохраняется возможность применить шаблон оформления из отдельного файла.

Размеры шрифтов

В редакторе вывода на панелях редактирования элементов диаграмм и таблиц добавлены кнопки быстрого увеличения/уменьшения размеров шрифта.

Интерфейс и вспомогательный функционал системы

Светлая тема интерфейса

Разумеется, это сразу бросается в глаза. Новый SPSS выглядит вначале чуть непривычно, но привыкаешь к новому оформлению быстро. Тема оформления SPSS Light стала чуть светлее, без лишних элементов, более «квадратной», в общем, современной. Если же вам нравилось работать с одной из прежних тем оформления, в настройках их можно вернуть.

Сквозной поиск

На всех панелях инструментов по умолчанию появилась кнопка сквозного поиска. Как это работает? При вводе текста в строку поиска SPSS ищет введенный термин среди меню и разделов он-лайн справки. Так, например, при вводе «коррел» в окне появится список процедур (диалоговых окон), в названии которых есть слово «корреляция», а также разделы справки, в том числе — примеры кейс-стади, в которых говорится про корреляционный анализ. Выбор соответствующего пункта списка сразу же открывает либо соответствующее диалоговое окно, либо браузер со страницей справочной системы.

Диалог сквозного поиска в IBM SPSS Statistics 27
 

Автовосстановление файлов

Добавлена функция автоматического восстановления данных от случайных потерь во время нештатного завершения работы приложения или операционной системы. По умолчанию функция осуществляет бэкап несохраненных данных, синтаксиса и файлов вывода каждые 10 минут. Интервал можно настроить, а при необходимости отключить автовосстановление.

Обратная связь

Иногда во время работы с приложением рождаются идеи, как его можно улучшить. Теперь в SPSS появляется возможность дать быструю обратную связь, не сильно отвлекаясь от работы. Просто выберите пункт меню Give Feedback и черкните пару слов, что вам хотелось бы изменить в SPSS. Это поможет разработчикам совершенствовать новые версии продукта. По соседству с этим разделом расположена форма отправки сообщений об ошибках.

«Родной» диалог открытия файлов для macOS

Пользователей mac в новая версия SPSS порадует привычными для систем macintosh диалогами выбора файлов. В предыдущих версиях эти диалоги сильно отличались от стандартных в результате адаптации исходного интерфейса Windows к платформе Mac.

Прочее

Python 3.8.2 в комплекте

Вместе с новым SPSS разворачивается более современная версия интерпретатора Python – 3.8.2. Разумеется, вместе с этой версией устанавливаются и соответствующие адаптированные библиотеки, обеспечивающие интеграцию Python и SPSS. Если вы предпочитаете пользоваться более старым интерпретатором (в том числе и Python 2), то, как и ранее, это можно сконфигурировать дополнительно.

Приветственный экран онлайн

С приветственного экрана, который открывается по умолчанию при каждом запуске программы, удобно открывать последние рабочие файлы или файлы примеров. На нем же содержатся ссылки на наиболее популярные интернет-ресурсы, связанные с SPSS. В SPSS 27 экран получил возможность подтягивать с сайта IBM новости, информацию об обновлениях продукта и другие релевантные сведения.

Приветственный диалог IBM SPSS Statistics 27
 

Настройки приватности

В настройках продукта появилась новая вкладка: Privacy. В ней можно включить или отключить загрузку информации для приветственного экрана через интернет, а также включить или отключить автоматический обмен информации с производителем (IBM) относительно статистики использования продукта и возможных ошибок.

С помощью компании Predictive Solutions Вы можете стать пользователем новой версии IBM SPSS Statistics и, что очень важно, получить компетентную техническую поддержку. Если у вас возникли вопросы, напишите нам: info@predictivesolutions.ru.

См. также информацию о других версиях SPSS:
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Требуетcя помощь?

Подобрать конфигурацию ПО, вид лицензии, оценить решение, рассказать о функционале смогут наши консультанты. Обращайтесь: +7 (495) 229-56-11, info@predictive.ru