SPSS Statistics 15

Что нового в IBM SPSS Statistics 15?

Управление данными

  • Пользовательские атрибуты переменных. В дополнение к стандартным и привычным атрибутам (таким, как метки значений, пропущенные значения, шкала измерения) теперь можно создавать собственные атрибуты переменных. Эти атрибуты можно отображать и редактировать непосредственно в представлении переменных (Variable View) редактора данных SPSS. Как и стандартные атрибуты, пользовательские атрибуты переменных сохраняются вместе с остальным словарем данных (метаданными) в файле данных формата SPSS (.sav-файлах). Ранее, в версии SPSS 14 опция пользовательских атрибутов уже была введена в функционал пакета, но тогда она была доступна лишь через команды синтаксиса (в частности, команду VARIABLE ATTRIBUTE).
  • Наборы переменных (variable sets). Появилась возможность управлять тем, какие именно переменные из файла данных отображаются в редакторе данных (data editor) SPSS, а также в диалоговых окнах. В предыдущих релизах понятие наборов переменных тоже присутствовало, однако затрагивало лишь наборы переменных в диалоговых окнах. Очевидно, что наборы переменных упрощают ориентирование в массивах данных с большим числом переменных.
  • Конструктор экспорта в базы данных. Добавлена возможность экспорта данных в таблицы БД без необходимости разработки SQL-кода. Можно создать таблицу, заменить значения полей в уже существующей таблице, добавить туда новые поля. То есть, в виде удобного пользовательского интерфейса реализован основной фукнционал, связанный с записью результатов работы в статистическом пакете в базы данных посредством драйверов ODBC.
  • Экспорт в Dimensions. Конструктор экспорта в Dimensions создает на основе массива данных SPSS пару файлов, состоящую из файла данных SPSS и соответствующего ему файла метаданных формата Dimensions. Экспортированные данные можно использовать в приложениях платформы Dimensions, таких как mrInterview или mrTables (поздее эту возможность заменит экспорт данных в формат IBM SPSS Data Collection - продукт, наследующий функционал платформы для сбора данных Dimensions). Это особенно полезная возможность для организации "круговорота" данных между приложениями SPSS и Dimensions. Так, например, вы можете импортировать источик данных mrInterview в SPSS, выислить несколько новых переменных, и сохранить файл в формате, пригодном для чтения в mrTables без потери каких-либо исходных атрибутов метаданных.
  • Сохранение данных в формат CSV. Возможность экспорта в CSV-формат (comma-separated values - значения, разделенные запятыми) была добавлена в связи с большой популярностью этого формата обмена данных и возможностью чтения таких данных во множестве приложений (в т.ч. в Excel). В синтаксисе за экспорт данных в формат CSV отвечает команда SAVE TRANSLATE.

Отчеты, вывод

  • Экспорт результатов в PDF-формат. Добавлен экспорт результатов в PDF-формат. Заголовки дерева вывода SPSS экспортируются в качестве закладок PDF-файла.
  • Новые опции в картах контроля качества. Появилась возможность быстро задать наиболее частоупотребимые правила для диаграмм контроля качества для идентификации точек процесса, выходящих за границы нормы. Разумеется, если требуется задать какой-то специальный порог, не представленный в области выбора, широкие графические возможности SPSS позволят это сделать.


  • Новые типы диаграмм в конструкторе диаграмм. Библиотека готовых типов диаграмм нового графического конструктора SPSS расширена новыми гистограммами, ящичковыми диаграммами (box plots), матрицами диаграмм рассеяния (корреляционных полей), диаграммами рассеяния с наложениями, популяционными пирамидами, графиками ошибок, биржевыми диаграммами, диаграммами разниц, диаграммами столбцов размаха, точечными графиками, возможностями сопоставления различных переменных на одном графике, а также представления на нескольких графиках (панелях). Можно создавать также графики, которые ранее не были доступны в SPSS даже в устаревших средствах, такие, как диаграммы с двойными осями.
  • Программное управление документами вывода SPSS. С помощью вновь введенных команд синтаксиса OUTPUT NEW, OUTPUT NAME, OUTPUT ACTIVATE, OUTPUT OPEN, OUTPUT SAVE и OUTPUT CLOSE можно создавать, открывать, активировать, сохранят и закрывать документы Viewer и Draft Viewer. Фактически сняты ограничения на разработку полностью автоматизируемых и интегрируемых приложений на основе статистического процессора SPSS.

Совершенствование статистических процедур

  • Порядковая регрессия. Данный алгоритм, ранее доступный в качестве компонента дополнительного модуля Advanced Models (позднее - Advanced Statistics) теперь доступен в базовом модуле пакета (SPSS Base).
  • Включение трансформаций в файлы моделей PMML. Теперь в файлы моделей, экспортированных в формате PMML, могут быть включены команды преобразований (например, для подготовки данных к скорингу). Заданные преобразования сливаются с файлами моделей с помощью команды TMS MERGE. Сами трансформации задаются в блоке команд TMS BEGIN-TMS END. В позднейших версиях SPSS возможности организации скоринга будут еще более усовершенствованы. В частности, скоринг можно будет осуществлять не только средствами продуктов SmartScrore, SPSS Server или Clementine (позднее - IBM SPSS Modeler), но и непосредственно в клиентской версии SPSS.
  • Обобщенные линейные модели. Обобщенные линейные модели расширяют общую линейную модель за счет включения в линейную связь между зависимой переменной и факторами (ковариатами) заданной функции связи. Более того, модель допускает ненормальное распределение для зависимой переменной. Процедура доступна в дополнительном модуле Advanced Models (позднее - Advanced Statistics).
  • Обобщенные уравнения оценки. Обобщенные уравнения оценки (Generalized Estimating Equations) еще более расширяют отдельный функционал обобщенных линейных моделей, допуская анализ повторных измерений. Эта процедура также доступна в дополнительном модулей Advanced Models.
  • Порядковая регрессия для сложных выборочных планов. Разновидность порядковой регрессии, реализованная в модуле Complex Samples (сложные выборки) выполняет регрессионное моделирование на двоичной или порядковой зависимой переменной в случае, когда выборка была осуществлена на основе плана сложной выборки (вероятностной выборки, отличной от простой случайной выборки). Возможно выполнение анализа по заданным в плане отдельным сегментам генеральной совокупности.
  • Оптимальная категоризация (optimal binning). Данная процедура производит дискретизацию одной или нескольких количественных переменных (измеренных на шкале отношений) с помощью отнесения исходных значени к нескольким категориям. Такая категоризация является оптимальной относительно заданной внешней переменной, которая в процессе категоризации выполняет роль "супервайзера" (или просто - целевой переменной). Созданные категории затем могут быть использованы вместо исходных переменных в дальнейшем анализе. Оптимальная категоризация довольно широко применима при подготовке данных к моделированию, когда, например, исходная количественная переменная содержит значительное число выбросов, либо ожидается существование нелинейных связей между количественной переменной и переменной отклика. Опция доступна в дополнительном модуле Data Preparation.

Программные расширения

  • Программные расширения теперь включают возможности записи данных в активный набор данных и создания собственных настраиваемых мобильных таблиц и кастомизированных процедур. За более подробной информацией рекомендуется обращаться на сайт разработчиков приложений на основе SPSS http://www.spss.com/devcentral (позднее сайт "переедет" на платформу IBM.