SPSS 11

  • Статистики отношений. Эта новая процедура дает возможность расчета широкого перечня статистик, описывающих отношения между двумя количественными переменными. Кроме прочего, статистики включают коэффициент разброса (дисперсии), коэффициенты вариации, среднее абсолютное отклонение и индекс регрессивности (price-related differential). Статистики отношений часто применяются в оценочной деятельности - для изучения соотношений между оценочной и продажной стоимостью.
  • Линейные смешанные модели. Эта новая процедура позволяет строить прогностические модели на данных, имеющих вложенную (иерархическую) структуру. В рамках этой модели можно специфицировать широкий круг моделей, таких, как ANOVA с фиксированными эффектами, рандомизированные полноблочные планы, планы с расщепленными делянками, модели со случайными коэффициентами, многоуровневый анализ, неограниченная модель линейного роста, модель линейного роста с ковариатами на уровне наблюдения, анализ с повторными измерениями, анализ с повторными измерениями с ковариатами, зависящими от времени. В дополнение есть возможность работать с планами повторных измерений, такими как неполные повторные измерения, когда число сделанных наблюдений варьируется от объекта наблюдения к объекту наблюдения. Процедура Linear Mixed Models доступна в дополнительном модуле Advanced Statistics.
  • Повышенная производительность. Значительно ускорена работа следующих статистических процедур: общие линейные модели, вычисление расстояний, иерархический кластерный анализ (все это в базовом модуле), а также мультиномиальной логистической регрессии (в дополнительном модуле Regression).
  • Управление данными. Введен конструктор реструктуризации данных, позволяющий осуществлять типовые преобразования, когда из одной строки (наблюдения) формируется несколько строк, либо, наоборот, когда несколько строк трансформируются в одну. Иными словами, конструктор позволяет производить преобразования файла данных из транзакционной структуры в аналитическую (из "узкого" формата в "широкий") и наоборот.
  • Новшества в конструкторе чтения баз данных. Теперь он позволяет на ходу перекодировать категориальные строковые поля в числовые переменные с сохранением исходных строковых значений в качестве меток числовых кодов. Он также включает автообъединение таблиц по внутренним (первичным0 и внешним ключам и поддерживает извлечение случайных выборок из больших таблиц.
  • Новшества в конструкторе чтения текстовых файлов. Теперь оно позволяет считывать текстовые файлы формата CSV, которые включают ограничители значений (например, "1,32", "2,00" и т.д.).
  • Дополнения процедуры OLAP-кубов. Введен расчет абсолютных и процентных разностей между категориями группирующей переменной или между отдельными переменными.
  • Однофакторная ANOVA. Добавлены проверки Брауна-Форсайта (Brown-Forsythe) и Велча (Welch).
  • Экспоненциальное представление для малых чисел. В параметрах программы предусмотрено отключение показа экспоненциальной записи. При отключении малые значения будут выводиться в таблицах как 0 или 0,000.
  • Агрегирование. В список доступных функций агрегирования добавлена медиана.
  • Арифметические функции. Доступный список функций для задания арифметических выражений расширен функциями плотности вероятности для непрерывных и дискретных распределений.
  • Мультиномиальная логистическая регрессия. В эту процедуру добавлен новый функционал по сохранению оцененных вероятностей откликов, предсказанного отклика (категории), оцененной вероятности предскзанного отклика и оцененной вероятности для того отклика, который наблюдался фактически. Процедура доступна в дополнительном модулей Regression.
  • Категориальная регрессия. Процедура была переработана для расширения функционала и простоты использования. Процедура доступна в дополнительном модуле Categories.
  • Категориальный анализ клавных компонент. Внесены изменения для представления результатов в более доступном для понимания виде. Процедура доступна в дополнительном модуле Categories.

Дополнения, введенные в SPSS 11.5

  • Новые инструменты описания данных. Добавлены следующие две опции, с помощью которых определить метаданные можно быстрее и проще:
    - конструктор копирования свойств данных дает возможность использовать внешний файл данных в качестве шаблона, определяющего свойства переменных в активном наборе данных. Кроме того можно использовать переменные из активного набора данных в качестве шаблона для других переменных из этого же набора данных. Конструктор копирования свойств данных доступен в меню Data.
    - определение свойств переменных (функция также доступна из меню Data) сканирует файл данных и выводит перечень уникальных значений для любой выделенной переменной, идентифицирует значения, не имеющие меток и предлагает возмоность автоматической генерации меток. Это практически полезная опция для работы с категориальными переменными, в которых используются числовые коды, представляющие содержательные категории (например, 0 = мужчины, 1 = женщины).
  • Расширенная поддержка форматов данных SAS. Появилась возможность сохранять данные в форматах SAS версий 6, 7, а также "транспортном" формате SAS.
  • Расширенные возможности экспорта результатов. Есть возможность экспорта либо документа вывода целиком, либо отдельных объектов из окна вывода. Доступные форматы: Word/RTF или Excel (диаграммы при экспорте в Excel не включаются).
  • Несколько языков вывода результатов. Введена возможность представления результатов работы процедур в мобильных таблицах на нескольких языках. Переключить язык вывода можно не прерывая сессии работы в SPSS.
  • Двухэтапный кластерный анализ (TwoStep Cluster Analysis). Эта новая процедура кластеризации предлагает возможности, которые не были реализованы ни в одной другой процедуре кластеризации в SPSS:
    - автоматический выбор наилучшего числа кластеров в дополнение к метрикам для выбора кластерного решения из нескольких моделей;
    - возможность создавать кластерные модели одновременно в пространстве категориальных и количественных переменных;
    - возможность сохранять кластерную модель в виде внешнего XML-файла для последующей кластеризации на основе этой модели новых данных по тем правилам, которые заложены в модель;
    - возможность быстрой кластеризации больших массивов данных.
  • Новая процедура Custom Tables (настраиваемые таблицы). Данная процедура заменяет и дополняет функционал, который ранее был реализован в модуле Tables:
    - простой визуальный конструктор, позволяющий оценить структуру будущей таблицы по мере добавления в нее переменных и настройки параметров;
    - единый интерфейс построения таблиц, заменяющий множество диалоговых окон и опций в них, предназначенных для разных типов таблиц
    - подытоги и поднаборы категорий для категориальных переменных;
    - полный контроль над появлением категорий в таблице и порядком их вывода.
    Процедура Custom Tables реализована в дополнительном модуле Custom Tables.