Пропустить общее меню / Skip Global Navigation

+7 (495) 229-56-11  Квадрат SPSS  info@predictive.ru

Что нового в IBM SPSS Statistics 24?

Ответственно подойдя к подготовке этого обзора, мы внимательно изучили и протестировали новые возможности IBM SPSS Statistics 24. Взяв за основу раздел официальный справки What’s new in version 24, мы подробно прокомментировали, чем могут Вам пригодиться новые функции Statistics, и почему стоит рассмотреть установку свежего релиза.

Если на изучение подробного обзора времени нет, Вы можете ознакомиться с его краткой версией в нашем новостном разделе.

Приобрести IBM SPSS Statistics 24 можно в составе комплексного решения для анализа данных и построения отчетов PS IMAGO PRO 4. А если Вы — представитель вуза или НИИ, функционал IBM SPSS Statistics доступен Вам в рамках академического решения Статкласс.

Итак, что нового в IBM SPSS Statistics 24?

 

См. также информацию о других версиях SPSS: 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Чтение и запись Excel-файлов

Разумеется, Statistics давно и хорошо работает с такими форматами, как .xls и .xlsx! Он может импортировать и экспортировать данные с использованием файлов MS Excel, а также экспортировать в Excel результаты работы (таблицы Pivot Tables, текстовый вывод и диаграммы, т.е. всё то, что в SPSS называется Output).

В IBM SPSS Statistics 24 появилось несколько улучшений для чтения и записи данных из/в файлы Excel.

Процент значений для определения формата данных

В мастере чтения файлов Excel (при импорте данных в SPSS) пользователь может указать процент значений в столбце, на основе которых SPSS должен принимать решение о формате импортируемой переменной. Это весьма удобно, например, при импорте данных после ручного ввода в Excel, когда в столбце с числовой переменной могут встречаться строковые комментарии оператора. Ранее в этом случае весь столбец получал бы строковый тип (как наиболее общий) и конвертировать его в число пришлось бы уже средствами SPSS. Сейчас, в случае, если текст в числовой переменной встречается сравнительно редко (например, менее, чем в 5% ячеек столбца), формат столбца в SPSS будет установлен корректно как числовой, а ячейки со строковыми значениями будут иметь системные пропущенные значения. Такие ячейки можно легко идентифицировать и скорректировать их значения в редакторе данных IBM SPSS Statistics.

Пропуск скрытых строк и столбцов

Если в сохраненном файле Excel Вы скрыли некоторые строки или столбцы за ненадобностью, и теперь хотите импортировать эту таблицу в SPSS для анализа, установите флаг «Игнорировать скрытые строки и столбцы» в мастере импорта данных. Так Вы исключите «сюрпризы», когда после импорта данных привычная небольшая таблица вдруг становится неохватно большой из-за того, что SPSS импортировал все строки и столбцы, включая и ненужные (скрытые Вами).

Удаление ведущих и концевых пробелов в строковых значениях

При работе со строковыми значениями ведущие и концевые пробелы (т.е. пробелы, стоящие в начале или конце строки), могут создавать лишние трудности. Невидимые глазу в исходных данных, эти чаще всего случайно добавленные символы скрупулёзно учитываются программой. В результате, например, фамилии «Петров» и « Петров» представляют в анализе разные категории. Установка соответствующих флагов в мастере импорта

  • Удалить начальные пробелы из строковых значений и
  • Удалить хвостовые пробелы из строковых значений

предотвратит возникновение подобных ситуаций: данные придут в SPSS уже очищенными.

Опции для экспорта данных

В этом разделе — 3 нововведения:

  1. Имя листа. Появилась возможность задавать имя листа при экспорте данных из SPSS в Excel.
  2. Добавление листа в существующий файл. Появилась возможность экспортировать данные на именованный лист в уже существующий файл Excel (пользователь задает имя листа и отмечает, что требуется добавить новый лист в существующий файл).
  3. Запись меток переменных вместо имён. Экспортируя данные с записью имен переменных в первую строку листа, пользователь теперь может выбрать, записывать ли непосредственно имена переменных, или же их метки (при наличии).

 

Чтение данных из текстовых файлов

Импорт данных для анализа из текстовых файлов, как правило, более сложен, чем импорт из двоичных файлов (Excel, SAS), или из баз данных. Ведь текстовые файлы не содержат готовых мета-данных со сведениями о структуре файла и типах хранящихся в нем данных. Всю эту информацию пользователь должен указать при импорте. Свежая версия SPSS Statistics облегчает жизнь пользователей в этом отношении.

Простой мастер чтения файлов CSV

Импортировать данные из файла CSV (файл с запятыми, точками с запятой или табуляцией в качестве разделителей полей) теперь можно в одно действие. Открыв меню Файл…Импорт данных…Данные CSV и указав импортируемый файл, Вы получите единое окно, в котором можно задать все основные опции для импорта данных: разделитель полей, ограничитель текстовых значений, долю значений для определения формата поля (как и в случае с импортом из Excel, см. выше).

Отлично, что здесь же Вы можете указать и десятичный разделитель: точку или запятую! Тот нюанс, что в русифицированных версиях Windows десятичным разделителем на уровне системы является запятая, создает головную боль пользователям при работе с программами, которые по умолчанию считают десятичным разделителем точку (западный вариант). Здесь Вы можете просто выбрать знак, разделяющий целую и десятичную часть числа, исключая необходимость предварительной подготовки файла данных с помощью текстового редактора.

А если Вам потребуется указать больше опций для импорта, можно переключиться прямо из этого окна в более подробный многошаговый мастер импорта текстовых данных.

Определение форматов данных

При чтении данных появилось больше гибкости в установлении формата импортируемых данных:

  • Автоопределение формата теперь работает после прочтения всех значений в столбце данных, а не только первых 250 строк.
  • Пользователь может управлять процентом значений в столбце, которые определяют формат данных столбца: редкие «посторонние» значения не будут приводить к неверному определению формата всего столбца.
  • Отдельные переменные пользователь может не импортировать.
  • Можно задать отсечение ведущих и концевых пробелов в строковых значениях.

Кроме того, автоматическое определение форматов данных теперь лучше работает с данными дат и времени, допуская большее число форматов записи и ослабляя требования к строгости записи значений. Об этом — ниже.

 

Новое в форматах даты и времени

Форматы даты и времени выполняют в IBM SPSS Statistics несколько функций:

  • при чтении текстовых данных они позволяют распознавать, что переменная содержит значения даты или времени для корректного внутреннего представления таких значений
  • при отображении значений даты и времени в редакторе данных они позволяют представить значения в нужном пользователю виде, например, как «20.01.2016» или как «2016/01/20»
  • при записи значений даты и времени в текстовый файл они предписывают, в каком именно виде дата и время будут записаны в текстовый файл.

Новые форматы YMDHMS и MTIME

Назначение этих форматов переменным позволяет прочитать и вывести значения в форматах 2016-01-20 09:25:35 и 25:35, т.е. годы-месяцы-дни часы:минуты:секунды и минуты:секунды.

Автораспознавание форматов, естественно, учитывает возможность записи значений в указанных форматах.

Меньшая строгость записи некоторых форматов дат и времени

Для форматов дат и времени, таких, как DATE, ADATE, EDATE, SDATE, WKYR, TIME, MTIME, в ряде случаев можно опускать разделители между числами («-», «/», «.», « » или «:»). SPSS самостоятельно «догадается», что перед ним — запись даты или времени без соответствующих разделителей.

Например, формат EDATE10 может быть прочитан программой и в варианте записи «01.12.1999», и как «01121999».

Естественно, в данном случае должны быть соблюдены некоторые дополнительные условия, например, дни или месяцы должны быть записаны двумя цифрами, а годы должны иметь консистентное обозначение — либо везде двумя цифрами, либо четырьмя.

Улучшения в Настраиваемых таблицах (Custom Tables)

Custom Tables — наиболее популярный дополнительный модуль IBM SPSS Statistics. Это — простой, но мощный конструктор аналитических таблиц. В 24-й версии здесь появились новые опции, связанные с доверительными интервалами и значимостью статистических критериев.

Отображение значимости различий долей и средних

Ранее данные о значимости запрошенных критериев выводились только во вспомогательной таблице (не в той, что содержит оценки долей и средних). Теперь этим можно управлять. То есть, сведения о том, что значение в данной ячейке статистически значимо отличается от значений в соседних ячейках, могут быть отображены и в основной таблице. Честно говоря, это сильно облегчает восприятие результатов!

Кроме того, во вспомогательную таблицу сейчас могут быть выведены численные значения уровня значимости статистики критерия (p). Ранее выводились лишь сведения о том, перешло ли значение статистики порог отвержения нулевой гипотезы, и без дополнительных проверок Вы не знали, насколько близко выборочные результаты оказались к порогу отвержения гипотезы.

Расчеты на основе эффективной базы (effective base)

Введена важная опция расчетов вариации и статистической значимости на основе так называемой «эффективной базы». Ее использование снижает вероятность сделать ложный вывод о существовании значимых различий в случае, если простая случайная выборка после сбора данных подвергалась существенным исправлениям (взвешиванию с большими весами для устранения диспропорций).

Применение данной опции имеет преимущество над взвешиванием данных (если оно также включено) и отличается от взвешивания двумя особенностями:

  • В интересах расчета статистических критериев показатель объема выборки сокращается тем сильнее, чем более существенные корректировки вносятся исследователем с помощью веса. Таким образом, возможности выявить значимые различия на сильно «исправленной» выборке сокращаются.
  • При расчете показателей дисперсии веса не округляются до целых (как в случае с простыми весами), а используются как есть.

Правила вычисления описательных статистик с корректирующими весами — те же, что и для обычных (частотных) весов, задаваемых командой WEIGHT.

Ширятся доверительные интервалы!

Пополнился перечень статистик, для которых возможен расчет стандартных ошибок и доверительных интервалов в процедуре Настраиваемых таблиц. Так, теперь Вы можете рассчитать здесь доверительный интервал для суммы значений или медианы.

 

Прикладное программирование в SPSS и внешние библиотеки

Связь IBM SPSS Statistics с внешними языками программирования – его современная отличительная черта. Для того, чтобы пользоваться этими преимуществами, не обязательно быть программистом. Вы вполне можете использовать готовые надстройки, созданные другими разработчиками.

Управление расширениями (extensions)

Появился удобный инструмент управления программными расширениями SPSS, интегрированный с он-лайн хранилищем расширений для продуктов SPSS от IBM — Extension Hub. С его помощью Вы можете искать необходимые расширения, скачивать их и устанавливать, получать обновления, просматривать свойства и удалять. Скачанные расширения, как правило, дополняют стандартное меню IBM SPSS Statistics, и Вы можете вызывать их диалоговые окна точно также, как стандартные процедуры пакета.

Среди расширений есть как довольно сложные алгоритмы (например, модели опорных векторов или дерево решений C5.0), так и небольшие утилиты. Слышали о «мешочной» диаграмме? Установите расширение STATS BAGPLOT и попробуйте. С IBM SPSS Statistics 24 это очень просто.

Выбор интерпретатора Python

В том случае, если Вы используете разные интерпретаторы Python (2 и 3 версии), при запуске скрипта Python Вы можете выбирать, на какой версии будет выполняться данный скрипт.

При запуске через меню Утилиты…Запустить сценарий этот выбор делается с помощью радиокнопок в интерфейсе. А при запуске в синтаксисе версия указывается в инструкции BEGIN PROGRAM…END PROGRAM, например:

BEGIN PROGRAM PYTHON2 или BEGIN PROGRAM PYTHON3

В настройках Вы также можете указать, какой интерпретатор будет использован по умолчанию.

 

Серьезные усовершенствования Конструктора пользовательских диалогов (Custom Dialog Builder)

С помощью Конструктора пользовательских диалогов Вы можете создавать диалоговые окна, подобные стандартным диалоговым окнам SPSS Statistics. С их помощью удобно задавать параметры для синтаксиса и скриптов, которые Вы написали. Передав такой диалог вместе с синтаксисом менее опытному пользователю, Вы можете не опасаться, что он допустит неточность при использовании Вашего кода.

Конструктор диалогов появился в SPSS Statistics очень давно, но до версии 24 его функциональность была ограничена созданием списков переменных, текстовых полей и ряда других элементов управления. Сейчас возможности существенно расширены:

  • Добавлен целый ряд новых элементов управления: выбор полей (с сортировкой и фильтрацией переменных по шкале, роли, позиции в файле), выбор набора данных, поле даты, поле ввода пароля, элемент выбора цвета, таблица, набор вкладок.
  • Элементы управления могут активироваться или деактивироваться в зависимости от состояния других элементов управления.
  • Можно задавать минимум и максимум полей в целевом списке, а также задавать минимальное и максимальное число выбранных элементов в списке с множественным выбором.
  • Поле со списком может быть редактируемым. В этом случае пользователь может задать в нём произвольное значение после открытия диалога.
  • В интересах упорядочения размещения элементов управления для таких элементов, как поле со списком, текстовое поле, числовое поле и кнопка выбора файлов и ряда других подпись может размещаться слева от элемента.
  • Для элементов, генерирующих список значений, разработчик диалога может задать разделитель значений, который будет использован при вставке списка в синтаксис. Это свойство настраивается для списков целевых переменных, элемента выбора полей, таблиц и обычных списков.
  • Для элементов работы со вводом с клавиатуры (текстовое поле, числовое поле, поле ввода пароля) может настраиваться подходящая ширина поля.
  • Конструктор адаптирован к современным широким экранам. Холст диалога, где Вы можете размещать элементы управления, разделен на 4 столбца (вместо 3-х, как было ранее). Разработчику предписаны определенные ограничения на размещения элементов управления в этих столбцах, чтобы внешний вид диалогов максимально соответствовал стилю стандартных диалогов SPSS.
  • Для текстовых полей предусмотрена автоматическая валидация вводимых значений в том случае, если результат ввода будет использоваться запускаемым синтаксисом или сценарием в качестве имени переменной или имени набора данных.
  • Разработчик диалога может настроить, как должны интерпретироваться символы кавычек, появляющихся внутри значений, ограниченных одинарными или двойными кавычками. Данное свойство настраивается для текстовых полей, таблиц, полей со списком и простого списка.
  • Вместе с диалогом настраивается его положение в меню (включая возможность задания подменю), которое автоматически создается при установке диалога. Меню диалога может появляться во всех окнах IBM SPSS Statistics, либо в выбранном (например, в Редакторе данных, Выводе или окне синтаксиса).

В комплексе эти нововведения позволяют создавать гибкие функциональные диалоги, по внешнему виду и возможностям напоминающие, например, новые диалоги Непараметрических критериев или Автоматических линейных моделей.

 

Увидели здесь функции, которые пригодятся Вам в работе? Проконсультируйтесь по возможностям обновления текущей версии IBM SPSS Statistics или приобретения новой лицензии. В рамках аналитического решения PS IMAGO PRO или академического решения Статкласс мы можем предложить очень гибкие условия лицензирования компонентов IBM SPSS, чтобы Вы смогли пользоваться всеми преимуществами новейшей версии IBM SPSS Statistics 24!

 

Ссылки по теме

Требуетcя помощь?

Подобрать конфигурацию ПО, вид лицензии, оценить решение, рассказать о функционале смогут наши консультанты. Обращайтесь: +7 (495) 229-56-11, info@predictive.ru


 

 

 

 

 

 

 

 

Новый мастер импорта из Excel

Новый мастер импорта из Excel

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Новые опции экспорта в Excel в IBM SPSS Statistics 24

Новые опции экспорта в Excel

 

 

 

 

Мастер чтения CSV-файлов в IBM SPSS Statistics 24

Мастер чтения CSV-файлов

 

 

 

 

Автоопределение форматов данных при чтении текстовых файлов в IBM SPSS Statistics 24

Определение форматов данных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отображение значимости различий долей и средних в новом IBM SPSS Custom Tables 24

Отображение значимости различий долей и средних

 

Задание корректирующих весов с оценкой значимости по эффективной базе IBM SPSS Custom Tables 24

Корректирующие веса в с оценкой значимости по эффективной базе

 

 

Новые доверительные интервалы в IBM SPSS Custom Tables 24

Больше доверительных интервалов

Управление расширениями в IBM SPSS Statistics 24

Управление расширениями, интеграция с Extensions Hub

Альтернативные интерпретаторы Python в IBM SPSS Statistics 24

Альтернативные интерпретаторы Python

Выбор интерпретатора Python при запуске скрипта в IBM SPSS Statistics 24

Выбор интерпретатора Python при запуске

 

 

Расширенный конструктор диалогов в IBM SPSS Statistics 24

Расширенный конструктор диалогов

 

 

Разрабатывайте собственные диалоги в IBM SPSS Statistics 24

Разрабатывайте собственные диалоги с новыми элементами управления