CAPACIDADES PARA LA ORGANIZACIÓN Y TRANSFORMACIÓN DE DATOS.


MODIFICACIÓN DE FICHEROS DE DATOS

ADICIÓN DE UNA NUEVA VARIABLE O CASO
TRANSPONER
FUNDIR ARCHIVOS

ADICIÓN DE UNA NUEVA VARIABLE O CASO

El procedimiento es seleccionar la columna(variable) o fila (caso) que va a quedar a la derecha de la nueva variable o caso y elegir las opciones de la barra principal Datos / Insertar variable o caso. Para definir las características de la variable, en vista de variable.

TRANSPONER

En SPSS los ficheros de datos tienen en las filas los casos y en las columnas las variables, sin embargo esta estructura no es universal y otros programas tienen el formato transpuesto, es decir almacenan las variable por filas y los casos por columnas. Por lo tanto al importar los datos puede ocurrir que no encontremos los datos como deseamos y por lo tanto tenemos que proceder a crea un archivo de datos nuevo en el que se interecambian las filas y las columnas del archivo de datos original.

Esto se hace selecionando en los menús:

Datos / Transponer... y seleccionando la columna o columnas que desee transponer en filas. Si lo desea, puede seleccionar una Variable de nombres para utilizar sus valores como nombres de variable en el archivo de datos transpuesto.

 

 

FUNDIR ARCHIVOS

En muchas ocasiones en los análisis estadísticos es necesario poder combinar y fusionar ficheros de datos, bien porque dispongamos de nuevas variables de estudio o bien porque tengamos nuevos indivudios. SPSS permite estos dos procedimientos, añadir casos y añadir variables.

Añadir casos: Para fusionar el archivo de datos de trabajo con otro archivo de datos que contiene las mismas variables pero diferentes casos. Variables desemparejadas. Nos permite excluir algunas variables del nuevo archivo de datos fusionado.

Añadir variable: Para fusionar el archivo de datos de trabajo con un archivo de datos externo que contiene los mismos casos pero variables diferentes. Variables excluidas: nos permite no incluir algunas variables.

 

MODIFICACIÓN DE CASOS

ORDENAR CASOS
SEGMENTAR ARCHIVO
SELECIONAR CASOS
PONDERAR CASOS


ORDENAR

En la mayoría de las ocasiones el orden de los datos no es relevante, sin embargo puede ser necesario en algun momento del análisis estadístico que los datos estén dispuestos según alguna variable que llamaremos variable de identificación.

SPSS dispone de esta opción en los menús:

Datos / Ordenar casos...

ORDENAR POR: Es necesario selecciononar al menos una variable de ordenación. El archivo de datos se ordenará en función de los valores de las variables de ordenación. Podemos selecionar varias variables de ordenación para que los casos se ordenen por los valores de cada variable dentro de las categorías de la variable anterior de la lista Ordenar por. Para las variables de cadena, las letras mayúsculas preceden a las minúsculas correspondientes en orden. Por ejemplo, el valor de cadena "Sí" precede a "sí".

SEGMENTAR ARCHIVO

Esta opción es especialmente interesantes cuando queremos realizar un análisis estadístico para distintos grupos de casos. Consiste en dividir el archivo de datos en distintos grupos para el análisis basándose en los valores de una o más variables de agrupación. Si selecciona varias variables de agrupación, los casos se agruparán por variable dentro de las categorías de la variable anterior de la lista Grupos basados en.

Datos / Segmentar archivo...

Seleccionamos cada una de las opciones siguientes según queramos obtener los resultados en el visor.

Comparar los grupos. Los grupos de segmentación del archivo se presentan juntos para poder compararlos. Se crea una sola tabla y un gráfico diferente para cada grupo y se muestran juntos en el visor.

Organizar los resultados por grupos. Los resultados de cada procedimiento se muestran por separado para cada grupo de segmentación del archivo.

Si el archivo de datos todavía no está ordenado, es necesario seleccionar Ordenar archivo según variables de agrupación.

SELECIONAR CASOS

SPSS permite hacer los estudios estadístico para una submuestra de los datos. Con la opción Datos / Selecionar casos.. podemos seleccionar un subgrupo de casos basándose en criterios que incluyen variables y expresiones complejas. También se puede seleccionar una muestra aleatoria de casos.

Selecionar: Los criterios usados para definir un subgrupo pueden incluir:

Valores y rangos de las variables
Rangos de fechas y horas
Números de caso (filas)
Expresiones aritméticas
Expresiones lógicas Funciones

Casos no seleccionados son . Puede filtrar o eliminar los casos que no reúnan los criterios de selección. Los casos filtrados permanecen en el archivo de datos pero se excluyen del análisis. Para desactivar el filtrado e incluir todos los casos en el análisis, seleccione Todos los casos.

PONDERAR CASOS

Con la opción ponderar casos proporciona a los casos diferentes ponderaciones (mediante una réplica simulada) para el análisis estadístico. Los valores de la variable de ponderación deben indicar el número de observaciones representadas por casos únicos en el archivo de datos. Los casos con valores perdidos, negativos o cero para la variable de ponderación se excluyen del análisis. Los valores fraccionarios son válidos.

 

MODIFICACIÓN DE VARIABLES

Una vez que tenemos en el editor de datos nuestros valores, bien porque hayan sido introducidos directamente o bien hayan sido importados, es muy frecuente que necesitemos realizar transformaciones de estos. SPSS dispone de una gran variedad de funciones para modificar un fichero.

CONSTRUCCIÓN DE UNA VARIABLE A PARTIR DE OTRA
CONTAR APARICIONES
RECODIFICACIÓN
CATEGORIZAR VARIABLES
REEMPLAZAR VALORES PERDIDOS

CONSTRUCCIÓN DE UNA VARIABLE A PARTIR DE OTRA

Son muchas las ocasiones en las que una tranformación de los datos nos ofrecen mejores posibilidades, por ejemplo para conseguir normalidad en datos que no lo son o convertir en estacionaria una serie no estacionaria. SPSS puede generar una variable umérica o de cadena (alfanuméricas) a partir de otra, mediante el resultado de una operación aritmética, lógica, u otra función de los valores de la variable inicial. Para ello elegimos:

Variable destino: Se introduce el nombre de la nueva variable .

Tipo y Etiqueta: Se puede especificar el tipo y la etiqueta de variable destino o nueva variable.

Expresión Numérica: Recoge la transformación a realizar. Esta expresión puede contener operadores aritméticos, lógicos,trigonométrica, funciones estadísticas, funciones de distribución y funciones de cadena. SPSS dispone de 70 funciones preincorporadas.

Si: Para calcular valores de forma selectiva para subconjuntos de datos basándose en condiciones lógicas.Con este botón selecionamos los casos de la variable de partida, sobre los que se hace la transformación.

 

 

CONTAR APARICIONES

Con SPSS podemos crear una variable que, para cada caso, cuenta las apariciones del mismo valor, o valores, en una lista de variables. El valor de la variable de destino (en el cuadro de diálogo principal) se incrementa en 1 cada vez que una de las variables seleccionadas coincide con una especificación de la lista Contar los valores. Si un caso coincide con varias de las especificaciones en cualquiera de las variables, la variable de destino se incrementa varias veces para esa variable.

Las especificaciones de valores pueden incluir valores individuales, valores perdidos o valores perdidos por el sistema y rangos de valores. Los rangos incluyen sus puntos finales y los valores definidos como perdidos por el usuario que estén dentro del rango.

 

 

 

 

 

 

 

 

 

 

RECODIFICAR VARIABLES

Algunos análisis necesitan la recodificación de algunas variables. Por ejemplo convertir una variable continua en categórica. Para ello DATOS/RECODIFICAR en la misma variable o en una nueva según nos interese conservar o no los valores antiguos.

En las mismas variables:
Variables: se especifican los nombres de las variables a recodificar. Si se seleccionan varias, todas han de ser del mismo tipo.
Si: Permite seleccionar los casos de la/s variable/s a recodificar. Estos pueden ser todos o los que cumplan una condición.
Valores antiguos y nuevos: Abre un subcuadro que recoge los valores a recodificar y los nuevos que los sustituirán.

En distintas variables.
Variable de Entrada ->Variable de Resultado: Los nombres de la variable a recodif icar y de la recodificada. La primera se selecciona de la lista y la segunda se introduce directamente.
Etiqueta: Permite asignar una etiqueta a la variable creada.
Si: Igual utilidad que en el caso anterior.
Valores antiguos y nuevos: Abre un subcuadro que recoge los valores a recodificar y los nuevos que los sustituirán.

CATEGORIZAR VARIABLES

En ocasiones necesitamos convertir una variable continua en distreta. El procedimiento habitual es Categorizar variables. Esta opción crea nuevas variables que contienen los datos categóricos según grupos percentiles de manera que cada grupo contiene aproximadamente el mismo número de casos.

Basta con seleccionar la variable para la cual queremos crear las categorías y elegir el número de categorías a formar.

 

 

 

 

 

REEMPLAZAR VALORES PERDIDOS

Los valores atípicos y las observaciones perdidas pueden causar problemas en los análisis y algunas medidas de series temporales no se pueden calcular si hay valores perdidos en la serie. Un procedimiento muy utilizado en estadística es darles a los valores perdidos la estimación de la media de los valores válidos, por la media o mediana circundantes o mediante métodos de interpolación lineal o mediante la tendencia lineal en el valor perdido. SPSS crea nuevas variables de series temporales a partir de otras existentes, reemplazando los valores perdidos por estimaciones calculadas mediante uno de los distintos métodos posibles.

 

 

 

Imprimir esta página
Imprimir