|
CAPACIDADES PARA LA ORGANIZACIÓN Y TRANSFORMACIÓN DE DATOS. MODIFICACIÓN DE FICHEROS DE DATOS
ADICIÓN DE UNA NUEVA VARIABLE O CASO El procedimiento es seleccionar la columna(variable) o fila (caso) que va a quedar a la derecha de la nueva variable o caso y elegir las opciones de la barra principal Datos / Insertar variable o caso. Para definir las características de la variable, en vista de variable. En SPSS los ficheros de datos tienen en las filas los casos y en las columnas las variables, sin embargo esta estructura no es universal y otros programas tienen el formato transpuesto, es decir almacenan las variable por filas y los casos por columnas. Por lo tanto al importar los datos puede ocurrir que no encontremos los datos como deseamos y por lo tanto tenemos que proceder a crea un archivo de datos nuevo en el que se interecambian las filas y las columnas del archivo de datos original.
Datos / Transponer... y seleccionando la columna o columnas que desee transponer en filas. Si lo desea, puede seleccionar una Variable de nombres para utilizar sus valores como nombres de variable en el archivo de datos transpuesto.
En muchas ocasiones en los análisis estadísticos es necesario poder combinar y fusionar ficheros de datos, bien porque dispongamos de nuevas variables de estudio o bien porque tengamos nuevos indivudios. SPSS permite estos dos procedimientos, añadir casos y añadir variables.
Añadir casos: Para fusionar el archivo de datos de trabajo con otro archivo de datos que contiene las mismas variables pero diferentes casos. Variables desemparejadas. Nos permite excluir algunas variables del nuevo archivo de datos fusionado. Añadir variable: Para fusionar el archivo de datos de trabajo con un archivo de datos externo que contiene los mismos casos pero variables diferentes. Variables excluidas: nos permite no incluir algunas variables.
En la mayoría de las ocasiones el orden de los datos no es relevante, sin embargo puede ser necesario en algun momento del análisis estadístico que los datos estén dispuestos según alguna variable que llamaremos variable de identificación.
Datos / Ordenar casos... ORDENAR POR: Es necesario selecciononar al menos una variable de ordenación. El archivo de datos se ordenará en función de los valores de las variables de ordenación. Podemos selecionar varias variables de ordenación para que los casos se ordenen por los valores de cada variable dentro de las categorías de la variable anterior de la lista Ordenar por. Para las variables de cadena, las letras mayúsculas preceden a las minúsculas correspondientes en orden. Por ejemplo, el valor de cadena "Sí" precede a "sí". Esta opción es especialmente interesantes cuando queremos realizar un análisis estadístico para distintos grupos de casos. Consiste en dividir el archivo de datos en distintos grupos para el análisis basándose en los valores de una o más variables de agrupación. Si selecciona varias variables de agrupación, los casos se agruparán por variable dentro de las categorías de la variable anterior de la lista Grupos basados en.
Seleccionamos cada una de las opciones siguientes según queramos obtener los resultados en el visor. Comparar los grupos. Los grupos de segmentación del archivo se presentan juntos para poder compararlos. Se crea una sola tabla y un gráfico diferente para cada grupo y se muestran juntos en el visor. Organizar los resultados por grupos. Los resultados de cada procedimiento se muestran por separado para cada grupo de segmentación del archivo. Si el archivo de datos todavía no está ordenado, es necesario seleccionar Ordenar archivo según variables de agrupación. SPSS permite hacer los estudios estadístico para una submuestra de los datos. Con la opción Datos / Selecionar casos.. podemos seleccionar un subgrupo de casos basándose en criterios que incluyen variables y expresiones complejas. También se puede seleccionar una muestra aleatoria de casos.
Selecionar: Los criterios usados para definir un subgrupo pueden incluir:
Casos no seleccionados son . Puede filtrar o eliminar los casos que no reúnan los criterios de selección. Los casos filtrados permanecen en el archivo de datos pero se excluyen del análisis. Para desactivar el filtrado e incluir todos los casos en el análisis, seleccione Todos los casos.
Con la opción ponderar casos proporciona a los casos diferentes ponderaciones (mediante una réplica simulada) para el análisis estadístico. Los valores de la variable de ponderación deben indicar el número de observaciones representadas por casos únicos en el archivo de datos. Los casos con valores perdidos, negativos o cero para la variable de ponderación se excluyen del análisis. Los valores fraccionarios son válidos.
Una vez que tenemos en el editor de datos nuestros valores, bien porque hayan sido introducidos directamente o bien hayan sido importados, es muy frecuente que necesitemos realizar transformaciones de estos. SPSS dispone de una gran variedad de funciones para modificar un fichero.
CONSTRUCCIÓN DE UNA VARIABLE A PARTIR DE OTRA Son muchas las ocasiones en las que una tranformación de los datos nos ofrecen mejores posibilidades, por ejemplo para conseguir normalidad en datos que no lo son o convertir en estacionaria una serie no estacionaria. SPSS puede generar una variable umérica o de cadena (alfanuméricas) a partir de otra, mediante el resultado de una operación aritmética, lógica, u otra función de los valores de la variable inicial. Para ello elegimos:
Tipo y Etiqueta: Se puede especificar el tipo y la etiqueta de variable destino o nueva variable. Expresión Numérica: Recoge la transformación a realizar. Esta expresión puede contener operadores aritméticos, lógicos,trigonométrica, funciones estadísticas, funciones de distribución y funciones de cadena. SPSS dispone de 70 funciones preincorporadas. Si: Para calcular valores de forma selectiva para subconjuntos de datos basándose en condiciones lógicas.Con este botón selecionamos los casos de la variable de partida, sobre los que se hace la transformación.
Con SPSS podemos crear una variable que, para cada caso, cuenta las apariciones del mismo valor, o valores, en una lista de variables. El valor de la variable de destino (en el cuadro de diálogo principal) se incrementa en 1 cada vez que una de las variables seleccionadas coincide con una especificación de la lista Contar los valores. Si un caso coincide con varias de las especificaciones en cualquiera de las variables, la variable de destino se incrementa varias veces para esa variable.
Algunos análisis necesitan la recodificación de algunas variables. Por ejemplo convertir una variable continua en categórica. Para ello DATOS/RECODIFICAR en la misma variable o en una nueva según nos interese conservar o no los valores antiguos.
En las mismas variables:
En distintas variables.
En ocasiones necesitamos convertir una variable continua en distreta. El procedimiento habitual es Categorizar variables. Esta opción crea nuevas variables que contienen los datos categóricos según grupos percentiles de manera que cada grupo contiene aproximadamente el mismo número de casos.
Los valores atípicos y las observaciones perdidas pueden causar problemas en los análisis y algunas medidas de series temporales no se pueden calcular si hay valores perdidos en la serie. Un procedimiento muy utilizado en estadística es darles a los valores perdidos la estimación de la media de los valores válidos, por la media o mediana circundantes o mediante métodos de interpolación lineal o mediante la tendencia lineal en el valor perdido. SPSS crea nuevas variables de series temporales a partir de otras existentes, reemplazando los valores perdidos por estimaciones calculadas mediante uno de los distintos métodos posibles.
|