martes, 24 de mayo de 2011

Manejo de datos con hoja de Cálculo

El manejo de datos es una de las principales utilidades de una hoja de cálculo en el estudio estadístico. En general los programas de estadística no suelen tener un sistema de entrada de datos tan versatil como el que proporciona una hoja de cálculo como Open Calc. En el caso de R y R-Commander esta situación es actualmente bastante aguda, la entrada de datos es muy poco eficaz.


Introducción de datos

De forma predeterminada los datos pueden ser introducidos en columnas de modo que al terminar de escribir cada dato se pulsa alguna de las teclas Enter, Return o Intro disponibles en el teclado. El ratón y las flechas del teclado permiten desplazarse rápidamente a través de todo el teclado para intoducir los datos en el orden en que se desee. Finalmente una de las más importantes ventajas es la posibilidad de introducir resultados con la mayor rapidez. Hagamos un ejercicio de este último uso.
Descarguemos el conjunto de datos Iris que se encuentra en R y en los conjuntos de datos para demostraciones de otros muchos paquetes estadísticos. Estos datos fueron recogidos por Edgar Anderson en 1935 y analizados por Fisher en 1936 corresponden a las medidas en centımetros de la longitud y ancho del sepalo y de la longitud y ancho del petalo para 50 flores de cada una de tres especies de lirios.
La pantalla tendrá un aspecto parecido al siguiente:
Situémonos en la celda E2:
  1. Pulsando simultáneamente las teclas May-Ctrl-'Flecha Abajo', quedará resaltada todas las celdas hasta la celda E52.
  2. Sin soltar la tecla May, pero soltando la tecla Ctrl, subiremos una celda arriba para no incluir en la selección el primer dato que pertenece a la especie  versicolor.
  3. Mediante los comandos Editar->Rellenar->Abajo completaremos el nombre de la especie para todos los primero cincuenta datos.
Cualquier error cometido sobreescribiendo datos de forma indeseada (como por ejemplo borrar el nombre versicolor al rellenar hacia abajo) puede facilmente deshacerse mediante la orden deshacer (Ctrl-Z).
Ya vimos en la clase de introducción que esto mismo es posible hacerlo mediante el ratón. Hágase como ejercicio la "expansión" de valor  versicolor a los datos desde el 51 al 100.

Por último, en el caso de los últimos cincuenta datos el procedimiento incialmente utilizado no es factible, como es fácil comprobar:

  1. Situémonos en la celda E102.
  2. Pulsando las teclas May-'Flecha Izquierda' pasar a la celda D102.
  3. Pulsando simultáneamente las teclas May-Ctrl-'Flecha Abajo', quedará resaltada todas las celdas hasta la celda D151.
  4. Sin soltar la tecla May, pero soltando la tecla Ctrl, nos desplazaremos una celda a la derecha para deseleccionar la columna D.
  5. Mediante los comandos Editar->Rellenar->Abajo completaremos el nombre de la especie para todos los últimos cincuenta datos.


var mas

No hay comentarios:

Publicar un comentario