SV05 | R

Page 1

5

Software Estadístico Revisión de software elaborada por:

Oscar Gabriel Caballero Martínez & José Antonio Coria Fernández camo681201@apolo.acatlan.unam.mx § jcoriafdz@hotmail.com

DE QUÉ SE TRATA En el Número 2 se revisó Statgraphics Online para hacer cálculos estadísticos. Ahora presentaremos un software de carácter más general con respecto a la estadística. Esta aplicación se llama “R”, y es una variante de otro llamado “S”, que es de tipo comercial.

UN PAR DE EJEMPLOS Imagínate que tienes las calificaciones de bachillerato de 20 alumnos. Puedes almacenarlas en un vector llamado CalifBach como se ve en la Fig. 1. La función c() se usa para crear un vector con datos numéricos.

R es un software libre, con el cual puedes hacer cálculos variados y versátiles, con una interfaz en español. Por ejemplo, puedes obtener medidas de tendencia central (media, mediana, moda y esas cosas), y de dispersión (rango, desviación estándar, varianza). También puedes generar números aleatorios con varias distribuciones de probabilidad. Además, el programa te permite importar, exportar y manipular grandes cantidades de datos con mucha sencillez. R se considera un software “orientado a objetos”, ya que almacena los datos en vectores (una especie de cajitas con apartados para cada valor). Cada elemento del vector puede ser de tipo: numérico, cadena de texto, o booleano (cero o uno).

Fig. 1: Entrada de datos en R. Fuente: Elaboración propia Si tu profesor te pide que obtengas la media o promedio de esos datos, bastará con escribir:

CÓMO LO PUEDES USAR Del sitio oficial de R puedes bajar el archivo para instalarlo en tu máquina, desde diferentes sitios ubicados en todo el mundo Tiene versiones para Linux, MacOs y Windows. Al instarlo se genera un acceso directo para que puedas utilizarlo con sólo dar doble clic sobre el icono correspondiente.

El resultado te indica que la media de las calificaciones es ocho punto dos. El uno entre corchetes significa que este promedio es un vector con un solo elemento, por lo cual se llama escalar. Si necesitas saber la desviación estándar, escribes:

El software trabaja con una línea de comandos en la cual se escriben instrucciones breves con texto, a diferencia de otros programas que funcionan con iconos. Es parecido a MS-DOS (si es que recuerdas eso), o Linux, en su modo de Consola. En esa línea podemos teclear las diferentes instrucciones que utilizaremos y comenzarán a aparecer los resultados junto con un valor entre corchetes cuadrados, lo cual indica que la cantidad ha sido almacenada en un vector.

Esto significa que la mayoría de las calificaciones de este grupo están entre la media (8.2) y dos desviaciones estándar, es decir entre 8.2-2.12=6.08 y 8.2+2.12=10.22; aproximadamente entre seis y diez. Esto se aprecia también en la Fig. 2, que se generó con la instrucción hist(CalifBach).


DÓNDE PUEDES ENCONTRAR MANUALES, TUTORIALES Y MÁS INFORMACIÓN R cuenta con excelentes manuales en su Ayuda. Además, encontrarás excelente información sobre cómo manejar la distribución normal en http://stat.ethz.ch/Rmanual/R-patched/library/stats/html/Normal.html; o cómo generar números aleatorios con distribución normal en: http://www.stat.umn.edu/macanova/htmlhelp/node294. htm. Existe un buen manual para aprender a usarlo en: http://cran.r-project.org/doc/contrib/rdebuts_es.pdf.

Fig. 2: Histograma de las calificaciones. Fuente: Elaboración propia.

DATOS GENERALES DEL SOFTWARE •

Autores: R es un proyecto colaborativo con muchos contribuyentes. Si deseas saber quiénes participaron, escribe en la línea de comandos contributors().

País de origen: Estados Unidos.

Sitio donde se descarga: http://cran.ms.unimelb.edu.au/ (ymuchos otros).

Versión más reciente: 2.9 (2009).

Observas su media:

Categoría: Software libre para realizar cálculos estadísticos de grandes volúmenes de datos. Es interoperable con algunos manejadores de bases de datos.

Y decides que sería interesante observar una gráfica del comportamiento de la licenciatura con respecto al bachillerato. Entonces con la instrucción:

Requerimientos: Debes contar con el sistema operativo Windows en alguna de las siguientes versiones: 98, ME, NT4, 2000, XP, Vista; o con el sistema Linux.

Áreas que puede apoyar: Especialmente en materias relacionadas con Estadística, el manejo de funciones es muy amigable. También existen sitios donde hay paquetes que puedes utilizar desde el ambiente de trabajo.

Ahora supongamos que tienes también las calificaciones de los mismos alumnos, pero en el primer semestre de la licenciatura. Los almacenas en R con la siguiente instrucción:

7.0

Obtienes la gráfica que muestra la Fig. 3., donde parece ser que existe relación entre ambas variables.

6.5

PALABRAS CLAVE DE ESTE NÚMERO

5.5 5.0

CalifLic

6.0

Estadística; objetos; media; histograma; desviación estándar; gráfico x-y.

4.0

4.5

¿Y ESTE BOLETÍN QUÉ ONDA? 6

7

8

9

10

CalifBach

Fig. 3. Gráfica de CalifLic vs CalifBach. Fuente: Elaboración propia.

Nuestro objetivo es difundir software e instrumentos digitales que puedan apoyar el aprendizaje. El boletín está abierto a colaboraciones de quien guste participar. Se prefieren las revisiones de software libre o de fácil acceso, así como de servi‐ cios digitales públicos. Encontrarás la Guía para los Autores en http://www.inteligencianet.org. El Software Volandero se publicará de manera aleato‐ ria, con un tiraje aproximado de doscientos ejempla‐ res.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.