¿Qué
es un Paquetes Estadístico?
Este es un conjunto de programas
informáticos específicamente diseñados para el análisis estadístico de datos
con el propósito de dar solución a problemas bien sea de estadística
descriptiva ó inferencial, o de ambos.
Este
conjunto de programas y subprogramas se encuentran conectados de manera que
funcionan de conjunta, es decir que para pasar de uno a otro no se necesita
salir del programa y volver a él, Gondar, 2000.
Con lo cual se puede decir que un
paquete estadístico permite aplicar a un mismo fichero de datos un conjunto
ilimitado de procedimientos estadísticos de manera sincronizada, sin salir del
programa. De esta forma, la utilidad del conjunto integrado es mayor que la
suma de las partes. En cierto modo, un paquete estadístico es similar a un
paquete ofimático (por ejemplo, Office 97 de Microsoft).
Marín, Cabero y Paz (2008), indican que un
programa estadístico es un producto de software que sirve para realizar tareas
estadísticas; y lo que se espera de él que lea los datos, reciba ordenes
y ejecute el análisis de los mismos. Los
paquetes estadísticos actuales superan esas mínimas de manera que
permiten:
a)
Crear nuevas variables
b)
Seleccionar variables y sujetos
c)
Reconocer y generar datos en ASCII
d)
Añadir las variables creadas al archivo en uso
e)
Varios formatos de integración programa-usuario
f)
Controlar aspectos del entorno de trabajo
Dentro
de los paquetes estadísticos más utilizados están: SAS, BMDP, SPSS, SYSTAT, STATISTICA,
STATA y, últimamente están, MINITAB, S-PLUS, EVIEWS, STAT-GRAPHICS y MATLAB.
También se pueden encontrar: R, Past, Open Stat, Genstat Discovery
Editión 3.
A
continuación se describirán algunos de los de mayor uso.
a. SPSS (Statistical Package for The Social
Sciences o Paquete Estadistico para la Ciencias Sociales):
Este
programa, desarrollado en la Universidad de Chicago, es uno de los más difundidos,
Hernández, Fernández y Batista, p: 410.
Es un paquete Estadístico, de uso general, que
integra procedimientos estadísticos y gráficos iteractivos de alta resolución,
de tal manera que sirve de apoyo al análisis de datos. Es útil entre otros
aspectos para realizar análisis
exploratorio desde el punto de vista gráfico, de igual manera se utiliza para
realizar análisis estadístico simple y/o avanzado. El programa sirve para
profundizar en temas como: Métodos Cuantitativos, Métodos de Investigación,
Segmentación de Mercados, Finanzas, Inferencia Estadística, Análisis
Multivariado, Pronósticos con series de Tiempo, Métodos Multivariados y otros
más.
b. SAS (Statistical Analysis System)
Comprende
amplias posibilidades de procedimientos estadísticos (métodos
multivariados,
regresión múltiple con posibilidades diagnósticas, análisis de
supervivencia
con riesgos proporcionales y regresión logística) y permite cálculos
exactos
para tablas r x c y contiene potentes posibilidades gráficas.
· Todos los procedimientos pueden emplearse de
una sola ejecución
· Los resultados pueden guardarse como archivos
y usarse como entradas para
futuras ejecuciones.
futuras ejecuciones.
· Es particularmente útil en la gestión de
datos y en la redacción de informes
· Algunos procedimientos tienen varias opciones
por lo cual debe examinarse
cuidadosamente el manual antes de seleccionar la opción deseada.
cuidadosamente el manual antes de seleccionar la opción deseada.
· SAS ofrece la mayor flexibilidad para
personalizar el manejo y análisis de datos,
sin embargo su principal inconveniente es que no resulta fácil aprender a usarlo.
sin embargo su principal inconveniente es que no resulta fácil aprender a usarlo.
c. BMDP
Es
el más antiguo de los paquetes. El primer manual para BMD Biomedical Computers
Programs se publicó en 1961.En 1975 pasó a denominarse BMDP. Cubre un amplio
abanico de métodos estadísticos pero su capacidad para manejar datos es
limitada,
dentro de sus desventajas se puede mencionar: Sus programas se
ejecutan por separado,
solo puede accederse a uno de ellos en cada ejecución.
· d. STATISTICA:
Statistica (aunque la marca está registrada como STATISTICA, en mayúsculas) es
un paquete estadístico usado en investigación, minería de datos y en el ámbito empresarial. Lo creó
StatSoft, empresa que lo desarrolla y mantiene.
StatSoft nació
en 1984 de un acuerdo entre un grupo de
profesores universitarios y científicos.
Sus primeros productos fueron los
programas PsychoStat-2 y PsychoStat-3.
Después desarrolló Statistical
Supplement for Lotus 1-2-3, un complemento para las hojas de cálculo de Lotus.
Finalmente, en 1991, lanzó al mercado la primera versión
de STATISTICA para MS-DOS.
Actualmente compite con otros paquetes
estadísticos tanto propietarios, como SPSS, SAS, Matlab o Stata, como libres, como R.
El
programa consta de varios módulos. El principal de ellos es el Base,
que implementa las técnicas estadísticas más comunes. Éste puede completarse
con otros módulos específicos tales como:
- Advanced:
técnicas multivariantes y
modelos avanzados de regresión lineal
y no lineal
- QC: técnicas de control de calidad, análisis de procesos (distribuciones no normales,Gage R&R, Weibull) y diseño experimental
- Data Miner: minería de datos, análisis predictivos y redes neurales
El paquete puede ser extendido a través de
una interfaz con
el lenguaje R. Además,
se pueden modificar y añadir nuevas librerías usando
el lenguaje NET.
e. MINITAB:
Es un programa de computadora diseñado para ejecutar funciones estadísticas básicas y
avanzadas. Combina lo amigable del uso de Microsoft Excel con la capacidad de ejecución de análisis estadísticos. En
1972, instructores del programa de análisis estadísticos de la Universidad
Estatal de Pensilvania (Pennsylvania State University) desarrollaron MINITAB
como una versión ligera de OMNITAB, un programa de análisis estadístico del
Instituto Nacional de Estándares y Tecnología (NIST) de los Estados Unidos.
Este programa es un paquete estadístico
que abarca todos los aspectos necesarios para el aprendizaje y la aplicación de
la estadística en general. El programa incorpora opciones vinculadas a las
principales técnicas de análisis estadísticos (análisis descriptivo, contrastes
de hipótesis, regresión lineal y no lineal, series temporales, análisis de tiempos de fallo,
control de calidad, análisis factorial, ANOVA, análisis cluster, etc), además
de proporcionar un potente grafico y de ofrecer total compatibilidad con los
editores de texto, hojas de cálculo y bases de datos más usuales.
f) MATLAB:
Nace como una solución a la necesidad de mejores y más
poderosas herramientas de cálculo para resolver problemas de cálculo complejos
en los que es necesario aprovechas las amplias capacidades de proceso de datos de grandes computadores.
Éste es un
entorno de computación y desarrollo de aplicaciones totalmente integrado orientado para llevar a
cabo proyectos en donde se encuentren implicados elevados cálculos matemáticos y la visualización gráfica de los mismos. MATLAB integra análisis numérico, cálculo matricial, proceso de señal y visualización gráfica en un entorno completo donde
los problemas y sus soluciones son expresados del mismo modo en que se escribirían
tradicionalmente, sin necesidad de hacer uso de la programación tradicional.
Está
dirigido a ingenieros y científicos, éste requiere que el operador adquiera
conocimientos en su lenguaje de programación, se ejecuta principalmente a
través de una interfaz de línea de comandos y es más pesado al momento de
instalarse, además requiere mayor capacidad en el disco duro, un equipo más
rápido (mayor memoria RAM).
Para finalizar se puede decir que MATLAB es un lenguaje de alto nivel y
un entorno interactivo para el cálculo numérico, visualización y programación. Usando MATLAB, puede analizar los
datos, desarrollar algoritmos y crear modelos y aplicaciones. El lenguaje, las herramientas y
funciones matemáticas integradas que permiten explorar múltiples enfoques y
llegar a una solución más rápida que con hojas de cálculo o lenguajes de
programación tradicionales, como C / C + + o Java.
g. R:
Es un
lenguaje y entorno de programación para análisis estadístico y gráfico. Se trata de un proyecto de software libre, resultado
de la implementación GNU del premiado lenguaje S. R y S-Plus -versión comercial de S- son, probablemente, los dos
lenguajes más utilizados en investigación por la comunidad estadística, siendo
además muy populares en el campo de la investigación biomédica, la bioinformática y las matemáticas financieras. A esto contribuye la posibilidad de cargar diferentes
bibliotecas o paquetes con finalidades específicas de cálculo o gráfico.
Este programa se distribuye bajo la
licencia GNU GPL y está disponible para los sistemas operativos Windows, Macintosh, Unix y GNU/Linux.
Fue desarrollado inicialmente
por Robert Gentleman y Ross Ihaka del Departamento de Estadística
de la Universidad de
Auckland en
1993. Su
desarrollo actual es responsabilidad del R Development Core Team.
A continuación se enumeran algunos hitos en el
desarrollo de R
· Versión 2.11.0 (22 de abril de 2010):
Soporte para sistemas Windows de 64 bits.
· Versión 2.13.0 (14 de abril de 2011):
Añadida una nueva función al compilador que permite acelerar las funciones
convirtiéndolas a byte-code.
· Versión 2.14.0 (31 de octubre de
2011): Añadidos espacios de nombres obligatorios para los paquetes. Añadido un
nuevo paquete de paralelización.
· Versión 2.15.0 (30 de marzo de 2012):
Nuevas funciones de balanceo de cargas. Mejorada la velocidad de serialización
para grandes vectores.
· Versión 3.0.0 (3 de abril de 2013):
Mejoras en GUI, funciones gráficas, gestión de memoria, rendimiento e
internacionalización.
El mayor inconveniente que podría
presentarse con este software más utilizado en nuestro medio es el hecho de
funcionar mediante comandos, lo que para algunos usuarios puede resultar
engorroso. Para solventar esta dificultad existe un paquete llamado R Commander que permite utilizar R sin tener que
escribir los comandos, es decir, con la sola utilización del ratón.
Past es el software libre
para el análisis de datos científicos, con funciones de manipulación de datos,
el trazado, estadísticas univariantes y multivariantes, análisis ecológico de
series de tiempo y análisis espacial, morfometría y la estratigrafía.
Este programa pasó por un rediseño
completo en 2013. La nueva versión 3 aún no contiene toda la gama de funciones
del antiguo pasado, pero estamos trabajando en ello!
El
programa, llamado PAST (PAleontological STatistics: Estadísticas
Paleontológicas), funciona en ordenadores con sistema operativo Windows y es de
libre disposición (gratuito). PAST incluye entrada de datos del tipo hoja de
cálculo, con estadísticas univariante y multivariante, ajuste de curvas,
análisis de series temporales, representación gráfica de datos y análisis
filogenético sencillo.
Muchas de las funciones son específicas
para paleontología y ecología, y no se encuentran en paquetes de análisis
estadístico estándar, de carácter más amplio. PAST también incluye catorce
ejemplos (archivos de datos y ejercicios) que ilustran el uso del programa en problemas
paleontológicos, lo que lo convierte en un paquete educativo completo para
asignaturas sobre métodos cuantitativos.
i) Open Stat:
Es un paquete estadístico de software
libre fue desarrollado por William Miller, diseñado especialmente para Windows
y Linux (para este sistema operativo se trabaja la versión LinOStats) que
ofrece una interfaz similar a SPSS. Inicialmente este software fue desarrollado
como apoyo a los estudiantes y profesores en el área de estadística
introductoria y avanzada de las ciencias sociales, Pico y Manzón, 2007 p: 11.
Open Stat se puede descargar de manera gratuita en Internet y ser usado
diversos campos sin necesidad de tener una licencia para su uso y/o
reproducción, es decir que se puede descargar e instalar sin costo. No
obstante, no se puede modificar puesto que está restringido el acceso a su
código fuente, Pico y Manzón, 2007 p: 11.
OpenStat (OS4), conocido antes como OS3 y OS2, es uno de los más funcionales
que encontramos en el software libre, ya que tiene acceso a muchas aplicaciones
de manera directa sin necesidad de programación, además presenta una interfaz
muy amigable y menús que permiten acceder a diferentes análisis desde cualquier
lugar del programa, Pico y Manzón, 2007 p:11.
Este paquete estadístico permite la manipulación de datos, cálculos
estadísticos, financieros y económicos; además que cuenta con una interfaz
similar a la de SPSS, genera gráficos sencillos de las distribuciones e
histogramas y es capaz de trabajar con datos de diversos formatos (bin, tex,
txt, s4u, entre otros), Pico y Manzón, 2007 p:8.
Algunas
de sus características se mencionan a continuación:
·
Una interfaz amigable
·
Varias opciones de gráficas como pie,
barras, líneas e incluso plots.
· Menú de ayuda gráfico y teórico como
apoyo para realizar simulaciones y análisis para procedimientos
descriptivos, de variabilidad, correlación, regresiones (simple, múltiple),
probabilidad y financieros entre otros.
· Cuenta con calculadora, procesador de textos y editor de textos y
opciones que nos permiten cambiar fácilmente las configuraciones iniciales.
·
Código ASCII (Código Normalizado Americano para
Intercambio de la Información), el cual permite ver el número del último
carácter integrado en la celda.
j) Genstat
Discovery Edition 3:
Es un
paquete de análisis comercial desarrollado por VSN International, una compañía
de desarrollo de software para biociencias, pero que para ciertos países puede
ser descargado gratuitamente previo registro. Aunque su interfase es amistosa,
sus salidas no lo son tanto y no son muy completas. Tiene la ventaja eso sí,
que se puede importar el código de R y usarlo en sus propias rutinas.
Ventajas y Desventajas
Software
|
Ventajas
|
Desventajas
|
SAS
|
1.- Comprende procedimientos estadísticos.
|
1.- Su principal inconveniente es que no resulta fácil de aprender a usarlo.
|
2.- Todos los procedimientos pueden emplearse de una sola ejecución.
| ||
3.- Los resultados pueden guardarse como archivos y usarse como entradas para futuras.
| ||
4.- Es útil en la gestión de datos y en la redacción de informes.
| ||
SPSS
|
1.- Es fácil de aprender a usar
|
1.- Los reportes de resultados contiene un nivel excesivo de información.
|
2.- Manejo de datos con gran facilidad para los usuarios.
|
2.- Posee gran cantidad de información en forma automática (by default) que distrae al usuario.
| |
3.- Acoplamiento a un Plan de proyecto.
|
3.- Si el usuario no tiene experiencia previa utilizando SPSS o si sus conocimientos de estadística no están actualizados, es difícil comprender que opciones seleccionar.
| |
4.- Servicio eficaz y de calidad al evaluar los resultados.
|
4.- Lleva a veces a una sofisticación innecesaria al permitir el empleo de técnicas complejas para responder a cuestiones simples.
| |
5.- Dispone de un amplio conjunto de métodos y procedimientos estadísticos.
| ||
SPAD
|
1.- Vinculación de los objetivos a las necesidades de la empresa.
|
1.- No brinda los resultados esperados en el tiempo esperado.
|
2. Perfecto acoplamiento a un plan de investigación bien formulado.
| ||
3.- Servicio de calidad para los usuarios.
|
2.- No contar con la información adecuada y de calidad.
| |
4.- Analizar con detenimiento las variables implicadas en la investigación.
| ||
5.- Facilidad del manejo y de la programación.
| ||
6.- Obtiene información a partir de la base de datos.
|
Fuente: Machado, Cortez, Guzmán, Rodríguez y Utrera
Diferencias entre los dos Grandes SAS y SPSS:
El precio de SPSS es mucho menor que el del programa SAS, en torno a la mitad del precio.
2) Rentabilidad
Recomendable para PYMES (hasta 500 trabajadores), SPSS es la mejor solución. Para grandes empresas (más de 500 empleados) o aquellas que puedan permitirse un fuerte desembolso sin necesidad de retorno a corto plazo, SAS es más rentable que SPSS, ya que permite ejecutar mayor número de procedimientos estadísticos y operativos.
Recomendable para PYMES (hasta 500 trabajadores), SPSS es la mejor solución. Para grandes empresas (más de 500 empleados) o aquellas que puedan permitirse un fuerte desembolso sin necesidad de retorno a corto plazo, SAS es más rentable que SPSS, ya que permite ejecutar mayor número de procedimientos estadísticos y operativos.
3) Facilidad
El manejo de SPSS es mucho más sencillo que el de SAS. El interfaz estilo hoja de cálculo de SPSS y su posibilidad de abrir ventanas muy comprensivas le convierten en un feo adversario para SAS. No obstante, SAS, una vez conocido el manejo de su lenguaje de programación, es más divertido que SPSS.
4) Formación
La dependencia absoluta del lenguaje de programación por parte de SAS le hace muy vulnerable ante necesidades repentinas, ya que obliga a la Empresa a costear caros programas de formación, con el fin de permitir que su personal le saque el máximo provecho. SPSS, sin embargo, al ser mucho más fácil, no encadena al usuario a largos procesos formativos, sino que, en un tiempo mucho más corto que SAS, puede realizar complejos procedimientos de análisis sin esfuerzo.
La dependencia absoluta del lenguaje de programación por parte de SAS le hace muy vulnerable ante necesidades repentinas, ya que obliga a la Empresa a costear caros programas de formación, con el fin de permitir que su personal le saque el máximo provecho. SPSS, sin embargo, al ser mucho más fácil, no encadena al usuario a largos procesos formativos, sino que, en un tiempo mucho más corto que SAS, puede realizar complejos procedimientos de análisis sin esfuerzo.
5) Robustez
La dependencia absoluta de Windows por parte de SPSS le hace muy vulnerable ante "caídas" del sistema, normalmente provocadas por acciones ilícitas del usuario. El programa SAS, por su parte, al tener su propio sistema operativo, toma la iniciativa del sistema, una vez arrancado, no permitiendo que una acción no autorizada por parte del usuario paralice el trabajo del operario.
Hola Sislenis:
ResponderEliminarMuy completo y trabajado tu blog, denota dedicación y esfuerzo En cuanto al paquete seleccionado el SPSS, puede que resulte costoso pero vale la pena la inversión, pues tal como lo reseñas lo importante es: “facilitar los cálculos que de realizarse manualmente se requeriría la inversión de mucho tiempo, el uso de los programa brindan una mayor exactitud en los resultados y pueden manejar grandes volúmenes de datos en poco tiempo”.
EXITOS
Hola compañera, es verdad el SPSS es un programa de gran utilidad y de muchas ventajas.
EliminarHola compañera, es verdad el SPSS es un programa de gran utilidad y de muchas ventajas.
ResponderEliminarFelicitaciones por tu aporte, pero, que pasa con Stata???
ResponderEliminarhola alguien me puede ayudar, es una tarea. cuanto me costaria los sofware ya sea personla o institucional, almenos de los mas populares. Garcias
ResponderEliminarmuy útil el post !! saludos desde Paraguay
ResponderEliminarSiempre me ha llamado la atención porqué en las hojas de calculo se pueden hacer operaciones aritmeticas en las celdas mientras que en las hojas de los programas estadisticos no se puede.
ResponderEliminarAdemás en Excel, pe., se pueden tener varias hojas mientras que en los programas estadisticos no se puede
Realmente me encanto muy completa la información
ResponderEliminarPara sacarle todo el jugo a tu información recomiendo también el software PREVIA.
ResponderEliminarPREVIA permite explorar la información de encuestas y bases de datos, su interfaz amigable facilita analizar estudios de mercado, sondeos de opinión pública y estudios de clima organizacional, sin complicaciones.
Crea reportes profesionales, presenta estadísticas de manera clara y completa sin ser experto!, tiene multiples usos y se ajusta a tus necesidades específicas.
http://www.previa.com.mx