jueves, 19 de julio de 2007

Regresion lineal

Estadística inferencial. Regresión y correlación
Introducción
Marco teórico
Distribución divariante
Conclusiones
Bibliografía de regresión y correlación
INTRODUCCIÓN:
Parte de la Estadística corresponde a la Estadística Inferencial y dentro de ella los capítulos de correlación y regresión son muy usados en la Investigación Científica, una herramienta muy útil cuando se trata de relacionar 2 o más variables, relacionadas entre si, como por ejem. nivel de hemoglobina y embarazo en el ámbito de las Ciencias de la Salud, la Correlación implica el grado de dependencia de una variable respecto a otra y la Regresión es otra técnica que ayuda en la investigación de la salud Psicología costos de una Empresa etc.
MARCO TEORICO:
La regresión como una técnica estadística, una de ellas la regresión lineal simple y la regresión multifactorial, analiza la relación de dos o mas variables continuas, cuando analiza las dos variables a esta se el conoce como variable bivariantes que pueden corresponder a variables cualitativas, la regresión nos permite el cambio en una de las variables llamadas respuesta y que corresponde a otra conocida como variable explicativa, la regresión es una técnica utilizada para inferir datos a partir de otros y hallar una respuesta de lo que puede suceder.
Siendo así la regresión una técnica estadística, por lo tanto para interpretar situaciones reales, pero a veces se manipula de mala manera por lo que es necesario realizar una selección adecuada de las variables que van a construir las formulas matemática, que representen a la regresión, por eso hay que tomar en cuenta variables que tiene relación, de lo contraria se estaría matematizando un galimatías.
Se pueden encontrar varios tipos de regresión, por ejemplo:
Regresión lineal simple
Regresión múltiple ( varias variables)
Regresión logística
Simple b) Múltiple, etc.
La regresión lineal técnica que usa variables aleatorias, continuas se diferencia del otro método analítica que es la correlación, por que esta última no distingue entre las variables respuesta y la variable explicativa por que las trata en forma simétrica.
La matematización nos da ecuaciones para manipular los datos, como por ejemplo medir la circunferencia de los niños y niñas y que parece incrementarse entre las edades de 2 meses y 18 años, aquí podemos inferir o predecir que las circunferencias del cráneo cambiara con la edad, en este ejercicio la circunferencia de la cabeza es la respuesta y la edad la variable explicativa.
En la regresión tenemos ecuaciones que nos representan las diferentes clases de regresión:
Regresión Lineal : y = A + Bx
Regresiòn Logarìmica : y = A + BLn(x)
Regresión Exponencial : y = Ac(bx)
Regresión Cuadrática : y = A + Bx +Cx2
Para obtener un modelo de regresión es suficiente establecer la regresión para eso se hace uso del coeficiente de correlación: R.
R = Coeficiente de correlación, este método mide el grado de relación existente entre dos variables, el valor de R varía de -1 a 1, pero en la práctica se traba con un valor absoluto de R.
El valor del coeficiente de relación se interpreta de modo que a media que R se aproxima a 1, es más grande la relación entre los datos, por lo tanto R (coeficiente de correlación) mide la aproximación entre las variables.
El coeficiente de correlación se puede clasificar de la siguiente manera:

CORRELACIÒN VALOR O RANGO
1) Perfecta 1) R = 1
2) Excelente 2) R = 0.9 < = R < 1
3) Buena 3) R = 0.8 < = R < 0.9
4) Regular 4) R = 0.5 < = R < 0.8
5) Mala 5) R < 0.5
DISTRIBUCIÒN DIVARIANTE
DEFINICIÒN :
La distribución diváriate es cuando se estudia en una población dos variables, que forman pares correspondientes a cada individuo, como por Ejm:
Las notas de 10 alumnos en biología y lenguaje
BIOLOGIA
2
4
5
5
6
6
7
7
8
9
LENGUAJE
2
2
5
5
5
7
5
8
7
10
Los pares de valores son: ( 2, 2) (4,2) (5,5)…….(8,7) (9,10) forman una distribución diváriate.
La correlación, método por el cual se relacionan dos variables se pude graficar con un diagrama de dispersión de puntos, a la cual muchos autores le llaman nubes de puntos, encuadrado dentro de un gráfico de coordenadas X Y en la cual se pude trazar una recta y cuyos puntos mas cercanos de una recta hablaran de una correlación mas fuerte, ha esta recta se le denomina recta de regresión, que puede ser positiva o negativa, la primera contundencia a aumentar y la segunda en descenso o decreciente.
También se puede describir un diagrama de dispersión en coordenadas cartesianas valores como en la distribución diváriate, en donde la nube de puntos representa los pares de valores.
GRAFICOS DE RECTA DE REGRESIÒN
Por último se pueden graficar las líneas de tendencia, herramienta muy útil para el mercadeo por que es utilizada para evaluar la resistencia que proyectan los precios. Cuando una línea de tendencia central se rompe ya sea con tendencia al alza o en la baja es porque ocurre un cambio en los precios, por lo tanto las líneas de tendencia pueden ser alcista cuando se unen los puntos sucesivos y bajista cuando se unen los puntos máximos.
También existen gráficos que representan la dispersión de datos dentro de las coordenadas cartesianas, ósea las nubes de puntos y que pueden darse según la relaciòn que representa, que puede ser lineal, exponencial y sin relación, esta última cuando los puntos están dispersos en todo el cuadro sin agruparse lo cual sugiere que no hay relación.
Los gráficos siguientes nos muestran esta relación:
Matemáticamente las ecuaciones serían:
Ajuste Lineal : Y = Bx + A
Ajuste Logarìtmico : Y =BLnX + A
Ajuste Exponencial : Y = AC BX
En el modelo de regresión lineal simple se utiliza la técnica de estimación de los mínimos cuadrados, este modelo tiene solo una variable de predicción y se supone una ecuación de regresión lineal.
En el siguiente ejemplo la relación entre la calificación y salario la variable repuesta es el salario inicial y la variable predictiva o de predicción es la calificación promedia, si se desea determinar una ecuación de regresión para el salario inicial promedio como una función de la calificación promedio se podrá graficar y procesar los datos en una computadora, estos datos son:
CP = Calificación Promedio
SI = Salario Inicial
De este grupo de datos se obtiene el siguiente gráfico de dispersión
CP
SI
2.95
18.50
3.20
20.00
3.40
21.10
3.60
22.40
3.20
21.20
2.85
15.00
3.10
18.00
2.85
18.80
3.05
15.70
2.70
14.40
2.75
15.50
3.10
17.20
3.15
19.00
2.95
17.20
2.75
16.80

CONCLUSIONES
Monografía de compilación en la cual se trata de abordar un fragmento de la estadística inferencial, trabajo realizado en el ámbito en una maestría, como cierre de un capitulo del curso de estadística básica, en la bibliografía se encontró en la literatura bajado de internet literatura compleja que implica un amplio conocimiento de las estadísticas por parte del autor y en la revisión de la literatura que abarca años anteriores 1995, se observo pocos cambios de la temática a la actualidad, sobre todo dicho cambio esta ajustado al área de la entrada de los ordenadores en esta rama de la ciencia, el capitulo de regresión y correlación se hace por lo tanto mas maleable, sobre todo cuando se maneja gran cantidad de datos, la inferencia que es muy importante en investigación medica, en este caso se hace mas fácil para los que procesan estos tipos de datos.
BIBLIOGRAFIA DE REGRESION Y CORRELACION
Vommi : MJ ¿Qué es un monografía? [citada 13 08 2005] dirección: http://www.mografias.com/trabajos7/beren/beren.shtml)
Torino H . Resumen del libro de Estadísticas de Berenson y Levine [citada 15 08 2005] dirección: http:// www.mografias.com/trabajos13 /beren/beren.shtml)
El Rincón del Vago, SL C Toro 76,2º Salamanca (España) [18 08 2005] dirección: http:// htlm.rincondelvago.com/estadistica/html)
El Rincón Del Vago, SL C Toro 76,2º Salamanca (España) [16 08 2005] dirección: http://htlm.rincondelvago.com/estadistica/html)
Ortega Calvom, Cayuela Domínguez A, Regresión Logística No condicionada y tamaño de muestra: una revisión bibliografica. Revista Española de salud Publica [serie en internet] 2002 Marzo [citada 16 08 05] Vol 70Nº2 [12 paginas] dirección http://www.scielospphp?piol=s1135-5727200200020000&scrip[=sciarte
Galdos Calculo y Estadística III Edición Unica. Grupo La Republica. Lima Perú;2005.
Cannavos G. Probabilidad y Estadística Aplicación y métodos. Ed. en español Mc GRAW- HILL/INTERAMERICANA DE MEXICO.1995.

No hay comentarios: