domingo, 31 de marzo de 2013

REGRESION VS CORRELACION

    
    

    La regresión lineal recordemos que Su objetivo final, es “predecir o estimar” el valor de una variable que corresponde al valor dado de otra variable.



Importante no se puede hablar de correlacion lineal, si antes no cumplio con el principio de la ecuación de regresión lineal.

   
      La correlación lineal se refiere a la medición de la “intensidad de la relación” entre variables.
 
Cuando se calculan mediciones de correlación a partir de un conjunto de datos, el interés recae en el grado de correlación entre las variables.

REGRESION LINEAL

El analisis de regresión es útil para averiguar la forma probable de las relaciones entre las variables, y el objetivo final, cuando se emplea este método de análisis, es predecir o estimar el valor de una variable que corresponde al valor dado de otra variable.

El identificar si hay o no regresión lineal en un conjunto de datos se realiza por el cumplimiento de su propiedad donde: Y = a + bX ; importante cuando se desea hablar posteriormente de correlación.


PRUEBA "T"

La prueba"T" conocida tambien como prueba t-Student, es una prueba diseñada por William Sealy Gosset en 1908 a principios del siglo XX, quién trabajaba en una fabrica de cerveza, Guinness, que prohíbia a sus empleados la publicación de articulos cientificos debido a una difusión previa de secretos industriales. De ahí que Gosset publicase sus resultados bajo el seudonimo de Student.


Generalmente las muestras se toman sobre dos grupos dentro de una población, casi siempre siguiendo los principios de prueba de hipotesis nula.

DISTRIBUCION NORMAL

Gran número de distribuciones tienen la forma de campana, es decir, alejandose de la media a la derecha e izquierda el número de observaciones decrece de forma similar, esto genera una curva símetrica. Su ecuación resulta de la función de la media (promedio) y de su desviación estandar. Ante infinitas posibilidades de media y desviación estandar el proceso de tipificación permite reducirla a una sola: Me=0 S=1 y se presenta: X E N (Me, Sx).

Para entender mejor la distribución normal es importante conocer las propiedades que lo contienen.

VALOR CRITICO

El valor critico llamado también por algunos como punto critico, se representa por Zα/2. Es el valor de la abscisa en una determinada distribución que deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza.

Normalmente los valores críticos están tabulados o pueden calcularse en función de la distribución de la población. Por ejemplo, para una distribución normal, de media 0 y desviación típica 1, el valor crítico para α = 0,1 se calcularía del siguiente modo: se busca en la tabla de la distribución ese valor (o el más aproximado), bajo la columna "Área"; se observa que se corresponde con -1,28. Entonces Zα/2 = 1,64. Si la media o desviación típica de la distribución normal no coinciden con las de la tabla, se puede realizar el cambio de variable t =(X-μ)/σ para su cálculo.

Veamos un ejemplo:


NIVEL DE SIGNIFICANCIA - NIVEL DE CONFIANZA


Nivel de significación en investigacion todo consiste en estimar la probabilidad de error, por ende hay que ponerle un limite de  margen o de error; como dar examen, una maniobra de vuelo, una posibilidad de accidente, etc; por tal razón es importante que el investigador plantee la magnitud del error que estamos dispuestos a aceptar en cualquier desición.

Nivel de Confianza supone creer y tener seguridad de que una situación es de determinada manera, o que una persona actuará de determinada forma. La confianza supone seguridad en uno mismo como en otros ya que implica la creencia de que ciertos resultados o consecuencias serán alcanzados en determinadas situaciones.



CLASIFICACION DE VARIABLES

Una variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores.

Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población.

Dentro de las variables las podemos clasificar de la siguiente manera:



CLASIFICACION DE VARIABLES


PRUEBAS DE HIPOTESIS

Una hipótesis es una proposición aceptable que ha sido formulada a través de la recolección de información  y datos, aunque no esté confirmada, sirve para responder de forma alternativa a un problema con base cientifica.


Para tener una aproximación de si la hipotesis es verdadera o falsa necesitamos realizar una prueba de hipotesis.

PARAMETRO Y ESTADIGRAFO



Los conceptos de parámetro y estadígrafo están relacionados de manera muy estrecha con los de poblaciones y muestra.


PARAMETRO = POBLACION
Un parámetro se define como cualquier resumen de los elementos de una población, son las medidas o características descriptivas inherentes a las poblaciones. Ejemplo: Los salarios promedio de todos los empleados de una empresa, puede ser un ejemplo de parámetro.


ESTADIGRAFO = MUESTRA
Un estadígrafo o llamado también estadístico es el resumen de los elementos de una muestra, son las medidas descriptivas inherentes a una muestra, las cuales pueden usarse como estimación del parámetro. Como ejemplo podría tomarse los salarios promedio de una muestra de los empleados de la empresa.

PROBABILIDAD

    Es una compleja rama de la matemáticas y tiene sus raices firmemente arraigadas en los juegos de azar. En efecto, gran parte del trabajo inicial en está área se llevó a cabo en un intento por obtener ventaja en esos juegos. Por fortuna sus estudios en bioestadística requerirán solamente los conocimientos más básicos de probabilidad.