domingo, 5 de junio de 2016

Regresión lineal múltiple



En esta presentación se explica el modelo de regresión lineal múltiple, incluyendo su expresión matemática, y el porqué de su denominación. A continuación se trata la presentación del MRLM en álgebra ordinaria y en álgrebra matricial.

A continuación podéis realizar el formulario relacionado con el vídeo: formulario

sábado, 4 de junio de 2016

El hallazgo de vida extraterrestre es estadísticamente improbable


Los últimos descubrimientos de planetas similares a la Tierra, en cuanto a tamaño y cercanía a una estrella, han avivado las expectativas de científicos y del público general de encontrar vida extraterrestre. 

Los científicos llegaron a esta conclusión a través de un análisis estadístico de probabilidades de aparición de la vida en otros mundos. 

El profesor de astrofísica de dicha Universidad, Edwin Turner, y su colaborador, David Spiegel, realizaron dicho análisis para tratar de discernir los hechos de las expectativas.Los científicos utilizaron un método conocido como inferencia bayesiana, que es un tipo de inferencia estadística en la que las evidencias u observaciones se emplean para actualizar o inferir la probabilidad de que una hipótesis pueda ser cierta. 

Los resultados obtenidos demostraron que la idea de que la vida haya surgido en un entorno similar al terrestre cuenta sólo con una mínima cantidad de evidencias que la respalden, la mayoría extrapoladas de la abiogénesis o generación espontánea de la vida en nuestro propio planeta. 

En un artículo publicado por los científicos en la revistaProceedings of the National Academy of Sciences, se explica que este análisis demostró, por tanto, que la creencia en que debe haber vida en los "exoplanetas" (planetas exteriores al sistema solar) está más basada en la idea de que la vida podría haber surgido en ellos bajo las mismas condiciones que posibilitaron su aparición en la Tierra, que en evidencias empíricas. 

La investigación concluye, el conocimiento que se tiene actualmente sobre la vida extraterrestre apunta a que es muy posible que la Tierra sea una rareza cósmica, y a que las probabilidades de que haya vida en otros planetas sean escasas.

Fuente: tendencias 21

La estadística logra encontrar los restos del vuelo AF 447 de Air France


"A primera hora de la mañana del 1 de junio de 2009 el vuelo de Air France AF 447, con 228 personas a bordo, entre pasajeros y tripulación, desapareció en medio de una tormenta sobre el Atlántico en un vuelo desde Rio de Janeiro a París". Así empiezan describiendo el científico Lawrence Stone y sus colegas de Metron Scientific Solutions su papel en el descubrimiento de los restos del avión casi dos años después de la desaparición del aparato.

Stone y su equipo son estadísticos a los que se llamó para reexaminar las pruebas después de que cuatro búsquedas intensivas fueran incapaces de dar con el avión. Lo interesante de esta historia es que su análisis señaló una localización no demasiado alejada de la última posición conocida del avión, en un área en la que se ya había buscado después del desastre. 

Ahora los investigadores explican cómo lo hicieron. Su enfoque fue aplicar una técnica conocida como inferencia bayesiana que tiene en cuenta toda la información conocida sobre la localización del accidente, así como las pruebas derivadas de los esfuerzos de búsqueda infructuosos. El resultado es una distribución de probabilidad para la localización de los restos. 

La inferencia bayesiana es una técnica estadística que los matemáticos usan para establecer la distribución de probabilidades subyacente basándose en una distribución observada. En concreto, los estadísticos aplican la técnica para actualizar la probabilidad de una hipótesis concreta mientras se recogen pruebas adicionales. 

El resultado final fue el descubrimiento de los restos junto con las grabaciones sobre los datos del vuelo y el del sonido de la cabina que proporcionaron pruebas fundamentales sobre los últimos instantes del vuelo (aunque aún se debate exactamente qué causó el desastre). También llevó al descubrimiento de muchos más cuerpos que pudieron entregarse a las familias. 

Un algoritmo indica la probabilidad de éxito e incluso sugiere alternativas


Según informa el MIT (Instituto Tecnológico de Massachusetts en Estados Unidos) en un comunicado, unos investigadores han presentado un conjunto de algoritmos en la reunión anual de la Asociación para el Avance de la Inteligencia Artificial (AAAI) de este mes, que representa pasos significativos hacia lo que se describe como "un Siri mejorado", el asistente por voz de Apple. Sin embargo, podría aplicarse a cualquier tarea de planificación, desde programar vuelos a rutas de autobús. 

Es un software que permite a un planificador especificar restricciones -por ejemplo, la llegada de autobuses de una ruta determinada a su destino con intervalos de 10 minutos-, y la fiabilidad de los umbrales, tales como que los autobuses deben llegar a tiempo en el 90 por ciento de las ocasiones. 

Después, mediante modelos probabilísticos -que revelan datos como el tiempo medio que tarda un autobús en recorrer un kilómetro-, el sistema determina si existe una solución. Por ejemplo, escalonar la salida de los autobuses seis minutos a ciertas horas del día, y doce las demás.

Fuente: tendencias21

Los delitos que vienen: pronósticos de 2016


En materia delictiva, la administración de Enrique Peña Nieto (México), de acuerdo con las estadísticas este periodo se ha caracterizado por niveles récord de averiguaciones previas (AP) por secuestro (del fuero común) en 2013 seguidas de reducciones considerables, la continuidad de las tendencias decrecientes de AP por extorsión, robo de vehículo y robo con violencia y un ligero repunte de las AP por homicidio doloso en 2015. ¿Qué podemos esperar en 2016?

En 2016 se culminará con una tasa de AP por cada 100 mil habitantes de 14.2 para el homicidio doloso, 4.5 para la extorsión, 0.8 para el secuestro, 131.7 para el robo de vehículo, 138.4 para el robo con violencia. Respecto a 2015, esto implicaría un incremento de 1.5% del homicidio doloso, un crecimiento de 3.3% de la extorsión, una disminución de 9.4% del secuestro, un crecimiento de 1.1% y 1.7% del robo de vehículo y del robo con violencia, respectivamente.

La metodología utilizada para pronosticar las series delictivas consta de 4 etapas:

1) identificación.

2) estimación.

3) diagnóstico.

4) pronósticos.

Se basa en la econometría de series de tiempo bajo el enfoque frecuentista univariado. En concreto, se estimaron modelos ARIMA y GARCH. Se optó por esta metodología porque en la práctica es complicado encontrar variables explicativas con la misma periodicidad y suficiente variación para generar buenos pronósticos.

Fuente: El universal


Microsoft presenta Microsoft R Server, su plataforma de analítica de datos empresarial


Microsoft ha presentado Microsoft R Server, su plataforma de analítica de datos empresarial, escalable y segura, basada en R, el lenguaje de programación para estadística y análisis predictivo más usado en el mundo. Microsoft R Server es fruto del trabajo realizado por la compañía tras la reciente adquisición de Revolution Analytics, el líder comercial de software y servicios para R. 

El nuevo Microsoft R Server soporta una gran variedad de sistemas estadísticos de Big Data, modelización predictiva y capacidades de machine learning. 

Con estas nuevas ofertas para el ecosistema R, Microsoft tiene el objetivo de ofrecer a cada vez más clientes herramientas de productividad y desarrollo, y modelos de análisis.

Además, Microsoft sigue fiel a su compromiso de ofrecer soporte al proyecto open-source de R con el lanzamiento de Microsoft R Open, que mejora el rendimiento del antiguo Revolution R Open desarrollado por Revolution Analytics.

Fuente: New.microsoft

Matemáticos austríacos pronostican la victoria de Francia en la Eurocopa


Un equipo de la Universidad de Economía de Innsbruck ha utilizado los cálculos matemáticos para determinar quién será el vencedor de la próxima eurocopa.

De esta forma, si las previsiones de los matemáticos se cumplieran, Francia se proclamaría vencedora del torneo ante España con una probabilidad del 5,7%. Un pronóstico 0,3 puntos porcentuales más fiable que un hipotético Alemania-España. 

Las fórmulas y los datos utilizados por el grupo de investigadores fueron extraídos de 19 casas de apuestas. En concreto, los investigadores sumaron las probabilidades que tiene cada equipo de ganar atendiendo a sus márgenes de ganancias u «overrounds» y al análisis de regresión logística, que predice el resultado de una variable capaz de adoptar un número concreto de categorías en función de las variables independientes.

Fuente: abc

Reducción de daño hepático de pollos mediante utilización de metionina-colina


El objetivo de este estudio fue evaluar una estrategia de reducción en el daño hepático producido por factores hepatotóxicos en pollos broiler a partir de una mezcla de metionina-colina administrados en la dieta.

El estudio se realizó con una muestra de 120 pollos, se diseñaron 4 tratamientos y les tomaron sangre a los 5, 10 y 20 días para determinar las enzimas hepáticas.
Los datos experimentales fueron analizados mediante el modelo de regresión lineal de SAS y una significancia estadística de (P<0,05).

Los datos experimentales muestran una baja en los parámetros productivos al adicionar a la dieta factores hepatotoxicos. Los datos sugieren que la adición de factores de protección hepática favorecen la recuperación hepática.

Telefónica premiará las mejores iniciativas de big data en España


Synergic Partners, la compañía del Grupo Telefónica especializada en Big Data, Data Science y Data Engineering, junto con Telefónica han presentado los Data Science Awards Spain 2016, los primeros premios de España para reconocer las mejores iniciativas tanto particulares como empresariales y de periodismo de datos en el ámbito del big data.

Los galardones cuentan con tres premios: mejor Data Scientist, mejor iniciativa empresarial en big data y mejor trabajo periodístico de datos de España.

Fuente: negocios

Minería de datos: Ayuda para luchar contra el terrorismo Yihadista




Los investigadores han demostrado que las técnicas de minería de datos se pueden utilizar para identificar cuando los usuarios de Twitter comienzan a mostrar un comportamiento de apoyo a los grupos terroristas radicales como ISIS.

La investigación, que se ha hecho en estrecha colaboración entre la Universidad de Lancaster y la Open University, se explica en el documento "Mining pro-ISIS radicalisation signals from social media users" 

El análisis arrojó luz sobre el sentimiento de cada término en el contexto de Tweets. La palabra en sí ISIS fue descubierto para ser utilizado en un contexto negativo y probablemente despectiva por los usuarios de Twitter. Los investigadores creen que los usuarios pro-ISIS son más propensos a utilizar el término "Estado islámico".

Fuente: Phys

¿Qué sabes de minería de datos? Prueba tus conocimientos rellenando nuestro cuestionario


Teorema de Bayes en Poker


El conocidísimo juego "Poker" se basa en la suerte, el azar y las decisiones que toman los jugadores. Es posible utilizar el Teorema de Bayes para predecir las jugadas y si nos conviene o no seguir jugando la ronda. Habiendo observado previamente a los jugadores de la mesa, podemos observar comportamientos repetitivos y calcular el porcentaje de veces que el jugador apuesta de farol o no.

Fuente: PokerNews

Big data y el sector de la salud


El modelo sanitario y en el general el sector de la salud, es uno de los sectores donde big data está teniendo mayor impacto en la actualidad y donde sus aplicaciones crecerán de un modo espectacular, tanto para el área médica, como también para las áreas de análisis de datos (historias médicas, análisis clínicos…), la gestión de centros de salud, la administración hospitalaria, la documentación científica (generación, almacenamiento y explotación). 

Por ejemplo, los profesionales sanitarios pueden utilizar la analítica de big data en tiempo real para saber dónde se está extendiendo un virus de la gripe y a qué ritmo, pueden adaptar la respuesta y garantizar el stock de vacunas suficiente para los sitios que lo necesiten. 

En la feria de electrónica CES de Las Vegas (enero 2013) se ha celebrado la conferencia profesional Digital Health Summit, en la que, entre otras conclusiones, se propone reducir costes en salud mediante el uso eficiente debig data y herramientas adecuadas. Se presentaron en la conferencia y en la propia feria, aplicaciones móviles y robots, donde esencialmente se hablaba de soluciones con enfoque de tecnología y uso de los grandes volúmenes de datos no sólo en el sector estrictamente médico sino también en otros, como las aplicaciones para móviles relacionadas con el fitness o la nutrición”. 

Fuente: poyatosdiaz

Expectativa de gol, ¿qué es y cómo se usa en el fútbol?



Cierto es que cada vez en más campos se usa el análisis de los datos para tomar decisiones, aumentar la producción y determinar tendencias en base a unos factores determinados. Si es tan beneficioso en los campos en los que ya está implementado, ¿por qué no utilizar los datos que ya tenemos para tomar probabilidades sobre si el equipo que está jugando marcará gol? Esto mismo es lo que ha llevado a cabo Sportify.
En términos simples, la expectativa de gol es una medida de la calidad de un disparo. En términos un poco menos simples, la expectativa de gol es una función de la eficiencia del jugador y del equipo, la ubicación de donde se toma un disparo y una serie de otros factores que miden la probabilidad de que un disparo se convierta en gol. Los modelos de la expectativa de gol en el fútbol se han calculado y refinado desde el año 2013. Se trata de una nueva "estadística", pero una que está fundada en teoría matemática largamente ya establecida.
Fuente: Univision

La estadística bayesiana se usa para interpretar las dataciones del Carbono-14




En arqueología se puede determinar la edad de los materiales que contienen carbono a través de la datación por radiocarbono o Carbono-14. Para interpretar estas dataciones se requiere de métodos y herramientas estadísticas por diversos motivos.
Fuente: Huelva 24