Ir al contenido principal

Entradas

Proyectos de Ciencia de Datos

 Alumnos de la Experiencia Educativa: Big Data Estos proyectos han sido desarrollados por estudiantes de la Licenciatura en Estadística. Esperamos que sirvan a otros estudiantes apasionados de los números. https://www.freepik.es/ Proyecto 1. Conjunto de Datos de Rendimiento del Estudiante Inicio | Estadística y Big Data (wixsite.com) Autores: Scarleht Sánchez y Elizabeth Cruz Proyecto 2. Diabetes en Mujeres Indígenas PIMA Blog | Diego Y Gabriela Big Data (wixsite.com) Autores: Diego y Gabriela Proyecto 3. Adultos Inicio | Big Data (wixsite.com) Autores: Paloma Proyecto 4. Análisis casos de Varicela Húngara Inicio | DATA CLUB (wixsite.com) Análisis casos de varicela Húngara (godaddysites.com) Autores: Monserrat Proyecto 5. Análisis en la base de datos de Iris BIG DATA DJ Autores: Proyecto 6. Calidad de Vino Tinto y Vino Blanco Calidad de vino tinto y vino blanco (data-scienceb.blogspot.com) Autores: Proyecto 7. Complicaciones del infarto agudo de Miocardio Miocardio | My Site (wixsite.c

Metodología de John Rollins para estudios en Ciencia de Datos

La metodología de John Rollins con adecuaciones para estudios en el área de ciencia de datos, la cual consiste de 11 etapas que advierten tecnologías y enfoques Etapa 1: Comprensión del proyecto. Definir el problema, el planteamiento de los objetivos y la posible solución. Etapa 2. Enfoque Analítico. Aplicar técnicas estadísticas y aprendizaje automático. Construir, experimentar e implementar un modelo de clasificación o de predicción según sea el caso. Etapa 3. Requerimientos de Datos. Determinar los requerimientos de datos como contenidos de datos, formatos y representaciones, guiados por el conocimiento del contexto o negocio. Etapa 4. Recolección de Datos. Identificar y reunir los datos disponibles, estructurados, no estructurados y semiestructurados. Etapa 5. Comprensión de Datos. Utilizar estadísticas descriptivas y técnicas de visualización. Etapa 6. Preparación de Datos. Limpiar los datos, combinar datos de archivos y plataformas, y crear predictores para la con

El Big Data en los Recursos y Derechos Humanos

El Big Data en los Recursos y Derechos Humanos Big Data se refiere a la gestión de grandes cantidades de datos de forma que puedan ser tratados y analizados para la extracción de información relevante para generar informes y predicciones. El Big Data aporta una serie de utilidades para los profesionales de los recursos humanos. Gracias a una gestión adecuada de los datos, es posible recopilar toda la información que manejan de forma correcta y organizada. Pero, ¿Qué ventajas ofrece? Los individuos alrededor del mundo pueden ver vulnerados sus derechos humanos a través del manejo indiscriminado de la herramienta big data , ya que la información que se genera día a día y segundo a segundo por medio de los dispositivos tecnológicos -como los teléfonos inteligentes- abarca desde los hábitos de consumo de las personas hasta aspectos de su vida privada, como pueden ser sus creencias religiosas o sus datos biométricos. Así, la vulneración de derechos humanos se puede dar desde la manera en qu

Matriz de gráficos con RStudio Cloud

Utilizando la base de datos Adult Data Set disponible en  UCI Machine Learning Repository: Adult Data Set   Utilizando RStudio Cloud Código para elaborar matriz de gráficos # Leer base de datos read_csv baseAdult <- read_csv("baseAdult.csv") lapply(baseAdult, class) # Validar niveles de variables: fac_cols <- sapply(baseAdult, is.factor) lapply(baseAdult[, fac_cols], levels) frequency(RangoI) View(baseAdult) library(ggplot2) library(plyr) library(ROCR) library(corrplot) library(caret) install.packages('rworldmap',dependencies=TRUE) library(rworldmap) library(data.table) # Leer base de datos library(readxl) baseA<-read_csv('baseAdult.csv') View(baseA) # Análisis exploratorio #con parámetros gráficos par(mfrow=c(3,5)) # Layout m=matrix(c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15), byrow=TRUE, ncol =5) # Resultado de ésta línea      [,1] [,2] [,3] [,4] [,5] [1,]    1    4    7   10   13 [2,]    2    5    8   11   14 [3,]    3    6    9   12   15 m layout(m) #

Big Data, Ética o Espionaje gubernamental

Big Data es el campo emergente que ofrece nuevas formas de dar valor añadido a las empresas. Sin embargo, el dilema moral sobre su uso por las compañías, ha puesto en tela de juicio el negocio que se realiza con ellos y la privacidad de las personas (Maza, 2017). Es decir, l a dificultad de garantizar el anonimato de los datos  se ha convertido en uno de los aspectos más reiterados al hablar de preservar la privacidad cuando se trabaja en minería de datos. De igual forma, poner la información anónima implica extraer de las bases de datos aquella información que implícitamente sea posible relacionar. Este tema de la privacidad de los datos y sobre quienes recae se ha debatido ya por muchos años sobre todo por el manejo que las compañías han hechos de estos datos  (Maza, 2017). Esto tiene que ver con la ética. Big Data, espionaje y privacidad de los datos personales en Internet: Big Data, espionaje y privacidad de los datos personales en Internet (eneslis.blogspot.com) Al respecto, Pasto

Google Trends

Tendencias de búsquedas de Google Tendencias de Google Actividad: 1. Elegir palabras clave 2. Generar base de datos 3. Descargar base de datos 4. Limpiar datos 5. Hacer visualizaciones

Big Data en Google: “data pipeline” o tubería de datos

Servicios de Google Cloud para Big Data Desde la escritura cuneiforme, el más antiguo sistema de escritura conocido hasta la fecha, hasta los centros de datos modernos, la raza humana siempre ha recopilado información. Se estima que en 2020, nuestra civilización habrá generado 40 zettabytes de información, lo que equivale a 57 veces el número de granos de arena presentes en todas las playas del mundo. Nota: Según el registro de restos arqueológicos, el cuneiforme es un sistema de escritura desarrollado por primera vez por los antiguos Sumerios de Mesopotamia c. 3500-3000 AEC. Con ese ímpetu, Google presentó en 2004, el otro componente básico que hoy en día aún forma parte de las plataformas Big Data: un nuevo paradigma en procesamiento distribuido al que llamó Map & Reduce. Más tarde se revela el Cloud Bigtable que es el servicio de base de datos de Big Data NoSQL de Google, al que muchos consideran el precursor de los almacenes de datos NoSQL tipo Cassandra, HBase… otras de las pi