Ir al contenido principal

Entradas

Mostrando las entradas de abril, 2021

Matriz de gráficos con RStudio Cloud

Utilizando la base de datos Adult Data Set disponible en  UCI Machine Learning Repository: Adult Data Set   Utilizando RStudio Cloud Código para elaborar matriz de gráficos # Leer base de datos read_csv baseAdult <- read_csv("baseAdult.csv") lapply(baseAdult, class) # Validar niveles de variables: fac_cols <- sapply(baseAdult, is.factor) lapply(baseAdult[, fac_cols], levels) frequency(RangoI) View(baseAdult) library(ggplot2) library(plyr) library(ROCR) library(corrplot) library(caret) install.packages('rworldmap',dependencies=TRUE) library(rworldmap) library(data.table) # Leer base de datos library(readxl) baseA<-read_csv('baseAdult.csv') View(baseA) # Análisis exploratorio #con parámetros gráficos par(mfrow=c(3,5)) # Layout m=matrix(c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15), byrow=TRUE, ncol =5) # Resultado de ésta línea      [,1] [,2] [,3] [,4] [,5] [1,]    1    4    7   10   13 [2,]    2    5    8   11   14 [3,]    3    6    9   12   15 m layout(m) #

Big Data, Ética o Espionaje gubernamental

Big Data es el campo emergente que ofrece nuevas formas de dar valor añadido a las empresas. Sin embargo, el dilema moral sobre su uso por las compañías, ha puesto en tela de juicio el negocio que se realiza con ellos y la privacidad de las personas (Maza, 2017). Es decir, l a dificultad de garantizar el anonimato de los datos  se ha convertido en uno de los aspectos más reiterados al hablar de preservar la privacidad cuando se trabaja en minería de datos. De igual forma, poner la información anónima implica extraer de las bases de datos aquella información que implícitamente sea posible relacionar. Este tema de la privacidad de los datos y sobre quienes recae se ha debatido ya por muchos años sobre todo por el manejo que las compañías han hechos de estos datos  (Maza, 2017). Esto tiene que ver con la ética. Big Data, espionaje y privacidad de los datos personales en Internet: Big Data, espionaje y privacidad de los datos personales en Internet (eneslis.blogspot.com) Al respecto, Pasto

Google Trends

Tendencias de búsquedas de Google Tendencias de Google Actividad: 1. Elegir palabras clave 2. Generar base de datos 3. Descargar base de datos 4. Limpiar datos 5. Hacer visualizaciones

Big Data en Google: “data pipeline” o tubería de datos

Servicios de Google Cloud para Big Data Desde la escritura cuneiforme, el más antiguo sistema de escritura conocido hasta la fecha, hasta los centros de datos modernos, la raza humana siempre ha recopilado información. Se estima que en 2020, nuestra civilización habrá generado 40 zettabytes de información, lo que equivale a 57 veces el número de granos de arena presentes en todas las playas del mundo. Nota: Según el registro de restos arqueológicos, el cuneiforme es un sistema de escritura desarrollado por primera vez por los antiguos Sumerios de Mesopotamia c. 3500-3000 AEC. Con ese ímpetu, Google presentó en 2004, el otro componente básico que hoy en día aún forma parte de las plataformas Big Data: un nuevo paradigma en procesamiento distribuido al que llamó Map & Reduce. Más tarde se revela el Cloud Bigtable que es el servicio de base de datos de Big Data NoSQL de Google, al que muchos consideran el precursor de los almacenes de datos NoSQL tipo Cassandra, HBase… otras de las pi

Proyectos Big Data requieren Ingeniero de Datos, Analista de datos o Estadístico, Científico de datos y otros

Ingeniero de Datos o Data Engineer Los Ingenieros de Datos son los responsables de definir cómo gestionar, organizar, transformar y almacenar los datos necesarios en la organización de una forma óptima para todos los interesados.  Deberá tener las habilidades para la Ingeniería de software tiene el componente técnico. Construyen la base tecnológica para que los analistas y científicos de datos puedan realizar sus tareas. Referencias Qué es un ingeniero de datos | BIG DATA | CIO (ciospain.es) Ingeniero de Datos: Lo que necesitas saber | Aprender BIG DATA Empleos de «ingeniero de datos» | LinkedIn ¿Qué es la ingeniería de datos? | Hybrid IT | Discover The New (ituser.es) ¿Qué funciones desempeña un Ingeniero de Datos? - CIO MX % % Analista de Datos, Big Data Analyst , Analista Big Data o ¿ Estadístico ? El Analista de Datos o Estadístico trabaja con grandes cantidades de datos cuantitativos y cualitativos, que los transforma en información para hacer posible una toma de decisiones más co