Grandes volúmenes de datos
Referencias
1. Estadística
2 Big Data
6 La estadística como fuente clave de los datos abiertos | datos.gob.es
Estudiantes, académicos y especialistas en los temas de Estadística, Ciencia de Datos, Big Data y Datos Abiertos
Grandes volúmenes de datos
6 La estadística como fuente clave de los datos abiertos | datos.gob.es
1. La estadística es la ciencia que estudia los datos basadas pruebas de inferencia para obtener un buen calculo de probabilidades.
ResponderBorrar2. Big data es la que describe el gran tamaño de los datos, los cuales pueden ser estructurados y no estructurados los cuales llegan en las empresas por día, aunque su tamaño no es lo que importa.
3. La relación que existe es que comparten el mismo objetivo, este es obtener claridad además que buscan tener una buena toma de decisión la cual se llega a esta por medio del estudio del análisis.
4. La diferencia es que big data es que son gran cantidad de datos los cuales únicamente se pueden entender mediante procesamientos de informática mientras que la estadística tiene como función de analizar los datos y buscar relaciones entre estos, también recopila, procesa, analiza e interpreta los datos buscando deducciones.
¿Qué es Big Data?
ResponderBorrarR= Big Data es un conjunto de datos los cuales cumplen con tres características. El primero es el volumen este hace referencia a una gran cantidad de datos, algunos autores opinan que para ser aceptado como big data la base de datos que pesan como mínimo 30 terabytes. El segundo es variabilidad, este conlleva que la complejidad de los datos ya sean estructurados o no estructurados dificulten su tratamiento con técnicas comunes. El tercero es velocidad, con esto nos referimos a que los datos son generados de manera constante de tal forma que resulte complicado crear bases de datos que nos sean capaces de capturar todos los datos. Esta es una definición aceptada por muchos especialistas pero debido a que esta es un término que no tiene mucho de haber nacido la definición puede variar con el tiempo y con los autores.
¿Qué es la estadística?
R= Es una rama de las matemáticas que ha llegado a ser una ciencia propia, la cual se ocupa en su forma más simple de crear y utilizar técnicas que nos permitan reunir, clasificar y analizar datos de manera efectiva. También busca técnicas adecuadas para genera inferencias sobre la población desde una muestra, siempre buscando que la inferencia sea lo mas acertada y representativa posible.
¿Qué es ciencia de datos?
R= Es una ciencia que compete a demasiadas áreas de estudios destacando la informática, las matemáticas y la estadística, esta ciencia lo que busca es utilizar las diferentes técnicas para poder generar conocimiento a través de los datos, ya sea para tomar mejores decisiones o para generar conclusiones más concretas.
¿Qué relación hay entre el big data y los datos abiertos?
R= La relación más grande que puedo encontrar es que el big data forzosamente necesita de grandes cantidades de datos de lo cual esta se puede nutrir de los datos abiertos. Los datos abiertos no son necesariamente masivos más sin embargo cada vez estos alcanzan un tamaño considerable. Otra relación entre los datos abiertos y el big data es el hecho de que big data se conforma por un conjunto de técnicas, las cuales pueden ser desarrolladas o practicadas en su mayoría con datos abiertos.
https://innovabasqueassistant.com/2017/07/25/big-data-y-open-data-que-son-y-por-que-importan/
Borrarhttps://www.cronista.com/columnistas/Big-data-y-datos-abiertos-como-crean-valor-gobiernos-y-empresas-20190310-0026.html#:~:text=Es%20decir%2C%20mientras%20que%20big,data%22%20para%20generar%20un%20impacto.&text=Tambi%C3%A9n%20cuando%20el%20sector%20p%C3%BAblico,data%20el%20impacto%20es%20enorme.
https://www.oracle.com/mx/data-science/what-is-data-science/
https://www.sas.com/es_mx/insights/big-data/what-is-big-data.html
https://www.powerdata.es/big-data
1. Estadística: Es una ciencia que trabaja con conjuntos de datos para obtener, ordenar y analizar los datos recopilados con el fin de obtener explicaciones y predicciones sobre fenómenos observados.
ResponderBorrar2. Big Data: Son datos tan grandes o complejos que no pueden manejarse con los métodos tradicionales de procesamiento. También se conoce al big data por sus "tres V": volumen, variedad y velocidad. El volumen se refiere a su gran tamaño; la variedad, a la amplia cantidad de formatos no estándar; y la velocidad, a la necesidad de procesarlos con rapidez y eficiencia.
3. ¿Cuál es la relación entre Big Data y la Estadística?: La recopilación de datos y la búsqueda de tendencias dentro de los datos permiten que sea más rápido, sin problemas y de manera eficiente. Todos estos datos nos ofrecen información que nos ayuda a saber si nuestros productos o servicios están funcionando bien o por el contrario están teniendo problemas.
4. ¿Cuáles son las diferencias entre Big Data y Data Science?: El análisis de big data realiza la extracción de información útil de grandes volúmenes de conjuntos de datos. Contrariamente al análisis, la ciencia de datos utiliza algoritmos de aprendizaje automático y métodos estadísticos para entrenar a los ordenadores y obtener predicciones precisas. Los macrodatos se distinguen por su variedad, velocidad y volumen. Mientras que data science proporciona los métodos o técnicas para analizarlos.
https://www.gestiopolis.com/que-es-estadistica-tipos-y-objetivos/
Borrarhttps://www.oracle.com/mx/big-data/what-is-big-data/
http://halweb.uc3m.es/esp/Personal/personas/dpena/publications/castellano/2014BEIO.pdf
https://www.apd.es/big-data-vs-data-science/#:~:text=Los%20macrodatos%20se%20distinguen%20por,m%C3%A9todos%20o%20t%C3%A9cnicas%20para%20analizarlos.&text=El%20an%C3%A1lisis%20de%20big%20data,vol%C3%BAmenes%20de%20conjuntos%20de%20datos.
1. ¿Qué es Big Data? Big Data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día, cuya traducción equivale a “datos masivos”. Lo que importa con el Big Data es lo que las organizaciones hacen con los datos. Big Data se puede analizar para obtener ideas que conduzcan a mejores decisiones y movimientos de negocios estratégicos. Es un conjunto de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales.
ResponderBorrarAguilar, L. J. (2016). Big Data, Análisis de grandes volúmenes de datos en organizaciones. Alfaomega Grupo Editor.
2. ¿Qué es Estadística? La estadística es muy importante para cualquier ámbito laboral, la estadística se utiliza para describir, clasificar y analizar datos, mediante la observación o la experimentación, lo que nos lleva a extraer conclusiones, la estadística es el arte de aprender a partir de los datos. La estadística se ha hecho indispensable en investigaciones medicas y de salud pública, control de la calidad, entre otras.
Ross, S. M. (2018). Introducción a la estadística. Reverté.
3. ¿Qué es la Ciencia de datos? La ciencia de datos es hoy en día la herramienta fundamental para la explotación de datos y la generación de conocimiento. Entre los objetivos que persigue se encuentra la búsqueda de modelos que describan patrones y comportamientos a partir de los datos con el fin de tomar decisiones o hacer predicciones. La ciencia de los datos a comenzado una nueva era; debido a la alta aplicabilidad en la solución de problemas.
Los científicos de datos son los encargados de hacer frente a los grandes proyectos de la ciencia de datos en todos los niveles (Hey, 2012). Deben poseer habilidades en las disciplinas relacionas con la ciencia de datos. Tiene que ser capaz de estudiar las diversas fuentes de información disponibles en una organización; extraer datos a partir de diversos formatos (Blei and Smyth, 2017); depurarlos, analizarlos, idear y desarrollar algoritmos; realizar inferencias, preparar y comunicar los resultados de dichos análisis y transmitir conclusiones que ayude a tomar mejores decisiones (Cao, 2017).
García, J., Molina, J., Berlanga, A., Patricio, M., Bustamante, A., & Padilla, W. (2018). Ciencia de datos. Técnicas Analíticas y Aprendizaje Estadístico. Bogotá, Colombia. Publicaciones Altaria, SL.
4. ¿Qué relación hay entre los datos abiertos y el Big Data? "Big data" o macrodatos refiere a un conjunto tan masivo de datos que en general requiere un software especializado para analizarlo y extraer patrones. En cambio, "dato abierto" refiere a la posibilidad de que cualquier persona o empresa pueda reutilizar un conjunto de datos para analizar tendencias, generar nuevas aplicaciones o crear empresas, entre otros usos. Para que eso ocurra, los datos tienen que ser accesibles de dos modos complementarios: deben estar disponibles y en un formato que permita su reutilización digital. Aunque la relación que tienen, es que al momento de depurar alguna base de datos (big data) esta se puede convertir en una de datos abiertos ya que cambia el tamaño de esta.
Ferrer-Sapena, A., & Sánchez-Pérez, E. (2013). Open data, big data:¿hacia dónde nos dirigimos?. Anuario ThinkEPI 2013, 7, 150-156.
¿Que es el big data? Es un término que describe el gran volumen de datos estructurados y no estructurados. Daug Laney lo define como las trea V
ResponderBorrarVolúmen, Velocidad y Variedad
¿Qué es la estadística?
Ciencia que utiliza conjunto de datos numericos para obtener, a partir de ellos inferencias basadas en el cálculo de la probabilidad. Estudio que reúne y clasifica y recuenta todos los hechos que tienen determinada características en común, para poder llegar a conclusiones a partir de datos numericos extraídos.
¿Qué es la ciencia de datos?
Combina múltiples campos que incluyen estadísticas ñ, métodos científicos y análisis de datos para extraer el valor de los datos. Los prácticantes de datos se les llama científicos de datos y combinan una variedad de conocimientos para analizar los datos recopilados de la web, ze teléfonos inteligentes de clientes y sensores y otras fuentes
¿Que relacion tienen los datos abiertos con el big data?
El open data tiene como objetivo que ciudadanos y empresas puedan aprovechar estos datos para generar valor económico. Con ello podrán construir nuevas ideas. Conocimientos e incluso crear nuevos modelos de negocios de los cuales obtendrán beneficios económicos y sociales.
Y la relacion con el big data es en el datasets sobre investigaciónes científicos, sociales media o otras fuentes no gubernamentales.
Existen una gran cantidad de datos que no proceden de organismos públicos, si no de fuentes académicas empresariales o privadas con um enfoque abierto y reutiliizable la publicación de los investigadores científicos como en el caso del buscador zooniverse.
1. Big Data
ResponderBorrarConocida como las cuatro V, que representan el gran Volumen de datos que debe ser capaz de tratar, la Velocidad con la que puede procesar esos datos, y la Variedad de formas que pueden tomar los mismos. Debemos hacer énfasis en el objetivo del Big Data añadiendo una cuarta V, la del Valor que se obtiene por la información extraída de los datos.
A través de técnicas de análisis Big Data, pueden explotarse datos de cualquier naturaleza: bases de datos, texto libre, registros numéricos, actividad en redes sociales, audios, imágenes, vídeos, etc. Incluso donde haya diversidad de datos y formatos, podrán tratarse mediante estrategias de integración de la información, enriqueciendo así cualquier solución.
2. Estadística
La Estadística se ocupa de la recolección, agrupación, presentación, análisis e interpretación de datos.
La Estadística no son sólo los resultados de encuestas, ni el cálculo de unos porcentajes, la Estadística es un método científico que pretende sacar conclusiones a partir de observaciones hechas.
3. Ciencia de datos
La ciencia de datos combina múltiples campos que incluyen estadísticas, métodos científicos y análisis para extraer el valor de los datos.
Los practicantes de la ciencia de datos se llaman científicos de datos y combinan una variedad de conocimientos para analizar los datos recopilados de la web, de teléfonos inteligentes, de clientes, sensores y otras fuentes.
4. Relación entre Big Data y Open Data
Open data no tiene que ser una base de datos enorme: Cantidades modestas de datos, pueden tener un gran impacto cuando se hacen públicos. Los datos de los gobiernos locales, por ejemplo, pueden ayudar a los ciudadanos a participar en el presupuesto local, elegir la atención médica, analizar la calidad de los servicios locales o crear aplicaciones que ayuden a las personas a navegar por el transporte público.
Pero cuando el gobierno convierte el Big Data en Open Data, es especialmente poderoso: las agencias gubernamentales tienen la capacidad y los fondos para recopilar grandes cantidades de datos, y la apertura de esos conjuntos de datos puede tener grandes beneficios económicos.
Tanto el Big Data como el Open Data pueden transformar una empresa, un gobierno y la sociedad, y una combinación de los dos son especialmente potentes. Los grandes datos nos dan un poder sin precedentes para entender, analizar y, en última instancia, cambiar el mundo en que vivimos.
5. Desafío Iberoamericano en simulación de negocios
Equipos de 3 miembros de la misma carera. Inscribirse con nuestro director. Cursar al menos una asignatura de 5° semestre o superior. La competencia se desarrollará entre los meses de marzo y mayo de 2021. Registro hasta el 14 de marzo. Entrenamiento del 1 al 14 de marzo. Competencia: primer fase del 15/03 – 25/03, segunda fase del 06/04 – 20/04. Fase final del 22/05 al 05/05.
Big Data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa con el Big Data es lo que las organizaciones hacen con los datos. Big Data se puede analizar para obtener ideas que conduzcan a mejores decisiones y movimientos de negocios estratégicos.
ResponderBorrarBig Data: ¿En qué consiste? Su importancia, desafíos y gobernabilidad (powerdata.es)
La Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población.
Definición (educacion.es)
La ciencia de datos combina múltiples campos que incluyen estadísticas, métodos científicos y análisis de datos para extraer el valor de los datos.
¿Qué es la ciencia de datos? | Oracle México
la vinculación entre los datos abiertos y el big data viene dado por la necesidad que tienen las administraciones públicas de gestionar y analizar grandes volúmenes de datos.
Open government, open data, big data y transparencia: la información como nexo de unión (uoc.edu)
¿Qué es la estadística?
ResponderBorrarR=Es una Ciencia que utiliza conjuntos de datos numéricos para obtener información respecto aun tema, a partir de ellos, inferencias basadas en el cálculo de probabilidades.
también es un Estudio que reúne, clasifica y recuenta todos los hechos que tienen una determinada característica en común, para poder llegar a conclusiones a partir de los datos numéricos extraídos.
REFERENCIAS:https://economipedia.com/definiciones/estadistica.html
¿Qué es el big data?
R=Es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa con el Big Data es lo que las organizaciones hacen con los datos. Big Data se puede analizar para obtener ideas que conduzcan a mejores decisiones y movimientos de negocios estratégicos.
REFERENCIA: https://www.powerdata.es/big-data
¿Qué es la ciencia de datos?
R=Es la disciplina que convierte los datos en conocimiento útil”. Es decir, la Ciencia de Datos domina el espectro completo del ciclo de vida de los datos.
REFERENCIA: https://www.maximaformacion.es/blog-dat/que-es-la-ciencia-de-datos/
¿Qué Relacion tienen los datos abiertos con el big data?
R=podemos definir big data (o en castellano, macrodatos) como grandes conjunto de datos que no pueden tratarse de manera convencional, ya que superan la capacidades de las herramientas tecnológicas habituales para la captura, gestión y procesamiento.
En cuanto a los datos abiertos, de acuerdo con la Carta Internacional de Datos Abiertos, el open data son aquellos datos digitales disponibles con las características técnicas y jurídicas necesarias para que puedan ser reutilizados y redistribuidos libremente.
REFERENCIAS: https://datos.gob.es/es/noticia/datos-abiertos-big-data-y-gobierno-abierto-diferentes-tipos-de-datos
Crisoforo Perez Ortiz
ResponderBorrar¿Qué es Biga data?
Cuando se habla de Big Data se refiere a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.
¿Qué es estadística?
La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos observados. La estadística consiste en métodos, procedimientos y fórmulas que permiten recolectar información para luego analizarla y extraer de ella conclusiones relevantes. Se puede decir que es la Ciencia de los Datos y que su principal objetivo es mejorar la comprensión de los hechos a partir de la información disponible.
¿Qué es ciencia de datos?
La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados, lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático, y la analítica predictiva.
¿Qué es ciencia de datos?
La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados, lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático, y la analítica predictiva.
Relación de datos abiertos con Big data
Open data no tiene que ser una base de datos enorme: Cantidades modestas de datos, pueden tener un gran impacto cuando se hacen públicos. Tanto el Big Data como el Open Data pueden transformar una empresa, un gobierno y la sociedad, y una combinación de los dos son especialmente potentes. Los grandes datos nos dan un poder sin precedentes para entender, analizar y, en última instancia, cambiar el mundo en que vivimos.
1.- ¿Qué es Big Data?
ResponderBorrarEl Big Data es el análisis masivo de datos. (estructurados y no estructurados).
2.-¿Qué es la Estadística?
La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos observados. Se puede decir que es la Ciencia de los Datos y que su principal objetivo es mejorar la comprensión de los hechos a partir de la información disponible.
3.-¿Qué es ciencia de datos?
“La Ciencia de Datos (o Data Science) es la disciplina que convierte los datos en conocimiento útil”.
Se trata de un conjunto de herramientas que utiliza métodos, procesos, algoritmos y sistemas científicos para extraer información valiosa de los datos en bruto, se sirve de las matemáticas, estadísticas y disciplinas informáticas para desarrollar sus procesos y además, incorpora novedosas técnicas como el aprendizaje automático, el análisis masivo y la extracción de datos.
4.-¿Qué relación hay entre el big data y los datos abiertos?
el big data forzosamente necesita de grandes cantidades de datos de lo cual esta se puede nutrir de los datos abiertos. Los datos abiertos no son necesariamente masivos más sin embargo cada vez estos alcanzan un tamaño considerable.
Alexa Viveros Viveros
ResponderBorrar1. ¿Qué es la estadística?
La palabra Estadística procede del vocablo “Estado”, pues era función principal de los Gobiernos de los Estados establecer registros de población, nacimientos, defunciones, impuestos, cosechas. La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos observados.
http://www.dspace.uce.edu.ec/bitstream/25000/13720/3/Fundamentos%20B%C3%A1sicos%20de%20Estad%C3%ADstica-Libro.pdf
https://economipedia.com/definiciones/estadistica.html#:~:text=Los%20tipos%20de%20estad%C3%ADstica%20se,de%20un%20conjunto%20de%20datos.
2. ¿Qué es Big Data?
Big Data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa con el Big Data es lo que las organizaciones hacen con los datos. Big Data se puede analizar para obtener ideas que conduzcan a mejores decisiones y movimientos de negocios estratégicos.
https://www.powerdata.es/big-data#:~:text=Big%20Data%20es%20un%20t%C3%A9rmino,organizaciones%20hacen%20con%20los%20datos.
3. Relación entre Estadística y Big Data.
Ambas disciplinas comparten un mismo objetivo: la claridad. Mediante diferentes acciones, estas organizan los datos de tal forma que estos resulten claros y comprensibles. A su vez, tienen un segundo objetivo definido: la toma de decisiones. Es con la información analizada que pueden diseñarse caminos a recorrer y acciones a realizar, por lo que tanto la estadística como el Big Data pueden definirse como necesarios para decidir.
https://www.universia.net/ar/actualidad/orientacion-academica/cual-relacion-entre-big-data-estadistica-1162126.html
4. ¿Qué es la ciencia de datos?
Data Science es un campo que abarca la limpieza, la preparación y el análisis de datos. Por ejemplo, las matemáticas, las estadísticas y muchas otras herramientas que los científicos aplican a conjuntos de datos. El científico aplica las herramientas para extraer conocimiento de los datos.
Data Science es una herramienta para abordar Big Data y luego extraer información de él. Primero los Data Scientist reúnen conjuntos de datos de múltiples disciplinas y los compila. Después de esto, aplican machine learning, análisis predictivo y sentimental. Luego se acentúan en un punto donde se pueda derivar algo. Por último, se extrae la información útil de ella.
El Data Science entiende y analiza los datos desde el punto de vista comercial. Su trabajo es proporcionar la predicción más precisa. Un Data Science se encarga de dar sus predicciones, es muy precisa ya que puede impedir que un empresario pierda en el futuro.
https://www.master-data-scientist.com/diferencias-entre-master-big-data-y-data-science/
Elizabeth Cruz Alvarez
ResponderBorrarhttps://drive.google.com/file/d/1dLCIPLGi52gFcNyI0PtrBVqBVKnBx4zc/view?usp=sharing
https://drive.google.com/file/d/1lwg_AhSdhFdBetKfx2__GC1soNRDwW9t/view?usp=sharing
https://drive.google.com/file/d/1ayxZxwdzvPDf09Y027QxxtyJX9q7I7lN/view?usp=sharing
Elizabeth Cruz Alvarez
ResponderBorrarhttps://drive.google.com/file/d/1dLCIPLGi52gFcNyI0PtrBVqBVKnBx4zc/view?usp=sharing
https://drive.google.com/file/d/1lwg_AhSdhFdBetKfx2__GC1soNRDwW9t/view?usp=sharing
https://drive.google.com/file/d/1ayxZxwdzvPDf09Y027QxxtyJX9q7I7lN/view?usp=sharing
1. Estadística
ResponderBorrarLa Estadística se ocupa de la recolección, agrupación, presentación, análisis e interpretación de datos. La Estadística no son sólo los resultados de encuestas, ni el cálculo de unos porcentajes, la Estadística es un método científico que pretende sacar conclusiones a partir de unas observaciones hechas.
REFERENCIA:http://halweb.uc3m.es/esp/Personal/personas/agrane/ficheros_docencia/EDAD/introduccion_tema1_reducido.pdf
2. Big Data
Big Data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa con el Big Data es lo que las organizaciones hacen con los datos. Big Data se puede analizar para obtener ideas que conduzcan a mejores decisiones y movimientos de negocios estratégicos.
REFERENCIA: https://www.powerdata.es/big-data
3. ¿Cuál es la relación entre el Big Data y la Estadística?
La inferencia y los métodos estadísticos se aplican en control de procesos de producción o de stocks, control de calidad y fiabilidad, análisis de clientes y estudios de mercado o productos, análisis de riesgos o de productos financieros, minería de datos e inteligencia de negocio, muy de moda hoy en día bajo el nombre de Big Data, diseño de experimentos, análisis clínicos, estudios epidemiológicos, etc. Los resultados de la investigación en esta área se enmarcan en el ámbito de la inferencia estadística, Bioestadística, Geoestadística, técnicas de muestreo y re-muestreo, series temporales, inferencia no paramétrica, datos categóricos, datos censurados y/o truncados, predicción, análisis multivariante, etc.
REFERENCIA: http://www.itmati.com/estadistica_bigdata
4. ¿Cuáles son las diferencias entre Big Data y Data Science?
Las organizaciones necesitan grandes datos para mejorar la eficiencia, comprender mercados nuevos e incrementar la competitividad, Entonces la ciencia de datos proporciona los métodos para comprender y utilizar el potencial del big data de manera óptima.
Big data proporciona el potencial de rendimiento. Sin embargo, extraer información de Big Data para utilizar su potencial para mejorar el rendimiento es un desafío significativo. La ciencia de los datos o Data science usa enfoques teóricos y experimentales además del razonamiento deductivo. Tiene la gran tarea de descubrir toda la información perspicaz escondida de una compleja red de datos no estructurados, lo que ayuda a las organizaciones a darse cuenta del potencial del big data.
El análisis de Big Data realiza la extracción de información útil de grandes volúmenes de conjuntos de datos. Contrario al análisis, la ciencia de datos hace uso de algoritmos de aprendizaje automático y métodos estadísticos para entrenar a la computadora para aprender sin mucha programación para hacer predicciones a partir de datos masivos. Por lo tanto, la ciencia de los datos no se debe confundir con el análisis de big data.
REFERENCIAS: https://expertoenbigdata.com/big-data-vs-data-science/
Jiménez Llanos Lizbeth
BorrarMonserrat Martínez de los Santos
ResponderBorrar1.- Estadística: Es la ciencia que estudia los datos, esta se encarga de recopilar, clasificar, sintetizar, organizar, procesar, analizar e interpretar, para la t5oma de decisiones frente a la incertidumbre. Es el arte de aprender a través de los datos
https://www.gestiopolis.com/que-es-estadistica-tipos-y-objetivos/
2.- Big Data: Es el análisis masivo de datos, es un conjunt5o de dat5os grande y complejo, conocido como las cuat5rov, gran volumen, la velocidad con la que puede procesar, la variedad de formas que pueden tomar y valor que se obtiene por la información extraída de los datos.
https://www.iic.uam.es/big-data/
3.- Ciencia de datos: Es un paso evolutivo en campos interdisciplinarios, que incorporan la informática, el modelado, las estadísticas, la analítica y las matemáticas en un solo proceso.
La disciplina ofrece un conjunto cada vez más maduro de saberes orientados a explotar datos para extraer conocimiento, abarca a quienes en forma cotidiana aplican técnicas de programación para analizar datos. La ciencia de datos se trata de emplear técnicas de programación para analizar datos. Pero no es sólo eso; la ciencia de datos aplicada requiere el desarrollo de habilidades en cuatro áreas: Programación, estadística, comunicación y conocimiento de dominio.
https://www.javeriana.edu.co/documents/12847/10949798/Qu%C3%A9+es+la+ciencia+de+datos/aa1e64ec-0961-4ef9-a4e5-472fe5774c0b
https://bitsandbricks.github.io/ciencia_de_datos_gente_sociable/que-es-la-ciencia-de-datos.html
¿Qué relación hay entre los datos abiertos y el Big data?
Big data y datos abiertos están relacionados, pero no son lo mismo. Big data o macrodatos refiere a un conjunto masivo de datos que en general requiere un software especializado para analizarlo y extraer patrones.
En cambio, dato abierto refiere a la posibilidad de que cualquier persona o empresa pueda reutilizar un conjunto de datos para analizar tendencias, generar nuevas aplicaciones o crear empresas, entre otros usos. Para que eso ocurra, los datos tienen que ser accesibles de dos modos complementarios: deben estar disponibles y en un formato que permita su reutilización digital.
Es decir, big data se define por la cantidad, los datos abiertos se definen por su calidad. Los datos abiertos no necesariamente tienen que ser "big data" para generar un impacto
Pero no todo big data abierto proviene del sector público. Cada vez más, grandes compañías están empezando a abrir sus bases en un nuevo modelo de investigación colaborativo.
https://www.cronista.com/columnistas/Big-data-y-datos-abiertos-como-crean-valor-gobiernos-y-empresas-20190310-0026.html#:~:text=En%20cambio%2C%20%22dato%20abierto%22,crear%20empresas%2C%20entre%20otros%20usos.&text=Es%20decir%2C%20mientras%20que%20big,se%20definen%20por%20su%20calidad.
Big Data: Big: Cuando hablamos de Big Data nos referimos a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles, cciones clave:
ResponderBorrar1. Integre
Durante la integración, es necesario incorporar los datos, procesarlos y asegurarse de que estén formateados y disponibles de tal forma que los analistas empresariales puedan empezar a utilizarlos
2. Administrar
El Big Data requiere almacenamiento. Su solución de almacenamiento puede residir en la nube, en las instalaciones o en ambos, muchas personas eligen su solución de almacenamiento en función de dónde residan sus datos en cada momento.
3. Analizar
La inversión en Big Data se rentabiliza en cuanto se analizan y utilizan los datos. Adquiera una nueva claridad con un análisis visual de sus diversos conjuntos de datos. Continúe explorando los datos para realizar nuevos descubrimientos. Comparta sus hallazgos con otras personas.
Estadística: La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos observados. La estadística consiste en métodos, procedimientos y fórmulas que permiten recolectar información para luego analizarla y extraer de ella conclusiones relevantes. Se puede decir que es la Ciencia de los Datos y que su principal objetivo es mejorar la comprensión de los hechos a partir de la información disponible.
Una de las características fundamentales de la estadística es su transversalidad. La estadística ayuda a obtener conclusiones relevantes para el estudio de todo tipo de agentes como: humanos, animales, plantas, etc. Generalmente lo hace a través de muestras estadísticas.
Ciencia de datos: La ciencia de datos combina múltiples campos que incluyen estadísticas, métodos científicos y análisis de datos para extraer el valor de los datos. Los practicantes de la ciencia de datos se llaman científicos de datos y combinan una variedad de conocimientos para analizar los datos recopilados de la web, de teléfonos inteligentes, de clientes, sensores y otras fuentes. La Ciencia de Datos domina el espectro completo del ciclo de vida de los datos:
• La captura de los datos (recepción de señales y adquisición de datos)
• su gestión y procesamiento (ordenación, limpieza, transformación e ingeniería de datos)
• Exploración (minería de datos, agrupación / clasificación, modelado de datos, resumen de datos)
• Análisis (exploratorio / confirmatorio, análisis predictivo, regresión, minería de texto, análisis cualitativo)
• Comunicación (informes reproducibles, visualización interactiva y apoyo a la toma de decisiones).
Relación entre los datos abiertos y Big Data: Big Data y Open Data están estrechamente relacionados, pero no son los mismos. El Open Data atrae una perspectiva que puede convertir al Big Data más útil y más democrático. Los datos abiertos también deben ser relativamente fáciles de usar. Los datos abiertos deben estar disponibles de forma gratuita o a un costo mínimo.
Mientras que el Big Data se define por el tamaño, el Open Data se define por su uso. El Big Data es el término utilizado para describir conjuntos de datos muy grandes, complejos y que cambian rápidamente. Pero esos juicios son subjetivos y dependen de la tecnología: el Big Data puede no parecer tan grande, por el análisis de datos y la tecnología.
Referencias:
https://www.powerdata.es/big-data
https://www.oracle.com/mx/big-data/what-is-big-data/
https://www.oracle.com/mx/big-data/what-is-big-data/
https://www.dciencia.es/que-es-la-ciencia-de-datos/
https://innovabasqueassistant.com/2017/07/25/big-data-y-open-data-que-son-y-por-que-importan/
https://www.maximaformacion.es/blog-dat/que-es-la-ciencia-de-datos/
ANEL HERNÁNDEZ HERRERA.
ResponderBorrarBIG DATA
- Son datos que contienen una mayor variedad y que se presentan en volúmenes crecientes y a una velocidad superior.
- Por el gran volumen de los conjuntos de datos no se pueden manejar con softwer normales. Aunque dan la oportunidad por su gran tamaño de analizar grandes problemas a nivel empresa.
Las 3 “V”
- Volumen: La cantidad de datos importa. tendrá que procesar grandes volúmenes de datos no estructurados de baja densidad. Puede tratarse de datos de valor desconocido.
- Velocidad: La velocidad es el ritmo al que se reciben los datos y (posiblemente) al que se utilizan.
- Variedad: Los tipos de datos no estructurados y semiestructurados, como el texto, audio o video, requieren un preprocesamiento adicional para poder obtener significado y habilitar los metadatos.
ESTADISTICA
- Una rama de las matemáticas encargada del estudio de una característica específica en una población, así mismo recoge los datos, los organiza en tablas, hace representaciones gráficas y los analiza para posteriormente sacar conclusiones de dicha población.
- Al realizar un estudio a toda la población de una característica, se aplica la estadística descriptiva y cuando se estudia una muestra de esa población de forma descriptiva para luego extender los resultados a toda la población se está aplicando la estadística inferencial (Barrios 2005).
CIENCIA DE DATOS
- Combina múltiples campos que incluyen estadísticas, métodos científicos y análisis de datos para extraer el valor de los datos.
- Los practicantes de la ciencia de datos se llaman científicos de datos y combinan una variedad de conocimientos para analizar los datos recopilados de la web, de teléfonos inteligentes, de clientes, sensores y otras fuentes
- Los datos son la base de la innovación, pero su valor proviene de la información que los científicos pueden extraer y luego utilizar a partir de estos.
- Se relaciona con inteligencia artificial (IA) y aprendizaje automático. Términos usados indistintamente, pero hay matices.
- IA significa hacer que una computadora imite de alguna manera el comportamiento humano.
- La ciencia de los datos es un subconjunto de la IA que se refiere más a las áreas superpuestas de las estadísticas, los métodos científicos y el análisis de datos, que se utilizan todas para extraer significado y conocimientos de los datos.
- El Aprendizaje automático es otro subconjunto de la IA y consiste en las técnicas que permiten que las computadoras descubran cosas a partir de los datos y realicen aplicaciones de IA.
- Aprendizaje profundo, que es un subconjunto del aprendizaje automático que permite que las computadoras resuelvan problemas más complejos.
RELACION ENTRE LOS DATOS ABIERTOS Y BIG DATA
Están relacionados, pero no son lo mismo.
- "Big data" o macrodatos refiere a un conjunto tan masivo de datos que en general requiere un software especializado para analizarlo y extraer patrones.
- "Dato abierto" refiere a la posibilidad de que cualquier persona o empresa pueda reutilizar un conjunto de datos para analizar tendencias, generar nuevas aplicaciones o crear empresas, entre otros usos. big data se define por la cantidad, los datos abiertos se definen por su calidad.
- Los datos abiertos no necesariamente tienen que ser "big data" para generar un impacto.
BIBLIOGRAFÍA
- https://www.oracle.com/mx/data-science/what-is-data-science/
- http://recursostic.educacion.es/descartes/web/materiales_didacticos/unidimensional_lbarrios/definicion_est.htm
- https://www.cronista.com/columnistas/Big-data-y-datos-abiertos-como-crean-valor-gobiernos-y-empresas-20190310-0026.html#:~:text=En%20cambio%2C%20%22dato%20abierto%22,crear%20empresas%2C%20entre%20otros%20usos.&text=Es%20decir%2C%20mientras%20que%20big,se%20definen%20por%20su%20calidad.
1.- Estadística.
ResponderBorrarLa estadística es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos para después obtener conclusiones a partir de ellos. De manera general, la estadística puede ser dividida en dos grandes áreas.
http://fundacionortizavila.com/descargar/347/c648f9f0066d4f006f1914dd2ca89db7
2.-Big data.
Big Data puede ser considerada como una tendencia
en el avance de la tecnología que ha abierto la puerta a un nuevo enfoque para la comprensión y la toma de decisiones, que se utiliza para
describir las enormes cantidades de datos (estructurados, no estructurados y semi- estructurados) que sería demasiado largo y costoso
para cargar una base de datos relacional para su análisis.
http://e-spacio.uned.es/fez/eserv/bibliuned:rduned-2014-14-7150/Documento.pdf
3. Relación entre Estadística y Big Data.
Ambas disciplinas comparten un mismo objetivo: la claridad. Mediante diferentes acciones, estas organizan los datos de tal forma que estos resulten claros y comprensibles. A su vez, tienen un segundo objetivo definido: la toma de decisiones. Es con la información analizada que pueden diseñarse caminos a recorrer y acciones a realizar, por lo que tanto la estadística como el Big Data pueden definirse como necesarios para decidir.
https://www.universia.net/ar/actualidad/orientacion-academica/cual-relacion-entre-big-data-estadistica-1162126.html
4.- Ciencia de datos
La ciencia de los datos es un paso evolutivo en campos interdisciplinarios como el análisis de negocios que incorpora la informática, el modelado, las estadísticas, la analítica y las matemáticas en uno solo proceso (NYU center for Data Science).
https://www.javeriana.edu.co/documents/12847/10949798/Qu%C3%A9+es+la+ciencia+de+datos/aa1e64ec-0961-4ef9-a4e5-472fe5774c0b
Paulina Salazar Pineda
ResponderBorrarBig Data: Cuando hablamos de Big Data nos referimos a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño, complejidad y velocidad de crecimiento dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles. Es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa con el Big Data es lo que las organizaciones hacen con los datos. Big Data se puede analizar para obtener ideas que conduzcan a mejores decisiones y movimientos de negocios estratégicos.
Estadística: La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos observados. La estadística consiste en métodos, procedimientos y fórmulas que permiten recolectar información para luego analizarla y extraer de ella conclusiones relevantes. Se puede decir que es la Ciencia de los Datos y que su principal objetivo es mejorar la comprensión de los hechos a partir de la información disponible
Ciencia de datos: La ciencia de datos combina múltiples campos que incluyen estadísticas, métodos científicos y análisis de datos para extraer el valor de los datos. Los practicantes de la ciencia de datos se llaman científicos de datos y combinan una variedad de conocimientos para analizar los datos recopilados de la web, de teléfonos inteligentes, de clientes, sensores y otras fuentes. La ciencia de datos revela tendencias y genera información que las empresas pueden utilizar para tomar mejores decisiones y crear productos y servicios más innovadores. Quizás lo más importante es que permite que los modelos de aprendizaje automático (ML) aprendan de las grandes cantidades de datos que se les suministran en vez de depender principalmente de los analistas de negocios para ver qué pueden descubrir a partir de los datos. Los datos son la base de la innovación, pero su valor proviene de la información que los científicos pueden extraer y luego utilizar a partir de estos.
Relación entre los datos abiertos y big data: Big Data y Open Data están estrechamente relacionados, pero no son los mismos. El Open Data atrae una perspectiva que puede convertir al Big Data más útil y más democrático. Los datos abiertos también deben ser relativamente fáciles de usar. Los datos abiertos deben estar disponibles de forma gratuita o a un costo mínimo.
Mientras que el Big Data se define por el tamaño, el Open Data se define por su uso. El Big Data es el término utilizado para describir conjuntos de datos muy grandes, complejos y que cambian rápidamente. Pero esos juicios son subjetivos y dependen de la tecnología: el Big Data puede no parecer tan grande, por el análisis de datos y la tecnología.
Referencias:
https://www.powerdata.es/big-data
https://economipedia.com/definiciones/estadistica.html
https://www.oracle.com/mx/data-science/what-is-data-science/
https://www.dciencia.es/que-es-la-ciencia-de-datos/
https://innovabasqueassistant.com/2017/07/25/big-data-y-open-data-que-son-y-por-que-importan/
Estadística
ResponderBorrarLa estadística actúa como disciplina puente entre los modelos matemáticos y los fenómenos reales, la estadística proporciona una metodología para evaluar y juzgar estas discrepancias entre la realidad y la teoría.
http://www.est.uc3m.es/agrane/ficheros_docencia/AExplDatos/teoria/introduccion_tema1.pdf
Big Data
Big Data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa con Big Data es lo que las organizaciones hacen con los datos, se puede analizar para obtener ideas que conduzcan a mejores decisiones y movimientos de negocios estratégicos.
https://www.powerdata.es/big-data#:~:text=Cuando%20hablamos%20de%20Big%20Data,convencionales%2C%20tales%20como%20bases%20de
Data Science
Es la ciencia centrada en el estudio de los datos. Se encarga de extraer información de grandes cantidades de datos. Data science combina la estadística, las matemáticas y la informática para interpretar datos. El objetivo es tomar decisiones.
https://www.neoland.es/blog/que-es-data-science
Relación entre Open Data y Big Data
Big Data y Open Data están estrechamente relacionados, pero no son los mismos. El Open Data atrae una perspectiva que puede convertir al Big Data más útil y más democrático.
Mientras que el Big Data se define por el tamaño, el Open Data se define por su uso. El Big Data es el término utilizado para describir conjuntos de datos muy grandes, complejos y que cambian rápidamente. Pero esos juicios son subjetivos y dependen de la tecnología: el Big Data puede no parecer tan grande, por el análisis de datos y la tecnología.
https://innovabasqueassistant.com/2017/07/25/big-data-y-open-data-que-son-y-por-que-importan/
1. Estadística
ResponderBorrarLa estadística es la ciencia de la sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico con objeto de deducir las leyes que rigen esos fenómenos y poder hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
2. Big Data
Big data es un término en desarrollo que describe un gran volumen de datos. Datos estructurados, semiestructurados y no estructurados cuyo potencial se fundamenta en el papel que desarrollan en proyectos de aprendizaje automático o de análisis avanzado.
• Datos no estructurados: redes sociales, correos electrónicos, blogs, tweets, imágenes digitales, archivos de audio o vídeo, datos móviles, datos de sensores, páginas web, etc.
• Semiestructurados: archivos XML, archivos de registro del sistema, archivos de texto, etc.
• Datos estructurados: bases de datos, datos de transacciones y otros formatos de datos estructurados.
Estos datos masivos a menudo se caracterizan por las 3V:
• Volumen: la gran cantidad de datos.
• Variedad: la amplia variedad de tipos de datos.
• Velocidad: la presteza con la que deben procesarse.
Elementos que fueron identificados por uno de los analistas de la consultora Gartner, concretamente, Doug Laney. Esta información se publicó por primera vez en el año 2001.
Sin embargo, otras V se han ido agregando a medida que el término ha ido evolucionando. Sirva como ejemplo, la veracidad, el valor y la variabilidad.
3. ¿Cuál es la relación entre el Big Data y la Estadística?
El verdadero potencial de los Big Data para la Estadística Oficial, en nuestra opinión, reside en que constituyen una huella digital de la actividad humana. Esto es, un creciente número de actividades humanas dejan su rastro en sistemas de información digitales que, a priori, pueden ser empleados para generar información y conocimiento, entre otros ámbitos, a través de la producción estadística oficial. Se trata de la huella digital, que no requiere de modo obligado de grandes volúmenes de datos. Existen métodos de recogida de datos actualmente que se basan en esta idea. La recogida automática de datos (automatic data collection) es un método que reduce la carga del informante extrayendo la información de modo automático de las bases de datos del informante.
4. ¿Cuáles son las diferencias entre Big Data y Data Science?
Se presentan a continuación de las principales diferencias ambos conceptos:
Los macrodatos se distinguen por su variedad, velocidad y volumen. Mientras que data science proporciona los métodos o técnicas para analizarlos.
La inteligencia de datos proporciona el potencial de rendimiento. No obstante, es la ciencia de datos la que utiliza enfoques teóricos y experimentales, además del razonamiento deductivo e inductivo.
El análisis de big data realiza la extracción de información útil de grandes volúmenes de conjuntos de datos. Contrariamente al análisis, la ciencia de datos utiliza algoritmos de aprendizaje automático y métodos estadísticos para entrenar a los ordenadores y obtener predicciones precisas. De este modo, la ciencia de los datos no debe confundirse con el análisis de los macrodatos.
Big Data se relaciona más con la tecnología (Hadoop, Java, Hive, etc.) la computación distribuida y las herramientas y el software de análisis. Esto se opone al otro concepto que se enfoca en estrategias para decisiones de negocios, diseminación de datos utilizando matemáticas, estadísticas, etc.
Daniela Lizbeth Herrera Elizondo
ResponderBorrar1. Estadística
La estadística es la ciencia de la sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico con objeto de deducir las leyes que rigen esos fenómenos y poder hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
2. Big Data
Big data es un término en desarrollo que describe un gran volumen de datos. Datos estructurados, semiestructurados y no estructurados cuyo potencial se fundamenta en el papel que desarrollan en proyectos de aprendizaje automático o de análisis avanzado.
• Datos no estructurados: redes sociales, correos electrónicos, blogs, tweets, imágenes digitales, archivos de audio o vídeo, datos móviles, datos de sensores, páginas web, etc.
• Semiestructurados: archivos XML, archivos de registro del sistema, archivos de texto, etc.
• Datos estructurados: bases de datos, datos de transacciones y otros formatos de datos estructurados.
Estos datos masivos a menudo se caracterizan por las 3V:
• Volumen: la gran cantidad de datos.
• Variedad: la amplia variedad de tipos de datos.
• Velocidad: la presteza con la que deben procesarse.
Elementos que fueron identificados por uno de los analistas de la consultora Gartner, concretamente, Doug Laney. Esta información se publicó por primera vez en el año 2001.
Sin embargo, otras V se han ido agregando a medida que el término ha ido evolucionando. Sirva como ejemplo, la veracidad, el valor y la variabilidad.
3. ¿Cuál es la relación entre el Big Data y la Estadística?
El verdadero potencial de los Big Data para la Estadística Oficial, en nuestra opinión, reside en que constituyen una huella digital de la actividad humana. Esto es, un creciente número de actividades humanas dejan su rastro en sistemas de información digitales que, a priori, pueden ser empleados para generar información y conocimiento, entre otros ámbitos, a través de la producción estadística oficial. Se trata de la huella digital, que no requiere de modo obligado de grandes volúmenes de datos. Existen métodos de recogida de datos actualmente que se basan en esta idea. La recogida automática de datos (automatic data collection) es un método que reduce la carga del informante extrayendo la información de modo automático de las bases de datos del informante.
4. ¿Cuáles son las diferencias entre Big Data y Data Science?
Se presentan a continuación de las principales diferencias ambos conceptos:
Los macrodatos se distinguen por su variedad, velocidad y volumen. Mientras que data science proporciona los métodos o técnicas para analizarlos.
La inteligencia de datos proporciona el potencial de rendimiento. No obstante, es la ciencia de datos la que utiliza enfoques teóricos y experimentales, además del razonamiento deductivo e inductivo.
El análisis de big data realiza la extracción de información útil de grandes volúmenes de conjuntos de datos. Contrariamente al análisis, la ciencia de datos utiliza algoritmos de aprendizaje automático y métodos estadísticos para entrenar a los ordenadores y obtener predicciones precisas. De este modo, la ciencia de los datos no debe confundirse con el análisis de los macrodatos.
Big Data se relaciona más con la tecnología (Hadoop, Java, Hive, etc.) la computación distribuida y las herramientas y el software de análisis. Esto se opone al otro concepto que se enfoca en estrategias para decisiones de negocios, diseminación de datos utilizando matemáticas, estadísticas, etc.
¿Qué es la estadística?
ResponderBorrarLa palabra Estadística procede del vocablo “Estado”, pues era función principal de los Gobiernos de los Estados establecer registros de población, nacimientos, defunciones, impuestos, cosechas. La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos observados.
http://www.dspace.uce.edu.ec/bitstream/25000/13720/3/Fundamentos%20B%C3%A1sicos%20de%20Estad%C3%ADstica-Libro.pdf
https://economipedia.com/definiciones/estadistica.html#:~:text=Los%20tipos%20de%20estad%C3%ADstica%20se,de%20un%20conjunto%20de%20datos.
2. ¿Qué es Big Data?
Big Data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa con el Big Data es lo que las organizaciones hacen con los datos. Big Data se puede analizar para obtener ideas que conduzcan a mejores decisiones y movimientos de negocios estratégicos.
https://www.powerdata.es/big-data#:~:text=Big%20Data%20es%20un%20t%C3%A9rmino,organizaciones%20hacen%20con%20los%20datos.
3. Relación entre Estadística y Big Data.
Ambas disciplinas comparten un mismo objetivo: la claridad. Mediante diferentes acciones, estas organizan los datos de tal forma que estos resulten claros y comprensibles. A su vez, tienen un segundo objetivo definido: la toma de decisiones. Es con la información analizada que pueden diseñarse caminos a recorrer y acciones a realizar, por lo que tanto la estadística como el Big Data pueden definirse como necesarios para decidir.
https://www.universia.net/ar/actualidad/orientacion-academica/cual-relacion-entre-big-data-estadistica-1162126.html
4. ¿Qué es la ciencia de datos?
Data Science es un campo que abarca la limpieza, la preparación y el análisis de datos. Por ejemplo, las matemáticas, las estadísticas y muchas otras herramientas que los científicos aplican a conjuntos de datos. El científico aplica las herramientas para extraer conocimiento de los datos.
Data Science es una herramienta para abordar Big Data y luego extraer información de él. Primero los Data Scientist reúnen conjuntos de datos de múltiples disciplinas y los compila. Después de esto, aplican machine learning, análisis predictivo y sentimental. Luego se acentúan en un punto donde se pueda derivar algo. Por último, se extrae la información útil de ella.
El Data Science entiende y analiza los datos desde el punto de vista comercial. Su trabajo es proporcionar la predicción más precisa. Un Data Science se encarga de dar sus predicciones, es muy precisa ya que puede impedir que un empresario pierda en el futuro.
https://www.master-data-scientist.com/diferencias-entre-master-big-data-y-data-science/