La metodología de John Rollins con adecuaciones para estudios en el área de ciencia de datos, la cual consiste de 11 etapas que advierten tecnologías y enfoques
Etapa 2. Enfoque Analítico. Aplicar técnicas
estadísticas y aprendizaje automático. Construir, experimentar e implementar un
modelo de clasificación o de predicción según sea el caso.
Etapa 3. Requerimientos de Datos. Determinar los requerimientos de datos como contenidos de datos,
formatos y representaciones, guiados por el conocimiento del contexto o negocio.
Etapa 4. Recolección de Datos. Identificar y reunir los datos disponibles, estructurados, no
estructurados y semiestructurados.
Etapa 5. Comprensión de Datos. Utilizar estadísticas descriptivas y técnicas de visualización.
Etapa 6. Preparación de Datos. Limpiar los datos, combinar datos de archivos y plataformas, y crear predictores
para la construcción del modelo.
Etapa 7. Análisis exploratorio. Explorar el comportamiento de cada variable mediante gráficos de
barras, sectores o donas, histogramas, dispersión y otros.
Etapa 8. Modelación. Construir e
implementar el modelo de clasificación o de predicción según sea el caso.
Etapa 9. Evaluación del modelo. Realizar un diagnóstico del modelo y estimar su eficacia para resolver
el problema mediante un conjunto de pruebas de entrenamiento y de significación
estadística.
Etapa 10. Implementación del modelo. Generar un informe con recomendaciones del modelo desarrollado y
aprobado.
Etapa 11. Retroalimentación. Documentar el rendimiento del modelo y su impacto, mejorar su precisión
y utilidad, y automatizar su evaluación.
Referencias
Metodología de ciencia de datos | Avances AI
Metodología John Rollins en Ciencia de Datos (platzi.com)
Comentarios
Publicar un comentario