Ciencia de Datos: ¿Qué es y cómo usar modelos descriptivos y predictivos para la toma de decisiones?

¿Qué es la Ciencia de Datos y cuáles son sus objetivos?

La ciencia de datos es una disciplina científica multidisciplinaria, la cual se encarga de utilizar los datos con el objetivo de obtener información relevante para distintos campos de aplicación y del conocimiento.

Como se puede inferir a partir de su nombre, se nutre de aplicar técnicas y procesos propios de las ciencias, como lo son la estadística, modelos matemáticos y un proceso de trabajo que complementa y se nutre mucho del método científico.

Estos procesos se complementan con habilidades técnicas y computacionales que acompañan la manipulación, análisis y modelamiento de datos por medio de distintas herramientas, como pueden ser lenguajes de programación especializados y programas de visualización que ayuden a comunicar más fácilmente los resultados de su trabajo.

Según lo que se busque hacer con el conocimiento generado por la ciencia de los datos se pueden diseñar distintos tipos de análisis, que nos den información que responda desde ¿Qué es lo que pasó? Hasta, ¿qué deberíamos hacer?

Tipos de análisis utilizados en la Ciencia de Datos.

Es importante que desde el principio tengamos muy en claro qué es lo que queremos lograr con nuestro análisis, ya que con base en este objetivo vamos a seleccionar un tipo de análisis u otro.

Según el tipo de análisis que vayamos a hacer, condicionaremos distintas etapas del proceso, como lo es la selección de los datos, los modelos que utilizaremos para analizarlos y la forma en que se presentarán los resultados.

A continuación, se presentan brevemente los tipos de análisis en la ciencia de datos

Análisis descriptivo.

El análisis descriptivo busca responder a la pregunta: ¿qué pasó o qué está pasando?

Este utiliza estadística descriptiva para mostrar características de un fenómeno o de una población.

Un estudio de este tipo nos podría mostrar cuántas ventas tuvo nuestro producto en el último mes, qué empleado fue el que más horas trabajó, cuántas casas cuentan con el servicio de internet, cuántas denuncias atendió la policía en la última semana y cuánto tiempo tardó en dar respuesta, por ejemplo.

Este tipo de estudios son la base para los siguientes y suelen ser un proceso básico en el análisis de datos.

Los resultados obtenidos de este tipo de estudios son como un mapa, que nos dice en dónde estamos.

Análisis diagnóstico.

El análisis diagnóstico busca responder a la pregunta: ¿por qué pasó?

Partiendo de los resultados que nos dio el análisis descriptivo, ya sabemos que tenemos una idea del fenómeno que estamos analizando, pero ahora queremos conocer las causas y entender qué pudo influir para que pasara.

Este tipo de estudios son muy útiles, por ejemplo, si con el análisis descriptivo descubrimos que hubo un pico de ventas en algún momento y queremos saber si hubo algo que propiciara ese pico.

Análisis predictivo.

El análisis predictivo busca responder a la pregunta: ¿qué va a pasar?

Nadie puede predecir el futuro, pero se pueden encontrar patrones que se repiten a través del tiempo o que hay variables que condicionan a otras.

Conociendo estos patrones, podríamos saber, por ejemplo, que cuando haga calor se van a vender más ventiladores, por ejemplo, un poco burdo, pero fácil de entender.

Análisis prescriptivo.

El análisis prescriptivo utiliza los resultados del predictivo y los utiliza para dar recomendaciones.

Volviendo al caso de los ventiladores, una empresa departamental al darse cuenta de que se acerca una ola de calor y por medio de un análisis prescriptivo, puede prever la cantidad de inventario de ventiladores y aires acondicionados que debe tener en inventario para dar respuesta a la demanda.

Proceso y etapas en la Ciencia de Datos.

La ciencia de los datos es parte y utiliza muchos procesos, como lo son el ciclo de vida de los datos y el método científico, pero también cuenta con el suyo propio, que si bien, cuenta con distintas variaciones según los objetivos que se están buscando y la cultura de trabajo de la organización que lo está llevando a cabo, tiende a contar con ciertas características clave que se cumplen en la mayoría de las ocasiones.

El problema, la pregunta y el objetivo.

Al igual que en el método científico, hay un fenómeno que se quiere describir o un problema que se quiere resolver.

Es donde nace y se define el proyecto, nos da una hoja de ruta que nos servirá como guía para saber por dónde deben ir nuestros siguientes pasos.

Con nuestro problema o pregunta, vamos a definir qué tipo de análisis es el más adecuado para obtener la información que nos será más de utilidad, ya sea que queramos comprender el fenómeno frente al que nos encontramos o que estemos buscando guía para saber qué es lo que debemos hacer.

Recolección de datos.

En este momento es cuando recogemos los datos, se trata de conseguir nuestra materia prima.

“Para un profesional de los datos, estos son como la madera para el carpintero o el metal para el herrero.”

Los datos obtenidos deben ser de buena calidad y cumplir con las características que el proyecto requiera.

Se pueden obtener desde distintas fuentes, puede ser que sean datos propios, generados mediante encuestas, registros de ventas o del CRM de la empresa.

Pueden ser datos generados por terceros, como pueden ser los datos censales obtenidos de instancias públicas o comprados a empresas privadas que se encargan de generar y almacenar estos datos con fines comerciales.

Limpieza y exploración de datos.

Una vez obtenidos los datos, sigue comprenderlos y prepararlos.

La limpieza consiste en verificar que los datos cuenten con los formatos correctos de fechas, horas, números y texto, buscar faltas de ortografía, datos perdidos, etc.

La exploración consiste en comprender cuáles son los datos con los que contamos, qué variables representan, qué significan, etc.

Muchas veces se consideran estos procesos como momentos separados, nosotros los consideramos como un solo momento porque al hacer limpieza, debes de tener pleno conocimiento de cómo deben de ser los datos y cómo son las variables que estos tienen, lo que se obtiene con la exploración, pero también, al hacer limpieza, interactúas activamente con los datos, lo que te da mayor entendimiento de tus datos.

Poniendo un ejemplo cotidiano, es como aspirar un carro, mientras vas limpiando, te encuentras con huecos, botones y características que posiblemente no habías considerado antes.

Ojo, esto no quiere decir que solo se deba limpiar los datos y con esto ya tengamos pleno conocimiento de nuestro conjunto, más bien, se trata de dos etapas tan estrechamente relacionadas, que resulta conveniente pensarlas como parte del mismo momento.

Esta etapa suele ser la más larga, pero también es de vital importancia, ya que, si nuestros datos no están en las condiciones correctas y no somos capaces de comprenderlos plenamente, puede que los resultados del estudio no sean representativos.

Modelado de información.

La ciencia de datos se nutre de distintas disciplinas, entre ellas las matemáticas, campos como la estadística y el álgebra dan las principales herramientas a la ciencia de datos.

Estas herramientas son principalmente algoritmos que se pueden usar según las necesidades de cada estudio; estos algoritmos se encargan de tareas de agrupación, asociación, correlación, predicción, clasificación, etc.

El modelado consiste en tomar los algoritmos y adecuarlos para poder aplicarlos a nuestros conjuntos de datos y de esta manera convertirlos en información útil.

Podemos pensar en los modelos como en una línea de ensamble, donde al principio de la línea ingresan los datos crudos (obviamente ya limpios y listos para su procesamiento), y por el otro lado sale la información que necesitamos.

A continuación, se mostrarán algunas características de los tipos de algoritmos más utilizados en ciencia de datos y cuál es su utilidad, pero sin entrar de lleno en su funcionamiento.

Modelos de regresión.

Los modelos de regresión entran en la categoría de machine learning, porque utilizan los datos existentes para entender su comportamiento y en base a esto hacer estimaciones de lo que podría pasar en el futuro, pero también nos pueden ayudar a inferir qué es lo que pasó en un momento en el pasado del que no tenemos información.

Un gobierno podría usar este tipo de modelos para tratar de predecir cuántos accidentes de tránsito habrá en épocas navideñas y tomar medidas precautorias, o una empresa de retail para saber cuándo tendrán que surtir sus almacenes y las cantidades en que tienen que hacerlo.

Modelos de clasificación.

Estos modelos lo que hacen es partir de datos etiquetados que den pautas o características a categorías, con esto, el algoritmo puede clasificar los datos nuevos para poder clasificarlos.

Un ejemplo muy común del uso de estos algoritmos es el sistema que clasifica los correos electrónicos en spam.

Con estos algoritmos también podríamos clasificar a los clientes en categorías según sus compras regulares.

Modelos de correlación.

Como su nombre lo indica, estos modelos se encargan de encontrar si un hecho tiene correlación con otro, ya sea que cuando uno crezca, el otro también o que, al contrario, decrezca.

Con estos modelos, se podría encontrar la relación precio-ventas, de un producto, para saber cómo se comportarían las ventas al cambiar el precio de un producto.

Interpretación y presentación de los resultados.

Los modelos nos arrojan ciertos resultados, pero es importante considerar que estos resultados deben ser interpretados por una persona, misma que debe tener pleno conocimiento del medio.

Con el fin de facilitar la interpretación de los resultados y el poder compartirlos de manera que sean fáciles de comprender para aquellos que no cuentan con conocimiento técnico, los resultados deben ser presentados de manera gráfica y en documentos con explicaciones claras.

Aplicación de resultados

Esta última etapa consiste en utilizar los resultados obtenidos para la toma de decisiones dentro de las organizaciones.

Se trata del momento final y continuo, donde todo el estudio cobra sentido, y donde su utilidad sale a relucir, puesto que recordemos que el objetivo principal de la ciencia de datos es generar información que resulte relevante para resolver problemas o explicar fenómenos.

Usualmente el equipo que se encargó de realizar el estudio queda fuera de esta fase, ya que es muy común que este no pertenezca a la organización interesada, ya que son consultores externos.

Conclusión.

En conclusión, la ciencia de datos es una disciplina que se encarga de generar conocimiento relevante mediante la aplicación de modelos matemáticos, la manipulación de datos, el conocimiento del medio y la utilización de herramientas computacionales.

Esta ha cobrado relevancia gracias que los resultados de su aplicación ayudan a describir de forma clara y con rigor científico distintos fenómenos o problemas, lo que nos da pauta a tomar decisiones que ayuden a mejorar procesos y resolver problemas dentro de muchos ámbitos, como lo son el marketing, los negocios, la producción de bienes y servicios, así como del conocimiento académico dígase ciencias sociales o naturales y también en la gestión gubernamental.

Referencias.

Aguero, S. (2021, junio 17). Cómo funcionan los modelos descriptivos—Tekne. https://teknedatalabs.com/es/como-funcionan-los-modelos-descriptivos/

Análisis de datos: Predictivo, descriptivo y prescriptivo | OpenWebinars. (s. f.). OpenWebinars.net. Recuperado 22 de enero de 2026, de https://openwebinars.net/blog/analisis-de-datos-predictivo-descriptivo-y-prescriptivo/

ATLAS.ti. (s. f.). ATLAS.ti. Recuperado 23 de enero de 2026, de https://atlasti.com/es/research-hub/tipos-de-analisis-de-datos

García Herrero, Jesús., Molina López, J. M., Berlanga de Jesús, A., Patricio Guisado, M. Á., Bustamante, Á. L., & Padilla R., W. (2018). Ciencia de datos: Técnicas analíticas y aprendizaje estadístico. Un enfoque práctico. Alfaomega.

Marín, A. A. C., Villegas, J. M., Ramírez, V. H. G., & Jiménez, P. P. (s. f.). ¿Qué es la ciencia de datos?

Méndez, N. P., & Rubier, J. P. (2018). Ciencia de datos: Una revisión del estado del arte. UCE Ciencia. Revista de postgrado, 6(3). https://uceciencia.edu.do/index.php/OJS/article/view/145

¿Qué es el análisis predictivo? – AWS. (s. f.). Amazon Web Services, Inc. Recuperado 22 de enero de 2026, de https://aws.amazon.com/es/what-is/predictive-analytics/

¿Qué es la ciencia de datos? | IBM. (2021, septiembre 21). https://www.ibm.com/mx-es/think/topics/data-science

¿Qué es la ciencia de datos? – Explicación de la ciencia de datos – AWS. (s. f.-a). Amazon Web Services, Inc. Recuperado 22 de enero de 2026, de https://aws.amazon.com/es/what-is/data-science/ ¿Qué es la ciencia de datos? Cómo convertirte en un científico de datos | Microsoft Azure. (s. f.-b). Recuperado 22 de enero de 2026, de https://azure.microsoft.com/es-es/resources/cloud-computing-dictionary/what-is-data-science

¡Cotiza hoy tu estudio de mercado con Marktspot!

Marktspot es una Agencia de Investigación de Mercados con más de 30 años de experiencia y con sede en 3 estados de la república mexicana.

¡Aprende más con nosotros!

Personas trabajando sobre una pantalla, analizando el comportamiento de una ia generativa

Contacto

¡Descubre hoy lo que es Marktspot!

Contacta con nosotros y comprueba por ti mismo nuestra calidad y servicio.