El análisis de datos es un proceso que consiste en inspeccionar,[1] limpiar y transformar datos con el objetivo de resaltar información útil, para sugerir conclusiones y apoyo en la toma de decisiones. El análisis de datos tiene múltiples facetas y enfoques, que abarca diversas técnicas en una variedad de nombres, en diferentes negocios, la ciencia, y los dominios de las ciencias sociales. Los datos se coleccionan y analizan para indagar en cuestiones, probar conjeturas o refutar teorías.[2]
Se centra en la inferencia estadística, la cual permite tomar una decisión de forma sencilla con un grado de confianza determinado,[3] identificando, analizando tanto datos como patrones de comportamiento. Las técnicas de este análisis varían según las necesidades de la organización así como también las soluciones tecnológicas, tales como KNIME, R y tableros de visualización (como Power BI o Qlik View, Tableau o Sas Visual Analytics). Estos proyectan en tiempo real los datos en formato visual.[4][5][6][7][8][9][10]
El análisis de datos es un proceso sistemático y metódico que implica la recopilación, organización, interpretación y visualización de conjuntos de datos con el objetivo de extraer información significativa y relevante. Este proceso es fundamental para la toma de decisiones informadas en diversos campos, desde la ciencia y la tecnología hasta la economía y las ciencias sociales.
El análisis de datos se sustenta en una amplia gama de técnicas y metodologías, entre las que se destacan la estadística descriptiva, la inferencia estadística, el aprendizaje automático y la minería de datos.[11] Estas herramientas permiten a los investigadores y analistas identificar patrones, tendencias y relaciones subyacentes en los datos, lo que a su vez facilita la generación de hipótesis y la formulación de conclusiones fundamentadas.[12]
La importancia del análisis de datos radica en su capacidad para transformar grandes volúmenes de información en conocimiento útil y accionable. Al procesar y analizar datos de manera sistemática, los profesionales pueden tomar decisiones más informadas, optimizar procesos, identificar oportunidades y mitigar riesgos. Esto ha llevado a un creciente interés y demanda por habilidades en análisis de datos en una amplia gama de sectores, desde la ciencia de datos hasta la toma de decisiones estratégicas.[13]
Antecedentes
El análisis de datos, en su estudio de la estructura de grandes conjuntos, es moderno pero los métodos de análisis son de larga data. Quien introdujo por primera vez el método de análisis de factores fue Ch. Spearman en 1904 (concepto de factor).[14] La primera definición se remonta al año de 1961, cuando el matemático John Wilder Tukey, predijo el efecto de la computación en el análisis definiéndolo como: "(los) Procedimientos para analizar datos, (las) técnicas para interpretar los resultados de dichos procedimientos, (las) formas de planear la recolección de datos para hacer el análisis más fácil, más preciso o más exacto, y toda la maquinaria y los resultados de las estadísticas (matemáticas) que se aplican al análisis".[15]
Tipos de Análisis
Puede dividirse de acuerdo con el tipo de información que estudia en: análisis cuantitativo y cualitativo. El primero, examina la relación entre información cuantificable; El segundo, examina la relación de información no numérica en contextos situacionales y estructurales.[16]
También puede dividirse de acuerdo al objetivo en: análisis exploratorio (ADE) y análisis confirmatorio (ADC). El primero, busca vínculos y relaciones entre los datos; El segundo, se enfoca en comprobar las hipótesis formuladas respecto a un conjunto de información.[17]
Métodos de análisis
Son varios los enfoques presentados, sin pretender ser una metodología estricta sino más bien inicial o para exploración de campo, podemos mencionar las siguientes.[18]
Análisis factorial lineal
- Análisis de componentes principales.
- Análisis de correspondencia binaria.
- Análisis de correspondencia múltiple.
- Análisis discriminante.
Análisis no lineal de los datos
- Basados en núcleos:
- Análisis de componentes principales del núcleo.
- Análisis discriminante del núcleo.
- Basados en redes neuronales.
Se pueden aplicar fórmulas o modelos matemáticos (conocidos como algoritmos) a los datos para identificar relaciones entre las variables; por ejemplo, utilizando correlación o causalidad.[19][20] En términos generales, se pueden desarrollar modelos para evaluar una variable específica basada en otras variables contenidas en el conjunto de datos, con algún error residual dependiendo de la precisión del modelo implementado (por ejemplo, Datos = Modelo + Error).[21] [22]
La estadística inferencial incluye la utilización de técnicas que miden las relaciones entre variables particulares. Por ejemplo, el análisis de regresión puede utilizarse para modelar si un cambio en la publicidad (variable independiente X) proporciona una explicación de la variación en las ventas (variable dependiente Y). En términos matemáticos, Y (ventas) es una función de X (publicidad). Puede describirse como:
donde el modelo está diseñado de manera que y minimizan el error cuando el modelo predice para un rango dado de valores de . Los analistas también pueden intentar construir modelos que sean descriptivos de los datos, con el objetivo de simplificar el análisis y comunicar los resultados.[23]
Otros temas
Edificios inteligentes
Para predecir el consumo de energía en los edificios puede utilizarse un enfoque de análisis de datos.[24] Para implantar edificios inteligentes se llevan a cabo varios pasos en el proceso de análisis de datos, en los que las operaciones de gestión del edificio, como la calefacción, la ventilación, el aire acondicionado, la iluminación y la seguridad, se realizan automáticamente simulando las necesidades de los usuarios del edificio y optimizando recursos como la energía y el tiempo.[25]
Analítica e inteligencia empresarial
La analítica es "el uso extensivo de datos, análisis estadísticos y cuantitativos, modelos explicativos y predictivos, y gestión basada en hechos para tomar decisiones y emprender acciones".[26][27] Es un subconjunto de la analítica empresarial, que es un conjunto de tecnologías y procesos que utilizan datos para comprender y analizar el rendimiento empresarial con el fin de tomar decisiones.[28]
Por ejemplo, la analítica de redes sociales o la monitorización de redes sociales es el proceso de recopilación y análisis de datos de las redes sociales.[29][30][31] Los profesionales del marketing suelen utilizarlo para seguir las conversaciones en línea sobre productos y empresas. Las empresas especifican cómo utilizarán estos datos personales en sus avisos de privacidad.[32]
Educación
En el ámbito educativo, la mayoría de los educadores tienen acceso a un sistema de datos para analizar los datos de los alumnos.[33][34] Estos sistemas de datos proporcionan datos a los educadores en un formato de datos sin recetas (incrustación de etiquetas, documentación adicional y sistema de ayuda, y toma de decisiones clave de empaquetado/visualización y contenido) para mejorar la precisión del análisis de datos por parte de los educadores.
Véase también
Referencias
- ↑ «El proceso de análisis de datos - Marketing Analítico». Marketing Analítico. 1 de marzo de 2017. Consultado el 6 de noviembre de 2018.
- ↑ Judd, Charles; McCleland, Gary (1989). Data Analysis. Harcourt Brace Jovanovich. ISBN 0-15-516765-0.
- ↑ Hernández Martín-Logroño, Zenaida (2012). Métodos de análisis de datos: apuntes. Métodos estadísticos I. Universidad de la Rioja. Servicio de Publicaciones. ISBN 978-84-615-7579-4.
- ↑ Visualización de Datos: Definición, Importancia y Oportunidades
- ↑ End to End Data Science
- ↑ Paradis, Emmanuel traducido por Jorge A. Ahumada (2002). «R para Principiantes» (pdf).
- ↑ ¿Qué es Power BI?
- ↑ Diseñado para usos ilimitados
- ↑ ¿Qué es Tableau?
- ↑ SAS® Products, Technology & Solutions
- ↑ Provost, F., & Fawcett, T., Provost, F., & Fawcett, T. (2013). [Data science for business: What you need to know about data mining and data-analytic thinking. O'Reilly Media, Inc. «Data science for business: What you need to know about data mining and data-analytic thinking. O'Reilly Media, Inc.»]. Provost, F., & Fawcett, T. (2013). Data science for business: What you need to know about data mining and data-analytic thinking. O'Reilly Media, Inc. Consultado el Provost, F., & Fawcett, T. (2013). Data science for business: What you need to know about data mining and data-analytic thinking. O'Reilly Media, Inc..
- ↑ Wickham, H., & Grolemund, G., Wickham, H., & Grolemund, G. (2017). [Wickham, H., & Grolemund, G. (2017). R for data science: Import, tidy, transform, visualize, and model data. O'Reilly Media, Inc. data science: Import, tidy, transform, visualize, and model data. O'Reilly Media, Inc.]. Wickham, H., & Grolemund, G. (2017). R for data science: Import, tidy, transform, visualize, and model data. O'Reilly Media, Inc. Consultado el 2017.
- ↑ Provost, F., & Fawcett, T. (2013). Data science for business: What you need to know about data mining and data-analytic thinking. O'Reilly Media, Inc.
- ↑ Ambapour, Samuel (1 de abril de 2003). «Introduction à l’analyse des données» (pdf). L'INS Congo (Bureau d'Application des Methodes Statiques et Informatiques) (en francés). Archivado desde el original el 13 de noviembre de 2009. Consultado el 22 de diciembre de 2018.
- ↑ John Tukey-The Future of Data Analysis-July 1961 La traducción es del inglés "Procedures for analyzing data, techniques for interpreting the results of such procedures, ways of planning the gathering of data to make its analysis easier, more precise or more accurate, and all the machinery and results of (mathematical) statistics which aply to analysis data."
- ↑ Fernández, Pita; Díaz, Pértegas. «Investigación cuantitativa y cualitativa». Consultado el 18 de octubre de 2020.
- ↑ «Análitica de datos». Archivado desde el original el 18 de octubre de 2020. Consultado el 18 de octubre de 2020.
- ↑ Crucianu, Michel; Asselin de Beauville, Jean-Pierre; Boné, Romuald (2004). Hermès - Lavoisier, ed. Méthodes factorielles pour l'analyse des données [Métodos factoriales para el análisis de datos.]. Hermès Science (en francés). p. 288. ISBN 978-2-7462-0921-3.
- ↑ Ben-Ari, Mordechai (2012), «First-Order Logic: Formulas, Models, Tableaux», Mathematical Logic for Computer Science (London: Springer London): 131-154, ISBN 978-1-4471-4128-0, doi:10.1007/978-1-4471-4129-7_7, consultado el 31 de mayo de 2021.
- ↑ Ernest., Sosa (2011). Causation. Oxford Univ. Press. ISBN 978-0-19-875094-9. OCLC 767569031.
- ↑ Data Science from Scratch. First Principles with Python. O'Reilly. 2019. ISBN 9781492041139.
- ↑ «Figure 2. Variable importance by permutation, averaged over 25 models.». dx.doi.org. doi:10.7554/elife.22053.004. Consultado el 31 de mayo de 2021.
- ↑ Nwabueze, JC (21 de mayo de 2008). «Performances of estimators of linear model with auto-correlated error terms when the independent variable is normal». Journal of the Nigerian Association of Mathematical Physics 9 (1). ISSN 1116-4336. doi:10.4314/jonamp.v9i1.40071.
- ↑ «Towards Energy Efficiency Smart Buildings Models Based on Intelligent Data Analytics». www.sciencedirect.com. Consultado el 4 de diciembre de 2023.
- ↑ «Building Energy Management Systems: An Application to Heating, Natural Ventilation, Lighting and Occupant Satisfaction». books.google.com. Consultado el 4 de diciembre de 2023.
- ↑ «Predictive Analytics – A Project or a Program?». practicalanalytics.wordpress.com. Consultado el 4 de diciembre de 2023.
- ↑ «Predictive Analytics: Definition, Model Types, and Uses». www.investopedia.com. Consultado el 4 de diciembre de 2023.
- ↑ «Competing on Analytics: The New Science of Winning». books.google.com. Consultado el 4 de diciembre de 2023.
- ↑ «Social media analytics: a survey of techniques, tools and platforms». link.springer.com. Consultado el 4 de diciembre de 2023.
- ↑ «How to Strengthen Your Digital Marketing Strategy with Social Media Monitoring». www.determ.com. Consultado el 4 de diciembre de 2023.
- ↑ «Social Media Data Mining Techniques You Should Know». financesonline.com. Consultado el 4 de diciembre de 2023.
- ↑ «Social Media Data Collection and Privacy: Key Action Items». hoggo.io. Consultado el 4 de diciembre de 2023.
- ↑ «Report Finds States on Course to Build Pupil-Data Systems». www.proquest.com. Consultado el 4 de diciembre de 2023.
- ↑ «Using Student Data to Improve Teaching & Learning Outcomes». precisioncampus.com. Consultado el 4 de diciembre de 2023.
Enlaces externos
- NIST/SEMATEK (2008) Handbook of Statistical Methods,
- Vance (8 de septiembre de 2011). «Data Analytics: Crunching the Future». Bloomberg Businessweek. Consultado el 26 de septiembre de 2011.
- Data Analysis: Testing for Association en Wayback Machine (archivado el 22 de junio de 2013). Hair, Joseph (2008). Marketing Research 4th ed. McGraw Hill ISBN 0-07-340470-5.