Automatización: ¿el futuro de la ciencia de datos y el aprendizaje automático?

El aprendizaje automático ha sido uno de los mayores avances en la historia de la informática y ahora se considera que puede desempeñar un papel importante en el campo del big data y la analítica. El análisis de big data es un gran desafío desde una perspectiva empresarial. Por ejemplo, actividades como comprender la gran cantidad de formatos de datos diferentes, analizar la preparación de datos y filtrar datos redundantes pueden requerir muchos recursos. Contratar especialistas en científicos de datos es una propuesta costosa y no un medio para lograr un fin para todas las empresas. Los expertos creen que el aprendizaje automático puede automatizar muchas de las tareas asociadas con la analítica, tanto rutinarias como complejas. El aprendizaje automático automatizado puede liberar importantes recursos que podrían usarse para trabajos más complejos e innovadores. El aprendizaje automático parece moverse en esta dirección todo el tiempo.

Automatización en el contexto de la tecnología de la información

En TI, la automatización es la conexión de diferentes sistemas y software, lo que les permite realizar tareas específicas sin ninguna intervención humana. En TI, los sistemas automatizados pueden realizar trabajos simples y complejos. Un ejemplo de un trabajo simple podría ser integrar formularios con archivos PDF y enviar documentos al destinatario correcto, mientras que proporcionar copias de seguridad fuera del sitio podría ser un ejemplo de un trabajo complejo.

Para hacer su trabajo correctamente, necesita programar o dar instrucciones claras al sistema automatizado. Cada vez que se necesita un sistema automatizado para modificar el alcance de su trabajo, alguien debe actualizar el programa o el conjunto de instrucciones. Aunque el sistema automatizado es eficaz en su trabajo, los errores pueden ocurrir por una variedad de razones. Cuando se producen errores, es necesario identificar y corregir la causa raíz. Claramente, para hacer su trabajo, un sistema automatizado depende completamente de los humanos. Cuanto más compleja sea la naturaleza del trabajo, mayor será la probabilidad de errores y problemas.

Un ejemplo común de automatización en la industria de TI es la automatización de pruebas de interfaces de usuario basadas en web. Los casos de prueba se introducen en el script de automatización y la interfaz de usuario se prueba en consecuencia. (Para obtener más información sobre la aplicación práctica del aprendizaje automático, consulte Aprendizaje automático y Hadoop en Detección de fraudes de próxima generación).

El argumento a favor de la automatización es que realiza tareas rutinarias y repetibles y libera a los empleados para realizar tareas más complejas y creativas. Sin embargo, también se argumenta que la automatización ha excluido una gran cantidad de tareas o roles previamente realizados por humanos. Ahora, con el aprendizaje automático entrando en varias industrias, la automatización puede agregar una nueva dimensión.

¿El futuro del aprendizaje automático automatizado?

La esencia del aprendizaje automático es la capacidad de un sistema para aprender continuamente de los datos y evolucionar sin intervención humana. El aprendizaje automático es capaz de actuar como un cerebro humano. Por ejemplo, los motores de recomendación en los sitios de comercio electrónico pueden evaluar las preferencias y gustos únicos de un usuario y brindar recomendaciones sobre los productos y servicios más apropiados para elegir. Dada esta capacidad, el aprendizaje automático se considera ideal para automatizar tareas complejas asociadas con big data y análisis. Ha superado las principales limitaciones de los sistemas automatizados tradicionales que no permiten la intervención humana de forma regular. Existen múltiples estudios de casos que demuestran la capacidad del aprendizaje automático para realizar tareas complejas de análisis de datos, que se discutirán más adelante en este documento.

Como ya se señaló, el análisis de big data es una propuesta desafiante para las empresas, que puede delegarse parcialmente a los sistemas de aprendizaje automático. Desde una perspectiva empresarial, esto puede traer muchos beneficios, como liberar recursos de ciencia de datos para tareas más creativas y de misión crítica, mayores cargas de trabajo, menos tiempo para completar tareas y rentabilidad.

Caso de estudio

En 2015, los investigadores del MIT comenzaron a trabajar en una herramienta de ciencia de datos que puede crear modelos de datos predictivos a partir de grandes cantidades de datos sin procesar utilizando una técnica llamada algoritmos de síntesis de características profundas. Los científicos afirman que el algoritmo puede combinar las mejores características del aprendizaje automático. Según los científicos, lo han probado en tres conjuntos de datos diferentes y están ampliando las pruebas para incluir más. En un artículo que se presentará en la Conferencia Internacional sobre Ciencia y Análisis de Datos, los investigadores James Max Kanter y Kalyan Veeramachaneni dijeron: “Utilizando un proceso de ajuste automatizado, optimizamos toda la ruta sin participación humana, lo que le permite generalizar a diferentes conjuntos de datos”.

Veamos la complejidad de la tarea: el algoritmo tiene lo que se conoce como capacidad de ajuste automático, con la ayuda de la cual se pueden obtener o extraer información o valores de datos sin procesar (como la edad o el sexo), después de lo cual los datos predictivos se pueden crear modelos. El algoritmo utiliza funciones matemáticas complejas y una teoría de la probabilidad llamada Cópula gaussiana. Por lo tanto, es fácil comprender el nivel de complejidad que puede manejar el algoritmo. Esta técnica también ha ganado premios en concursos.

El aprendizaje automático podría reemplazar la tarea

Se está discutiendo en todo el mundo que el aprendizaje automático podría reemplazar muchos trabajos porque realiza tareas con la eficiencia del cerebro humano. De hecho, existe cierta preocupación de que el aprendizaje automático reemplace a los científicos de datos, y parece haber una base para tal preocupación.

Para el usuario promedio que no tiene habilidades de análisis de datos pero tiene diversos grados de necesidades analíticas en su vida diaria, no es factible utilizar computadoras que puedan analizar grandes volúmenes de datos y proporcionar datos de análisis. Sin embargo, las técnicas de procesamiento del lenguaje natural (PNL) pueden superar esta limitación al enseñar a las computadoras a aceptar y procesar el lenguaje humano natural. De esta forma, el usuario medio no necesita funciones o habilidades analíticas sofisticadas.

IBM cree que la necesidad de científicos de datos se puede minimizar o eliminar a través de su producto, Watson Natural Language Analytics Platform. Según Marc Atschuller, vicepresidente de análisis e inteligencia empresarial de Watson, “con un sistema cognitivo como Watson, simplemente haga su pregunta, o si no tiene una pregunta, simplemente cargue sus datos y Watson puede verlos e infiera lo que le gustaría saber. "

Conclusión

La automatización es el siguiente paso lógico en el aprendizaje automático y ya estamos experimentando los efectos en nuestra vida cotidiana: sitios de comercio electrónico, sugerencias de amigos de Facebook, sugerencias de redes de LinkedIn y clasificaciones de búsqueda de Airbnb. Teniendo en cuenta los ejemplos dados, no hay duda de que esto se puede atribuir a la calidad del resultado producido por los sistemas de aprendizaje automático automatizados. A pesar de todas sus cualidades y beneficios, la idea de que el aprendizaje automático cause un enorme desempleo parece una reacción exagerada. Las máquinas han estado reemplazando a los humanos en muchas partes de nuestras vidas durante décadas, pero los humanos han evolucionado y se han adaptado para seguir siendo relevantes en la industria. Según la opinión, el aprendizaje automático a pesar de toda su disrupción es solo otra ola a la que la gente se adaptará.


Hora de publicación: Aug-03-2021