Ciencia de datos, inteligencia artificial, aprendizaje automático: la forma autodidacta

No todos pueden encontrar el tiempo y el dinero para obtener una educación a tiempo completo en los campos de la ciencia de datos (DS, ciencia de datos), IA (inteligencia artificial, inteligencia artificial), ML (aprendizaje automático, aprendizaje automático). La falta de tiempo y la falta de dinero son obstáculos graves. Puede superar estos obstáculos con el autoaprendizaje. Pero incluso aquí no es tan sencillo. Aprender con éxito por su cuenta requiere disciplina, concentración y la elección correcta de materias. El autoaprendizaje en el campo elegido, con el enfoque correcto, se puede combinar libremente con la vida cotidiana o con el estudio en instituciones educativas. Pero en algunas áreas del conocimiento, como DS, AI, ML, es muy difícil comenzar a aprender por su cuenta. Sin embargo, confíe en mi palabra, las dificultades valen lo que obtiene como resultado.La clave del éxito en el autoaprendizaje radica en aprender a su propio ritmo.







En este material, quiero hablar sobre cómo puede actuar para alguien que quiere adquirir conocimientos de forma independiente en las áreas de DS, AI y ML. La aplicación de los métodos de enseñanza sugeridos aquí puede conducir a un buen progreso en el aprendizaje de cosas nuevas. Aquí, además, voy a compartir enlaces a recursos que utilizo, y que estoy sin lugar a dudas dispuesto a recomendar a otros.



Aprende algunas disciplinas matemáticas



Las matemáticas, aunque a alguien no le gusten, son muy importantes en el campo que nos interesa. Creo que es seguro decir que quienes leen esto ya tienen algunos de los conocimientos matemáticos que obtuvieron en la escuela. Esta es una buena base, pero no está lo suficientemente cerca para alguien que quiera desarrollarse en las áreas de DS, AI y ML. Es decir, aquí necesitas profundizar un poco más en las matemáticas de lo que se hace en la escuela, tienes que aprender algunas cosas de la estadística, el álgebra y otras disciplinas matemáticas. Haría una lista de recursos matemáticos útiles para DS, pero esto ya se ha hecho por mí en este artículo. Y lo hicieron muy bien.



Aprende a programar



Si recién está comenzando con el autoaprendizaje, no se apresure directamente a aprender a escribir código con fines de aprendizaje automático. En cambio, vale la pena aprender conceptos básicos de programación que no estén vinculados a ningún dominio. Aprenda qué es la programación, familiarícese con los diferentes tipos de código que existen y comprenda cómo escribir programas correctamente. Esto es muy importante porque a medida que domine la programación, aprenderá muchas ideas básicas que le serán útiles a lo largo de su carrera en DS.



No se apresure, no se esfuerce por aprender inmediatamente algo difícil. Lo bien que comprenda los conceptos básicos afectará toda su futura carrera profesional. aquípuedes encontrar muy buenos tutoriales en video que te introducen a la programación y la informática. Es decir, descubren las cosas más importantes que debe comprender. Tómese su tiempo para responder esta pregunta y trate de llegar a comprender todo lo que aprende.



Elija un lenguaje de programación y entiéndalo correctamente



Hay muchos lenguajes de programación utilizados por aquellos en los campos DS, AI y ML. Los más utilizados aquí son Python, R, Java, Julia y SQL. Se pueden usar otros idiomas en estas áreas, pero los que he enumerado se usan con más frecuencia que otros por una razón:



  • Son fáciles de aprender. Si dedica suficiente tiempo para estudiarlos y muestra perseverancia y constancia en el aprendizaje, entonces puede lograr cierto éxito con la suficiente rapidez.
  • , , .
  • , .
  • , , , DS, AI ML.
  • — .


No hay nada de malo en aprender varios lenguajes de programación. Y, de hecho, es útil saber más de un idioma. Pero cuando aprenda a programar, no debe apresurarse. Debe intentar estudiar, en un período de tiempo determinado, solo un idioma, de lo contrario puede confundirse mucho. Por ello, lo mejor es aprender idiomas uno a la vez, prestando especial atención a aquellos de sus mecanismos que te serán de utilidad en tu trabajo. Sugeriría elegir Python como su primer idioma. Este es un lenguaje bastante simple que incluso un principiante puede entender fácilmente. Además, le recomendaría que primero estudie programación general en Python y luego vaya a herramientas especializadas de Python para el análisis de datos.



Aprenda a recopilar datos



La mayoría de las veces, nadie le proporcionará datos específicamente para usted y, a veces, es posible que no tenga ningún dato en absoluto. Pero, en cualquier caso, debe encontrar una manera de recopilar los datos con los que trabajará. La organización para la que trabaja puede tener un buen sistema de recopilación de datos. Si es así, esta es una gran ventaja para ti. Si su organización no tiene un sistema de este tipo, debe encontrar una forma de recopilar datos. Pero no estamos hablando de ningún dato, sino de información de alta calidad con la que puedes trabajar de forma productiva, logrando tus objetivos. La recopilación de datos no está directamente relacionada con la "minería de datos", con su análisis en profundidad. La recopilación de datos es un paso de trabajo que precede al análisis.



Los datos abiertos que se pueden utilizar de forma gratuita se pueden encontrar en muchos lugares de Internet. A veces, los datos que necesita se pueden recopilar de sitios web mediante técnicas de raspado web. El web scraping es una habilidad muy importante de los científicos de datos, por lo que realmente les pido a todos los que van a trabajar en las áreas de DS, AI y ML que dominen esta habilidad. Aquí hay una buena guía para el web scraping.



Los datos también se pueden almacenar en bases de datos, por lo que los conocimientos iniciales de administración de bases de datos y las habilidades para interactuar con bases de datos le serán de gran utilidad. En particular, el conocimiento de SQL es muy importante aquí. Aprenda SQL aquí .



Aprenda a procesar datos



De lo que voy a hablar aquí a menudo se conoce como Data Wrangling. Este proceso incluye borrar los datos existentes. Utiliza un análisis exploratorio de datos y la eliminación de todo lo innecesario de ellos. Este proceso también incluye la estructuración de los datos, llevándolos a una forma con la que pueda trabajar. Esta etapa de trabajar con datos es la más difícil y agotadora. Los datos que encuentre en el proceso de aprendizaje ya estarán preparados para su análisis. Pero los datos que encuentra en el mundo real pueden ser completamente sin procesar. Si realmente desea convertirse en un científico de datos, debe encontrar los datos reales y encontrar formas de hacer que se vean decentes.



Se pueden encontrar datos reales en casi todas partes. Por ejemplo, enKaggle . Esta gran plataforma tiene datos de muchas empresas de todo el mundo. El tratamiento primario de datos es una actividad muy tediosa, pero si lo haces de forma regular y persistente, poco a poco te darás cuenta de que también es una actividad muy interesante. Aquí hay algunas buenas conferencias sobre procesamiento de datos primarios.



Aprenda a visualizar datos



Si usted es un experto en DS, AI o ML y está bien versado en su negocio, no debe olvidar que lo que le parece obvio puede resultar completamente incomprensible para los demás. No espere que, por ejemplo, puedan sacar conclusiones al mirar columnas de números. Aprender a visualizar datos es necesario para que los resultados de su trabajo puedan ser utilizados por especialistas de otros campos. La “visualización de datos” se conoce comúnmente como el proceso de presentar datos en forma gráfica. Tal presentación de los datos permitirá extraer su beneficio incluso para aquellos que no tienen conocimientos especiales en los campos de DS, AI y ML.



Hay muchas formas de visualizar datos. Dado que somos programadores, nuestro principal método de visualización de datos debería ser escribir el código apropiado. Es rápido y no requiere la compra de herramientas especializadas. Al escribir código para la visualización de datos, puede usar muchas bibliotecas gratuitas y de código abierto creadas para los lenguajes de programación que usamos. Por ejemplo, existen bibliotecas de este tipo para Python. Estos son Matplotlib, Seaborn y Bokeh. Aquí hay un video tutorial sobre Matplotlib.



Otra forma de visualizar datos es utilizar herramientas de código cerrado. Por ejemplo, Tableau... Existen muchas de estas herramientas y pueden brindarle muy buenos resultados, pero no son gratuitas. Tableau es una de las herramientas más comunes y la uso mucho. Aconsejaría a cualquier persona involucrada en el análisis y la visualización de datos que aprenda Tableau. Aquí hay una buena guía para esta herramienta.



Inteligencia artificial y aprendizaje automático



AI y ML se pueden considerar subsecciones de DS, ya que se basan en datos. AI y ML son tecnologías que se basan en enseñar a las máquinas a comportarse de manera similar al comportamiento humano. Para ello, se utilizan datos especialmente preparados, transmitidos a las máquinas. Los modelos de computadora pueden enseñar mucho sobre lo que los humanos son capaces de hacer. Para hacer esto, son entrenados y guiados hacia el resultado deseado. En este caso, las "máquinas" pueden percibirse como niños pequeños sin absolutamente ningún conocimiento. A estos niños se les enseña gradualmente a identificar objetos, a hablar. Aprenden de sus errores y, a medida que aprenden, comienzan a resolver mejor las tareas que se les asignan. Este es el caso de los automóviles. 



Las tecnologías de IA y ML son las que dan vida a las máquinas utilizando una variedad de algoritmos matemáticos. La humanidad aún no conoce los límites de las capacidades de estas tecnologías en constante mejora. En estos días, las tecnologías de IA y ML se utilizan ampliamente para resolver problemas cognitivos. Se trata de detección y reconocimiento de objetos, reconocimiento facial y de voz, procesamiento de lenguaje natural, detección de spam y detección de fraude. Esta lista se puede continuar durante mucho tiempo.



Una historia más detallada sobre IA y ML merece una publicación separada. Mientras tanto, puedo recomendar este video sobre cuestiones generales de la aplicación de estas tecnologías. Pero aqui- Horas de videotutorial sobre aprendizaje automático. Al trabajar con estos videos, puede adquirir conocimientos de ML que coincidan con el nivel principiante o incluso intermedio. Aprenderá sobre los muchos algoritmos de aprendizaje automático existentes, cómo funcionan y cómo usarlos. Después de eso, debe tener suficiente conocimiento para comenzar a crear sus propios modelos ML simples. Puede leer sobre cómo hacer esto aquí .



Explore formas de publicar modelos de AA en línea



Existen herramientas que le permiten publicar modelos de AA en Internet. Esto le permite dar acceso a todos. Para publicar modelos en Internet, necesita una buena comprensión de los procesos de desarrollo web. El punto es que "publicar un modelo" significa crear una página web (o un grupo de páginas) que le permite trabajar con el modelo en un navegador. Además, debe tener en cuenta el hecho de que el frontend del proyecto, su interfaz, debe intercambiar datos con el backend, con la parte del servidor del proyecto, donde se encuentra el modelo en sí. Para crear dichos proyectos, debe poder crear API del lado del servidor y utilizar estas API en el lado del cliente de las aplicaciones.



En el caso de que planee publicar modelos en la nube, si va a utilizar la tecnología Docker, necesitará un buen conocimiento del campo de la computación en la nube y DevOps.



De hecho, hay muchas formas de implementar modelos en Internet. Sugeriría comenzar aprendiendo cómo hacer esto usando el marco web Flask basado en Python. Aquí hay un buen tutorial sobre esto.



Encuentra un mentor



El autoaprendizaje es genial, pero nada mejor que aprender de los profesionales. El caso es que con este enfoque se asimila lo que se usa en la realidad, y es así como el aprendizaje pasa por la práctica. Muchas cosas solo se pueden aprender con la práctica. El coaching tiene muchas fortalezas, pero debe tenerse en cuenta que no todos los mentores pueden tener un impacto significativo en su carrera o vida. Por eso es muy importante encontrar un buen mentor.



Por ejemplo, puede intentar resolver este problema utilizando la plataforma Notitia AI .... Aquí, a los estudiantes se les asignan mentores personales que hacen contribuciones personales y profesionales al desarrollo del estudiante. Los mentores llevan a aquellos que quieren aprender desde principiantes hasta expertos en las áreas de DS, AI y ML. Notia AI también es la plataforma más asequible de su tipo.



Salir



Tenga en cuenta que estudiar cursos, leer artículos y ver videos no lo convertirá en un científico de datos. Deberá estar certificado por una institución especializada. Además, algunas vacantes requieren ciertas calificaciones educativas. Invierta tiempo en autoaprendizaje, obtenga una certificación o obtenga sus credenciales de educación y estará listo para el trabajo real.



¿Qué crees que uno necesita saber y poder aspirar a convertirse en un valioso experto en los campos de la inteligencia artificial o el aprendizaje automático?






All Articles