En el artículo, presento los cursos y libros que me parecen más óptimos para aprender el aprendizaje automático / ciencia de datos desde cero. Intento dar una lista que será lo más corta posible y al mismo tiempo dar todos los conocimientos necesarios para empezar en la práctica, sin serias lagunas de conocimiento.
Descargo de responsabilidad
Puedes entender en qué se basan estas recomendaciones leyendo los artículos anteriores, que describen mi camino y principios de autoaprendizaje, así como consideraciones generales sobre cómo construir las etapas de aprendizaje:
Articulos anteriores
Las pautas de este artículo quedarán obsoletas y, sin duda, ahora hay excelentes cursos y libros que podrían incluirse en él. Pero estos son al menos algunos de los mejores materiales sobre sus temas. Para elaborar esta lista se descartaron decenas de cursos y libros, que también están orientados a aprender desde cero, pero son peores a la hora de presentar conceptos fundamentales.
Las directrices no cubren todas las habilidades técnicas potencialmente necesarias. Para tener una idea de todo lo que probablemente sea necesario dominar, consulte Aprendizaje de la ciencia de datos desde cero: hitos e hitos.
No estoy citando materiales sobre redes neuronales porque, en la mayoría de los casos, considero ineficaz comenzar a aprender con ellas o estudiarlas en las primeras etapas del autoaprendizaje.
Se requieren habilidades básicas
Conocimientos básicos de programación: Python y SQL
Es imposible hacer aprendizaje automático o ciencia de datos sin competencia en programación en Python o R (mejor comenzar con Python). Además, la gran mayoría de las vacantes en el aprendizaje automático "clásico" (resolver problemas comerciales y trabajar con datos inicialmente numéricos / estadísticos) requerirán conocimientos de SQL. Para obtener pautas básicas sobre cómo aprenderlos, consulte Autoaprendizaje en ciencia de datos, de cero a senior en dos años .
Matemáticas
. , , , .
, - : ( ), (, , , ), , .
: . , 2 3 . 2 3 , . Math for machine learning, London Imperial College.
( , ), , : Robert Ghrist. . coursera.org, stepik.org
,
Datasmart ( ) - . , data science. , , . , python, pandas, scikit-learn - ( , .. ).
. . ( , .. , , ). - (). , .
— 8 , 2 — seaborn ( , ).
Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking, by Foster Provost ( ) - , , . Datasmart, . " " () . , ..
, - , / - . .
, , , . . , .. , , . . , .
" " - , . -, . , . Python, Pandas, scikit-learn.
- , Python. Applied DS with Python ( 1 3. 2, 4 )
, ( jupyter, pandas). , , . , - .
https://stepik.org/course/4852/syllabus
« » ( " " ). 3 , , 1 , . , ; . 4 , , , , .. , .
Kaggle : ( ) , , , ( .. ). - , , , .
scikit-learn - . , .. .
pandas, - , . , . , .
Python python standard library - . , . , collections itertools
-
( ). . , , : https://www.coursera.org/learn/competitive-data-science. kaggle - .
,
- . - -.
, - , Goodhart's law. .
/
, , https://towardsdatascience.com; 3 .
Statistics Done Wrong .The woefully complete guide by Alex Reinhart - . .
Python Machine Learning, by Sebastian Raschka - , . .
, - .
Git - . - Ry's Git tutorial. git. : http://ndpsoftware.com/git-cheatsheet.html
https://www.practicaldatascience.org/ - . , , , ( Cloud , .. , ).
?
. , , - , - /, , , , - , . - .
/
, , , .
, - self.development.mentor gmail.com,
Algunos se dieron cuenta de que era mejor para ellos ir a otra área (programación, gran cita), algunos pudieron ajustar el plan de estudios / plan de carrera para las necesidades individuales, a algunos les aconsejé a quienes podrían ayudarlos mejor y salvé a alguien (? ) Por el tiempo de gasto ineficaz para proyectos sin salida.
Y si mis artículos son útiles para ti, también puedes motivarme económicamente para futuros artículos, debajo de este artículo debería haber un botón de "donar" para estos propósitos.