Qué lenguaje usar para el análisis de datos es el tema más trillado y doloroso. Por ello, nos asociamos con Alexei Seleznev, jefe de analítica de Netpeak y autor del canal de telegramas R4Marketing , y preparamos una comparativa de operadores SQL y verbos del lenguaje R. Para mayor comodidad y portabilidad, lo hicimos en tarjetas.
Publicamos materiales aún más interesantes sobre programación y análisis de datos cada día en nuestro canal de Telegram y en el grupo VK . Quizás encuentres algo interesante para ti.
Sin embargo, ¡al grano!
R vs SQL
Lo primero que debe hacer antes de hacer una comparación es repasar las instrucciones SQL básicas. Por supuesto, todos los recuerdan, pero de repente ...
Consideraremos la declaración SELECT de DML (lenguaje de manipulación de datos) y todo lo relacionado con ella:
La propia sentencia SELECT gobierna qué campos seleccionar de la tabla
La cláusula FROM apunta a la tabla desde la que se realiza la selección
La cláusula WHERE filtra la tabla por los valores de una columna en particular
GROUP BY especifica campos de agrupación para calcular características de agregación
El operador ORDER BY ordena las filas de la tabla por valores en alguna columna
, . R? - dplyr R ( ), .
dplyr ( tidyverse) , , :
, ,
dplyr tidy data
( %>%)
, SQL dplyr:
, , dplyr . - , :) , (.. dplyr - tidyverse) . :
Tidy data
tidy data. , 100% .
, , « »:
Data Analysis:
«» , «» -.
tidy datasets dplyr !
, tidy data .
%>%
, R - %>%. , , tidyverse.
- .
, - 2 : R, SQL, - . R - , - .