Sin cookies, sin problemas: uso de ETag para rastrear usuarios

Como consultor senior de análisis digital en una agencia líder mundial de análisis, veo con gran interés la actual cruzada de los navegadores web modernos contra la tecnología de cookies.



Resulta que hay una manera de rastrear a los usuarios no conectados sin usar cookies. He implementado esto también. Ahora te mostraré cómo.





Para mayor claridad, creé un sitio de demostración. Aquí está él.



Haga clic en cada uno de los tres botones Página → Los tres tienen el mismo identificador.

Cierre la ventana del navegador y vuelva a abrir el sitio → El identificador no ha cambiado.

Apague su computadora y visite esta página web mañana → La ID sigue siendo la misma.

Verifique sus cookies → El sitio de demostración no escribe ni lee cookies.

Comprobar URL -> No hay cadenas de consulta cuestionables.



Entonces, ¿cómo puedo almacenar exactamente el identificador y descubrir que usted regresa al sitio desde cierto dispositivo, sin iniciar sesión y sin usar cookies?
Software EDISON - desarrollo web
EDISON .




« » — -, CRM-, , iOS Android.



, : — ;-)

Cookies



Si es un usuario de Internet bastante activo, probablemente haya enfrentado un sinfín de discusiones de una forma u otra sobre las cookies y cómo se utilizan. Hoy en día, las tecnologías del navegador rechazan cada vez más las cookies, especialmente porque ahora todo está estrictamente regulado por reglas de privacidad, como el GDPR o CCPA. Si bien este es ciertamente un progreso, ya que es un paso importante hacia una Internet más orientada a la privacidad, también afecta enormemente la funcionalidad principal de la mayoría de los sitios web, su UX, la estructura económica de Internet y la industria de análisis digital. Si bien técnicamente es muy seguro para el navegador usar una cookie como identificador para el usuario que regresa, existen otras tecnologías web disponibles.basado en el almacenamiento de información en una computadora local.



El rol del caché



Aquí está el caché . Básicamente, el almacenamiento en caché web significa almacenar datos de Internet en su dispositivo, por lo que el navegador puede reutilizar esos datos más tarde cuando se solicite nuevamente el mismo recurso. Por ejemplo, cuando un usuario carga por primera vez una página web, el servidor envía toda la página al navegador. Cuando la página se almacena en caché y el usuario solicita la misma página nuevamente al día siguiente, el navegador la recuerda y el servidor no necesita enviarla nuevamente, la página en el navegador se puede mostrar inmediatamente desde la caché. Es mucho más rápido y proporciona un alto rendimiento. En general, la tecnología de almacenamiento en caché aumenta drásticamente la velocidad de entrega de contenido web y también reduce significativamente la cantidad de trabajo realizado en el lado del servidor.



El almacenamiento en caché se puede hacer usando ETag. Estos son identificadores que se adjuntan a cada recurso proporcionado por el servidor (como una página web o imagen). De esta forma, el servidor determina si el usuario ha almacenado en caché la versión más reciente del recurso. Cuando cambia un recurso en el servidor, se genera un nuevo identificador ETag para ese recurso.



  • Lunes.

    El usuario visita el sitio web por primera vez. → Falta ETag en la solicitud. → La página del sitio se envía al navegador con ETag 123. → El sitio se guarda (almacena en caché) en el dispositivo local.
  • Martes El

    usuario visita el mismo sitio nuevamente → ETag 123 está incluido en la solicitud saliente → El servidor verifica si el recurso ha cambiado ("¿El ID de ETag sigue siendo el mismo?") → Si ETag no ha cambiado, el servidor le indica al navegador: simplemente use el sitio que ya se entregó y almacenado en caché el lunes. → No es necesario volver a enviar el recurso web, se ahorra tiempo y tráfico. Lucro.


Uso de la tecnología de almacenamiento en caché para rastrear e identificar usuarios



Aunque ETag está diseñado específicamente para el almacenamiento en caché, esta característica también se puede piratear y usar deliberadamente para rastrear a los usuarios.



Así es como lo hice en mi ejemplo:



  • Se está creando un sitio web simple con tres páginas.
  • iFrame . iFrame — 1x1, .
  • - iFrame, PHP . , ETag iFrame, .
  • , (, , iFrame), ETag . , ETag.
  • → ETag : , . .
  • → ETag : . ID. .
  • — ETag ID :

    ID / iFrame . , iFrame . JavaScript cookie.






ETag ID iFrame Chrome DevTools.



ETag



Esto puede ser complicado. No utiliza cookies ni almacenamiento local del navegador. Funciona sin JavaScript. Y el User-Agent no se usa.



Sin embargo, los usuarios tienen varias opciones para protegerse contra el seguimiento de ETag:



  • Deshabilite el almacenamiento en caché en la configuración del navegador.

    Tenga cuidado aquí: como se explicó anteriormente, el almacenamiento en caché puede ser muy útil y tiene muchos beneficios.
  • headers .

    headers, , ModHeader. ? ETag . , If-None-Match, , ETag . .










¿Por qué estoy revisando estas cosas? ¿Por qué escribí este artículo? Yo, por supuesto, no tengo la intención de usar esto a gran escala. Pero si bien las personas malas pueden usar ETag, este ejemplo demuestra un punto importante: como la mayoría de las otras tecnologías, ETag por defecto no es necesariamente dañino. Dependiendo del propósito para el que se usa.



Creo que es importante que todos sepan sobre la existencia de tales métodos. Y que pueden ser utilizados. Ha habido bastantes casos en los que los sitios han usado ETag ilegalmente. Algunos de estos incidentes incluso se resolvieron en los tribunales. Y es probable que tales técnicas sean cada vez más utilizadas por la aterrorizada industria publicitaria, que está viendo colapsar uno de sus pilares: el coockie.



Uno de los muchos ejemplos (seguros) de ETag en Internet se puede encontrar, por ejemplo, en la política de privacidad de Wendy con respecto a las cookies y las tecnologías de seguimiento:





ETag puede generar valores de seguimiento únicos incluso si el usuario bloquea las cookies HTTP, Flash y / o HTML5.



Un anuncio como este parece ser un ejemplo de cuántos sitios usan ETag en sus políticas de privacidad. Para ser claros: esto en sí mismo no es malo ni ilegal. Los valores de ETag deben ser, por supuesto, únicos. Este es el objetivo de su trabajo para el almacenamiento en caché. Sin embargo, esta sección es muy vaga y ambigua, especialmente cuando se trata de si estos valores de ETag se usan para el seguimiento o no. Y personalmente creo que esto es un problema. Cuando se les preguntó al departamento de privacidad de Wendy, respondieron con un correo electrónico electrónico estándar de copiar y pegar, confirmando que los ETag no se están utilizando para el seguimiento. La política de privacidad, sin embargo, deja esta puerta abierta de par en par. Y eso es lo que me preocupa.



Creo en la transferencia abierta y transparente de conocimiento en toda la industria, entre proveedores de análisis, editores, anunciantes y usuarios de Internet. En mi humilde opinión, la falta de apertura es una de las principales razones por las que todos nos vimos envueltos en esta guerra sucia con cookies: el ecosistema de Internet siempre ha sufrido una falta de transparencia, la tecnología se está desarrollando demasiado rápido para que la legislación se mantenga al día con ellos, y la gente no entiende las muchas sutilezas de las tecnologías web como las cookies. Y cuando la tecnología se usa de manera incorrecta, el usuario se siente vulnerable. Pero prohibir la tecnología resulta ser un caso clásico de tratar los síntomas, no la causa. El hecho de que muchas compañías tecnológicas están abusando de tecnologías como las cookies,forma una actitud injusta hacia la tecnología por parte del público. Lo que, a su vez, conduce a una acción desproporcionada por parte de los desarrolladores del navegador y la legislación. Si bien estas medidas tienen como objetivo garantizar la privacidad, también perjudican la innovación buena y significativa.



Siempre hay matices. Creo firmemente en la legitimidad e importancia de la analítica digital seria, siempre que se realice con el nivel adecuado de confidencialidad. ¿Qué sucede después de que la tienda ha identificado legítimamente al visitante? ETag ciertamente se puede utilizar para muchos propósitos diferentes. Pero una cosa es segura: este tema nunca será aburrido.



All Articles