Fiabilidad de datos en webs de grandes volúmenes de datos
Google Analytics es un software gratuito genial. Incluso grandes empresas con enormes volúmenes de tráfico utilizan Google Analytics. Citaría entre ellas webs del Grupo Intercom, Engrande y un largo etc.
Empresas que en su cultura de empresa, un tanto googlelianas, prefieren la inversión en el recurso humano y sus habilidades, que en las herramientas de pago. Google Analytics es su herramienta.
¿Pero hasta que punto los datos que procesa Google Analytics para una cuenta con miles y miles de visitantes y páginas vistas son fiables?
Google Analytics avisa que a partir de un cierto número de visitas (largos volúmenes de tráfico) ya no puede procesar la información con máxima fiabilidad. O sea, que los reportes que observamos, son estimativos. Al lado de cada informe te ofrece una estadística aproximada de la fiabilidad del informe (+-2% por ejemplo)…
¿Que significa eso? Efectivamente significa que la información procesada ya no es tan real. Que eso es importante, porque una vez un informe ya está distorsionado, lo están todos.
Una vez no sabemos si el número de páginas vistas es el correcto, esto empezará a afectar el medimiento correcto de las acciones comerciales que realizamos, o sea, de las campañas de publicidad y acertar a calcular el retorno de la inversión, mucho más difícil.
Está claro que los datos, aún con volúmenes de tráfico mínimos nunca (y digo nunca) son exactos. ¿Ésto significa que el programa no vale?. Todos los programas de Analítica web ofrecen discrepancias a la hora de medir resultados. Esto lo hemos visto en todas partes. No siempre hay que obsesionarse con la exactitud de un número sino saber entender la tendencia que provocan nuestros acciones para mejorar tráfico y conversión.
Pero seguro que estaréis de acuerdo conmigo que no es lo mismo tener una discrepancia de datos del orden de un 10% en un volumen de tráfico de 5,000 usuarios únicos diarios, que una discrepancia del 10% en un volumen de tráfico de 150,000.
Ayudaría, queda claro, una unidad o una unificación en los criterios de métricas en el campo de la analítica web, una misma bara de medir que nos permita evaluarnos y evaluar a nuestra competencia, no solo a nivel de audiencia (Nielsen)…
Es frecuente también ver incongruencias en informes de contenido cuando se tiene un gran volumen de tráfico. Google Analytics pone un límite al análisis de visualizaciones de url´s. Pongamos por ejemplo que estamos en la cuenta de “idealista.com“. Cada ficha de cada inmueble, cuenta como una url única y distinta. Si se supera el límite (y en teoría está en los 50,000 diarios, pero eso fluctúa mucho, desgraciadamente para menos) Google Analytics empieza a no procesar la información.
Por ejemplo, en el informe de contenido llamado “drill drown” una vez ya ha procesado el número de urls de un día, empieza a clasificar toda las url´s bajo una carpeta llamada “others”. Cuanto más volumen de tráfico y más url´s visualizadas, mayor será el número de urls que veremos procesadas en ésta carpeta.
Habremos también aprendido las discrepancias entre los resultados de e-commerce y los resultados de las campañas, como ya hablamos en otro artículo.
La conclusión esencial es que todo tiene límites en la vida y también en Google Analytics. Las webs que procesen niveles muy altos de información, si quieren sacar conclusiones de calidad, o bien invierten en analistas de primera línea o empiecen a trabajar con otros programas de analítica web más avanzados: sean ya webtrends, index tools o Omniture.
If you enjoyed this post, please consider to leave a comment or subscribe to the feed and get future articles delivered to your feed reader.
Comments
Uno de los sitios que administra la empresa para la cual trabajo tiene varias páginas (html individuales) que superan las 500.000 impresiones por mes y no tienen ese aproximado que mencionan, incluso la home llega a casi 3 millones y tampoco lo tiene, lo que si es cierto es el punto que a mayor cantidad de datos mayor es la demora en actulizar la info.
Saludos
Lamento que las cosas vayan así para República Dominicana. Aquí en España, tampoco van tan bien como quisiéramos en nuestro sector.
Por cierto, muy interesante tu blog. Esperamos que las cosas mejoren tanto en un país como en el otro.
Muchos saludos a los que lean este blog de República Dominicana!
Hola Esteban, yo me refería a visitas diarias, no mensuales. 500,000 impresiones por mes, no está nada mal, pero no tiene nada que ver con volúmenes de tráfico de 500,000 visitas al dia…que son millones y millones de impresiones al mes…
Lo que comentas del “other” sin dejar de ser cierto se puede llegar a solucionar de diferentes maneras. La que prefiero consiste en aplicar filtros para agrupar datos y crear perfiles auxiliares para mostrar el detalle de esos datos agrupados. Seguirás sin tenerlos agrupados en un solo perfil, pero al menos los podrás desglosar.
Si es cierto, lo del “other” no solo se puede solucionar así, sino también con la función tracking pageview para agrupar datos, según el tipo de web, queda claro, pero son muchas las empresas y hablo de las grandes, que ni tan siquiera tienen analistas en plantilla, ni tampoco están dispuestos a pagar por una configuración avanzada que les minimice las discrepancias, ni por supuesto tienen el tiempo como para estudiar las funcionalidades avanzadas de google analytics…
Pero en este caso, si es cierto, que tiene solución…
Creo y tuvo que ser en tu blog (o el de webanalytics) que lo importante es una persona que entienda los datos, más que la herramienta en sí.
Si se pueden tener ambas, pues mucho mejor, pero creo que lo importante es un analista, pues con Google Analytics se puede obtener bastante información que bien utilizada, puede llevar a una mejora sustancial tanto de la usabilidad, como del ROI.
Saludos!
Me gustaría saber cual es el tamaño que permite google analytics, por ejemplo una cuenta gratuita de otro servicio puede guardar 500 en el log.
Recuerdo hace unos años cuando me comentaron que todavía a finales de los 80 una de las técnicas de medición de audiencias en TV se basaba en la cantidad de agua en la canalización de desagües en los descansos publicitarios porque la gente iba al servicio durante el intermedio. Y hoy, la precisión de las técnicas de medición online son tan finas que hacen que “nos preocupemos” por errores del 5%. Imagino que algunos marketeros de la antigua escuela no podrán evitar esbozar una sonrisa…



En mi pais, Republica Dominicana, ni invierten en personal ni en su capacitacion, y mucho menos en programas de pago, dan a conocer estadisticas antojadisas, sin un personal que las desglose de manera profesional, solo para darles un manejo burdo y tratar de embaucar a los demas con las supuestas mediciones que hacen de sus sitios.
Saludos desde Republica Dominicana, siempre ando leyendo por aqui.
[reply this comment]