Lexpage ? ... +1    —  galabriel

Discussions

Statistiques Lexpage juin-juillet-août

Guybrush 7784 Bob
Je sais que Roidelapluie est friand des statistiques Lexpage, et avant qu'il ne subisse des insomnies par manque de stats, à venir crier sur le minichat "à quand les stats ?", je les publie :-D

Les statistiques concernent la période juin-juillet-août, et sont collectées - pour rappel - par Piwik et sa clique.

Volume

Piwik nous informe que vous êtes plutôt nombreux encore depuis la v4 à venir sur Lexpage. Au total, sur cette période de 3 mois, il y a eu 6359 visites (70 en moyenne quotidienne) pour 25473 pages vues (289/jour).

La durée moyenne des visites est plutôt élevée : 6 minutes et 51 secondes. Cependant, cela ne tient pas compte des 31% de visiteurs qui ont survolé le site (une seule page vue, même si cela inclut aussi de véritables visites vu que "tout" est sur la page d'accueil !). En moyenne, le site répond assez rapidement (surtout depuis le VPS :-D) avec 0.68s de délai de génération moyen.

En terme de progression de visites, c'est relativement faible. Les 15 premiers jours de juin sont plutôt faiblards (+/- 55 visites/jour) alors qu'il y a eu une belle progression en août (avec de nombreux flirts dans les 90/jours).


Périphériques

Un peu moins de 85% des visites sont effectuées depuis un "vrai" ordinateur (j'inclus les macs là-dedans :-D). 9% des visites se font depuis un smartphone, mais seulement 6% des visites se font depuis une tablette. Il faut voir le bon coté des choses : 15% des visites se font depuis un appareil mobile. Je pense que c'est plus du double de ce qu'on avait avec la v3 qui n'était pas du tout prévue pour ce type d'appareils, c'est donc une excellente nouvelle :-)

Du coté des marques, on retrouve en tête Apple, suivi de LG, Google, Samsung, HP, Nokia, Motorola, HTC et Wiko. Si on souhaite être plus précis sur les modèles, Piwik nous informe que l'iPad représente 3.9% des visites, le D802 (?) 2.4%, le TouchPad 1.8%, le Nexus 4 1.5%, l'iphone 1.3%, le GT-N7100 1.3%. On retrouve ensuite le Lumia 925, l'XT1032 et le Nexus 5 à moins de 1%.

Systèmes et navigateurs

Du coté des systèmes d'exploitation, on note une forte dominante de Windows (60% !). Curieusement, même si on est sur un site de geeks, c'est la famille Linux qui suit avec 14.2%, suivi des Mac avec 11.9%. On retrouve les appareils mobiles via Android (7.6%) et iOS (5.2%). Windows Mobile ferme ce podium avec 0.8% des visites. Windows 7 génère encore et toujours deux fois plus de visites que Windows 8.

Firefox et Chrome se partagent (respectivement 45.7% et 42.6%) la tête du classement des navigateurs, suivi par Safari (5%) et IE (4%). Du coté du support des technologies, les cookies sont supportés par 100% des visites. Flash par 85% des visites, Java par 75% des visites et le pdf intégré par 72%. Les technologies en dessous des 50% sont Silverlight, Windows Media, Quicktime. Le reste est anecdotique.

Situation géographique

S'il est évident que la majorité des visiteurs viennent d'Europe (90.4%), la répartition est relativement naturelle aussi : 47% des visites viennent de France, suivie par la Belgique (32%). On retrouve ensuite l'Allemagne (8.2%), le Canada (6.8%) et les USA (1.9%) ex-aequo avec la Grande-Bretagne. Au total, les visiteurs proviennent de pas moins de 33 pays.

Comportement

On pourrait détailler pendant des heures ce qu'on peut déduire à partir du "flux de visite" sur le site, mais je vais juste donner quelques tendances. La page d'entrée du site est bien entendu la page d'accueil (78%). Vous êtes encore 14.6% à utiliser l'adresse "go.php" pour accéder au site (y a une redirection, heureusement). Le forum regroupe 4.8% des accès directs, suivi des billets (1.9%, vous ne partagez pas assez les billets sur les réseaux sociaux !! :-p).

De façon générale, c'est la page d'accueil qui enregistre, parmi ces "premières pages", un taux de rebond (départ du site après une seule page) plus faible (28%). Il est probable que les autres pages soient accédés via des liens directs présents sur d'autres sites et que ces pages présentent l'unique information que le visiteur soit venu chercher.

Les sujets du forum qui génèrent le plus d'entrées (et donc potentiellement ceux qui sont les mieux référencés) sont le sujet sur Elite Dangerous, le sujet sur les VPS d'OVH, le sujet sur la Coupe du monde 2014, le sujet sur le jeu South Park et enfin, le sujet sur les jeux dématérialisés.

Ce sont, à peu de choses près, les sujets les plus consultés sur le site dans l'absolu : les pronostics arrivent en tête (8.4% des vues), ALDP ensuite (5% des vues), Elite Dangerous (3.7%), les jeux démat' (3.3%) et la coupe du monde (1.6%).

Référents

Enfin, on finira ces statistiques par quelques informations sur la provenance des visiteurs. Il y a eu 5938 (93%) visites en entrée directe. Le reste, c'est partagé entre les moteurs de recherches (6%) et les sites internet (1%) divers. De façon générale, il est clair que l'accès direct "rapporte" plus : les visites durent plus de 7 minutes en moyenne, contre seulement 2 minutes 47 pour les moteurs de recherche, et 2 minutes 26 pour les sites affluents.

Les sites internet nous apportant le plus de visiteurs sont Kraland (13 visites) et Etnoka.fr (11 visites, j'avais vérifié : c'est un ancien lien vers le Purity Test !). Les autres sites se partagent en général 1 à 2 visites maximum, et beaucoup sont peu pertinents. Les réseaux sociaux ne nous apportent pas grand chose : Twitter représente 3 visites, Vimeo 2 (un lien dans un commentaire de vidéo postée sur Lexpage, il me semble) et Facebook un seul et unique visiteur.

Du coté des moteurs de recherche, Google truste la première place avec 98.1% des accès. Google Images représente 0.6% comme Yahoo!. Bing arrive ensuite avec 0.3%, sur la même marche que DuckDuckGo et que "Google Custom Search".

Je sais que vous appréciez particulièrement les mots clés ayant servi à rejoindre le site. Malheureusement, cette information devient de moins en moins disponible, n'étant plus systématiquement fournie par les moteurs de recherche (notamment Google). C'est ainsi que 91.2% des visites depuis un moteur de recherche n'ont pas fourni de précisions quant au mot-clé utilisé. Dommage ! Parmi les mots restants, qui ne dépassent pas la visite unique, malheureusement, on retrouve, en vrac (forcément) et en ne gardant que les "originaux" :
dekdouk mamine, desamorcer la bombe chatomique, fellation billets, femme chaude, geoffrey coulon namur, gifs colombes pour la paix, jedi barbecue, milo moiré film x, porn video fellation baleares, cartoon livreur espace.

On voit que les sujets "tendancieux" de certains de nos billets continuent de classer le site à une bonne place sur Google :-D

roidelapluie 339 Maitre jedi
Merciii d'assouvir ma soif de savoir :)
Guybrush 7784 Bob
De rien :-)

D'autres détails sont disponibles, si quelqu'un les souhaite.
roidelapluie 339 Maitre jedi
GuybrushDe rien :-)

D'autres détails sont disponibles, si quelqu'un les souhaite.
Tu as des stats sur les flux rss? c'est mon moyen favoris de 'consommer' le Lexpage...
Guybrush 7784 Bob
A priori, aucune. Il n'y a pas de "comptage" associé au flux.
Je peux par contre regarder du coté du VPS si je log quelque chose à ce niveau, mais la portée des logs dépassera par la semaine. Tu veux quand même ?

Il faut que je fouille un peu dans Piwik, parce qu'effectivement, j'aimerai :
(1) Associer les flux RSS, mais "à part" (juste pour avoir un tracking sans que ça ne compte dans les "vues" classiques).
(2) Pouvoir créer une classe de visiteurs "lexpagiens" afin de pouvoir, si nécessaire, distinguer les statistiques entre les membres inscrits et les non-inscrits. Je crois que ça, contrairement au (1), ça doit être simple à faire en modifiant le code du tracker si la personne est logguée.


L'une des choses que ces statistiques m'apprennent sur les lexpagiens, c'est que vous ne venez pratiquement jamais le week-end (et déjà moins le vendredi en fin d'aprem, contrairement aux autres jours). Les heures "locales" de visite permettent aussi de voir que vous consommez Lexpage essentiellement durant vos pauses (logiques, mais c'est la même proportion en soirée, et ça, c'est plus intéressant) : un peu vers 7h, un peu plus vers 10h - 10h30, beaucoup plus vers 13h, encore davantage vers 16h. Il faut ensuite attendre 18-20h pour atteindre le même trafic que la tranche 13 + 16.

J'ai pu voir aussi que vous êtes tout de même plutôt nombreux à consulter les "Lire la suite" des billets, même si le lien menant à la vidéo (par exemple) est déjà disponible dans le chapeau. J'en déduis donc que l'embed est intéressant, et que le choix d'un mélange brève/news pour le format des billets est une bonne approche.
roidelapluie 339 Maitre jedi
GuybrushA priori, aucune. Il n'y a pas de "comptage" associé au flux.
Je peux par contre regarder du coté du VPS si je log quelque chose à ce niveau, mais la portée des logs dépassera par la semaine. Tu veux quand même ?

Il faut que je fouille un peu dans Piwik, parce qu'effectivement, j'aimerai :
(1) Associer les flux RSS, mais "à part" (juste pour avoir un tracking sans que ça ne compte dans les "vues" classiques).
Je suis curieux des user-agents et de la fréquence de polling, voire du nombre de gens qui les utilisent :-) mais y a pas grand chose d'autre à en tirer.
Guybrush 7784 Bob
C'est majoritairement (99% à vue de nez) du Tiny RSS, avec une fréquence d'environ 5 minutes entre deux refresh (parfois plus, rarement moins). J'ai regardé que dans les logs des 2 derniers jours, ça limite la qualité des stats :-D

C'est moitié-moitié sur la partie billets, et l'autre moitié sur le forum. Y a encore quelques requêtes (très rares) sur l'ancienne adresse du flux RSS (v3).
Tchou 3291 Bob
Le soucis du tracking de flux RSS, c'est que c'est juste le bordel à comptabiliser ! C'est relevé à des fréquences différentes, tu ne sais pas si la personne l'a effectivement lue ou si ça a juste été ramassé dans le gros stock de trucs à parser (j'ai perso des liens RSS de sites morts depuis des années), et tu ne sais pas si c'est une appli, un site, ou un browser.

Et quand bien même tu le chopperai (via une lecture des logs), comment lier la lecture du flux dans une appli au navigateur qui va ensuite lire le lien présent ? Y'a pas de solution à part faire dans le crade et avoir des flux "personnalisés" avec des identifiants uniques dans les liens, et dans piwik retrouver quand cet identifiant correspondant à une personne et à un flux est appellé. C'est crade, ça va à l'encontre de la philosophie simple du RSS, mais ça se fait par certaines régies de pub.

Après, une solution reste dans la lecture des logs et pourrai être sous la forme d'un truc du genre (attention, je préviens les allergiques, pluie de hiéroglyphes en approche) :
zgrep ".rss " /cheminversfichiers-access.log* | cut -d " " -f 1,7  | sort | uniq -c | sort -n -r | head -40
(ça lit tous les .log qu'a fait tourner logrotate, ne garde qu'IP et page demandée (peu utile dans ce cas, mais j'avais ce code sous la main), et trie par occurrences)

Pour chopper l'UA, c'est plus chaud vu que l'UA peut avoir un sacré paquet d'espaces dedans, mais en triffouillant ça doit pouvoir.

Pour la fréquence de polling, faudrai pour chaque couple IP/UA trouvé noter la date et l'heure et trouver un pattern (excluant les heures d'arrêt de l'agent). Galère, mais faisable ... mais chiant pour peu d'utilité au final.

Ps : analyser les logs pour "profiler" les gens : la CNIL (ok, c'est pas pour vous les Belges) a émis une recommandation allant fort logiquement à l'inverse de ça (en préconisant par exemple de sucrer le dernier chiffre de l'IP pour anonymiser). Donc oui, c'est faisable, mais bof.

edit : et voilà, me suis fait ridiculiser car il l'a fait pendant que j'écrivait mon wall of text ! :D


Ce message a été modifié 1 fois. Dernière modification : 22 septembre 2014 à 12:35 par Tchou.

roidelapluie 339 Maitre jedi
GuybrushC'est majoritairement (99% à vue de nez) du Tiny RSS, avec une fréquence d'environ 5 minutes entre deux refresh (parfois plus, rarement moins). J'ai regardé que dans les logs des 2 derniers jours, ça limite la qualité des stats :-D
Ok, donc ya que moi qui l'utilise :D

Guybrush 7784 Bob
Ca n'a pas l'air de marcher avec les logs Nginx ? Pas trop le temps de regarder pourquoi (j'ai un résumé ALDP à faire :-p).
Mais j'pense que RLDP doit être un peu seul à utiliser le flux RSS :-)

Répondre

Vous devez être inscrit et identifié.