Les outils d'analyse Web open source les plus puissants? [fermé]

10

Besoin de conseils sur le choix des outils d'analyse Web open source, notamment le balisage de page et le type d'analyse de fichier journal. Je connais certains d'entre eux: piwik, open web analytics, awstats et plus ... quels sont les meilleurs d'entre eux (type de marquage de page et type d'analyse de fichier journal)?

Mickey Shine
la source

Réponses:

11

Dans le domaine de l'analyseur de fichiers journaux, ce sont les plus utilisés:

  • AWStats
  • Webalizer
  • Analogique
  • W3Perl

Analog et Webalizer sont écrits en C et sont les plus rapides (10000-20000 lignes par seconde).

Comme mentionné précédemment par @MadHatter Analog a été développé par un ancien statisticien de Cambridge, ce qui fait d'Analog un outil vraiment précis et technique, mais depuis l'année 2005, il n'est plus développé.

Webalizer n'est plus développé mais il est plus facile à utiliser qu'Analog.

AWStat et W3Perl sont écrits en Perl et ce sont les projets les plus actifs, mais ils sont plus lents que Analog et Webalizer (3000/4500 lignes par seconde). Ils diffèrent les uns des autres pour les données produites et la façon dont les données sont rendues.

AWStat affiche les statistiques d'une manière vraiment attrayante, mais produit moins de statistiques que W3Perl.

Je vous conseille ces liens pour plus d'informations:

http://www.aardal.com/stats/docs/uk/speed.html
http://www.w3perl.com/
http://awstats.sourceforge.net/

Mon conseil est:

  • W3Perl si vous voulez des statistiques granulaires et que vous n'avez pas trop de Go de fichiers journaux
  • AWStat dans le cas où vous avez besoin de ne pas avoir trop de Go de fichiers et que vous voulez une belle représentation graphique.
  • Webalizer si vous avez des tonnes de fichiers journaux à analyser.
  • Analogique si vous avez besoin de statistiques vraiment précises, d'énormes fichiers journaux et que vous avez une expérience en développement C (ou si vous connaissez quelqu'un qui peut vous aider).

En ce qui concerne le balisage de page Le gagnant est sûrement Google Analytics, les données collectées et produites sont meilleures que les autres solutions, mais comme un jour peut arriver, Google demandera de l'argent pour cela ...

W3Counter et Xiti sont des fournisseurs qui vous demandent, pour la version gratuite, d'installer une image sur chaque page Web que vous souhaitez surveiller. Les deux sont destinés aux petits sites.

Open Web Analytics et Pikwik sont d'excellentes solutions open source. Les deux sont assez matures et stables mais ils nécessitent une base de données MySQL et un support PHP.

Si vous n'avez pas besoin d'une solution «maison», je choisirais définitivement Google Analytics et entre les projets open source, je choisirais Open Web Analytics car il est plus mature que Piwik.

tmow
la source
5

Je suis très satisfait de piwik. Je manque juste la possibilité d'ajuster les widgets en fonction du site Web. Je l'utilise pour vérifier mes sites Drupal et il y a aussi un module pour Drupal.

groovehunter
la source
1

Pour mon argent, le meilleur outil d'analyse de journal est analogique . Il est incroyablement rapide (les recherches DNS modulo, qui sont également lentes pour tout le monde), sont écrites par un ancien statisticien de Cambridge et ont une page très utile vous expliquant - et à votre direction - ce qui peut et ne peut pas être correctement connu à partir de vos journaux Web, malgré les réclamations commerciales bizarres.

Je ne peux pas commenter le balisage de page, cependant; Désolé.

Chapelier Fou
la source
Il semble qu'Analog ne soit pas mis à jour depuis l'année 2005, si c'est le cas, il ne reconnaît pas correctement certains en-têtes http.
tmow
Vous pouvez avoir raison; comme quoi?
MadHatter
1

Il s'agit d'un logiciel expérimental, mais néanmoins assez impressionnant:

Hummingbird vous permet de voir comment les visiteurs interagissent avec votre site Web en temps réel. Et par «temps réel», nous ne voulons pas dire qu'il se rafraîchit toutes les 5 minutes: les WebSockets permettent à Hummingbird de se mettre à jour 20 fois par seconde. Hummingbird est construit sur Node.js, une nouvelle boîte à outils Web javascript qui peut gérer de grandes quantités de trafic et de nombreux utilisateurs simultanés.

miku
la source
1

Je dirais (même si je suis partisan en tant que co-fondateur ;-) que SnowPlow est l'outil d'analyse Web basé sur le balisage open source le plus puissant du marché.

SnowPlow a une architecture distribuée faiblement couplée qui utilise Hadoop et Hive, donc elle évolue vers des millions voire des milliards d'événements - c'est quelque chose qu'aucune solution MySQL ou autre solution basée sur SGBDR ne peut faire.

L'autre grande innovation de SnowPlow est que vos données d'événement sont stockées dans une structure de "fichier plat" atomique propre, immuable, dénormalisée - en d'autres termes, un entrepôt de données analytiques. Cela permet de nombreuses analyses très sophistiquées à l'aide de Hive, ainsi que des jointures simples avec vos données tierces (par exemple, CRM ou données de vente). Encore une fois, c'est plus puissant que d'autres solutions, qui ont tendance à réduire les données atomiques en agrégats, à tronquer les anciennes données ou à utiliser des structures normalisées à gratter la tête qui sont vraiment difficiles à interroger directement ou à joindre à d'autres sources.

Vous pouvez en savoir plus sur l'architecture technique de SnowPlow ici .

Alex Dean
la source
0

Boomerang est le meilleur outil disponible pour l'analyse des performances côté client - mais ce n'est que l'agent js - je ne connais aucun outil de reporting standard , Pastmon est utile pour les trucs de réseau, Piwik et AwStats que vous avez déjà mentionnés. Analog est un outil très similaire à AwStats - traitement moins configurable mais beaucoup plus rapide.

Si vous cherchez à déployer votre propre solution, il existe des données IP gratuites sur la localisation disponibles

symcbean
la source
0

Je connais des gens qui utilisent Webalizer pour l'analyse des journaux de sites Web. Juste pour mentionner une autre option.

Il y a aussi cette discussion sur les possibilités.

oherrala
la source
1
Webalizer n'est plus développé activement, je crains de perdre inexorablement sa part de marché.
tmow
0

Après quelques recherches sur les packages d'analyse Web open source, je pense que les gagnants sont clairement http://www.openwebanalytics.com et http://piwik.org/

La raison étant la facilité d'utilisation, les capacités d'installation en temps réel.

Une caractéristique impressionnante que je voudrais mentionner est la carte thermique générée par openwebanalytics.

dcode
la source
Quelques détails supplémentaires sur les candidats et comment le gagnant a été élu?
vonbrand