Intranet (fermé)

 

Avant-propos

Avant de commencer l’implémentation du marqueur Intranet (fermé), veuillez-vous assurer d’avoir sélectionné le plugin Identifiant visiteur sur domaine configuré en mode « always » depuis l’interface Tag Composer :

first-always
 

Principe

Lors d’un marquage sur intranet fermé (sans connexion externe), les données ne peuvent être transmises directement à nos serveurs de collecte. Il est alors nécessaire de mettre un serveur de collecte local, afin de récupérer les données, qui seront par la suite importées dans notre système.

Schéma de l’architecture à mettre en place pour la mesure d’intranet fermé

La zone colorée en orange représente le réseau interne de l’entreprise dans lequel se trouve l’Intranet. Ce réseau est généralement coupé de l’Internet, aucun accès n’est possible depuis celui-ci.
La zone entourée en vert représente un réseau interne partiellement accessible depuis l’Internet.
1) L’intranaute demande une page de l’Intranet.
2) Le serveur Intranet renvoie le contenu de la page (texte, images, …) plus le marqueur Intranet.
3) Le marqueur Intranet s’exécute sur le poste de l’intranaute, en récupérant quelques informations.
4) Il demande une image sur le serveur Intranet de collecte, en passant en paramètre toutes les informations qu’il a récoltées.
5) Le serveur Intranet de collecte stocke la demande dans un fichier log et renvoie une image de 1 pixel sur 1 pixel.
6) Le serveur de collecte envoie les logs générés sur le serveur ftp, accessible depuis l’extérieur.
7) Le serveur de calcul AT Internet fait une demande de récupération des logs en ftp.
8) Le serveur ftp accepte et envoie les fichiers logs.

La collecte des données se fait sur le réseau interne, sur lequel aucune communication extérieure n 'existe. Ce procédé permet de ne pas ouvrir d’accès depuis Internet, l’ensemble de ce réseau reste donc invulnérable aux éventuelles tentatives d’accès extérieurs.

Quand la collecte des données est terminée, le serveur de collecte envoie ces données (sous forme de fichiers logs horaires) sur le serveur FTP et non l’inverse. L’étape n°6 montre bien que l’on a un flux sortant du réseau interne et non entrant.

Le serveur FTP se trouve sur une zone « web », avec le même niveau de sécurité que les serveurs web hébergeant les sites. On peut néanmoins limiter l’accès ftp de ce serveur pour que seul notre serveur puisse l’interroger (filtre sur IP du serveur AT Internet).

 

Mise en place technique

 

Création du compte / Paramétrage client (AT Internet

  • Création du log spécifique dédié à la réception : un identifiant de site spécifique est attribué à l 'Intranet à la mise en place du process avec le client.
  • Création du compte et du site : un espace est réservé à la réception des données et un robot de récupération des informations est mis en place.
  • Envoi des documents relatifs à la mise en place technique : les documents suivants sont envoyés à la DSI du client pour permettre la mise en place technique :
    • utils/code iso pays.xls
    • utils/aide_configuration_Apache.txt
    • utils/aide_configuration_IIS.txt
    • utils/spacer.gif
 

Mise en place des marqueurs

Suite à la mise en place du serveur tampon, vous aurez alors une adresse de collecte, de la forme suivante :
http://myxiti.intranet.net/spacer.gif

Que l’on peut découper en trois parties :

  1. myxiti : sous-domaine de collecte
  2. intranet.net : domaine de collecte
  3. /spacer.gif : pixel de collecte

Ces trois éléments sont nécessaires afin d’initialiser le tracker correctement :

var config = {
  log: 'myxiti',
  domain: 'intranet.net',
  pixelPath: '/spacer.gif'
}
var tag = new ATInternet.Tracker.Tag(config);

Par la suite, le marquage reste similaire à un site classique.

 

Mise en place de la collecte et gestion des logs

 

Les fichiers de logs

Les fichiers logs sont des fichiers horaires (un par tranche d’heure de la journée), et doivent respecter un format afin d 'être traités. Ils sont en effet traités par les mêmes calculateurs que les fichiers standards gérés par nos collecteurs et doivent donc être formatés sur le même modèle. Le format des logs porte à la fois sur le nom et sur le contenu.

Les fichiers de logs ne doivent contenir que les hits relatifs aux appels de marqueurs. Dans l 'exemple, cela reviendrait à ne prendre en compte que les lignes relatives à ce fichier : « /spacer.gif ». Dans le cas où le serveur est dédié à la collecte des logs Intranet, il suffit d 'extraire la totalité des données (correctement formatées) heure par heure. Si le serveur de collecte traite également d 'autres données, il sera nécessaire de filtrer sur le bon fichier « /spacer.gif ». Dans ce deuxième cas, il peut alors être utile de fournir un libellé facilement retrouvable dans les logs, par exemple « /intranet_hit.xiti ».

 

Paramétrage des fichiers de logs

Les fichiers étant stockés sur le serveur de collecte, il est fortement conseillé d 'effectuer une modification (si nécessaire) du paramétrage du stockage des données de logs. De cette manière, il sera possible :

  • de paramétrer des fichiers de logs spécifiques au marqueur (heure par heure selon le type de serveur et la fréquence de rotation des logs)
  • de formater la chaîne attendue sur chacune des lignes de hits
  • d 'éviter des retraitements post collecte, coûteux en développement et en maintenance

Des exemples de configurations de serveurs Apache et IIS sont fournis dans les documentations :

  • utils/aide_configuration_Apache.txt
  • utils/aide_configuration_IIS.txt

Règle de nommage des fichiers de logs à fournir :

exAAMMJJHH.log (zippé exAAMMJJHH.zip)
  • AA : année
  • MM : mois
  • JJ : jour
  • HH : heure

Le Dessin d’Enregistrement doit être le suivant (séparateur : espace) :

  • Heure
  • IP
  • Image
  • Querystring
  • User-agent
  • URL_de_la_page

Ce qui donne comme ligne d 'exemple si on reprend l 'exemple du marqueur précédent :

00:53:23 123.123.234.215 /spacer.gif s=11025&s2=5&p=section_admin::gestion_PLV&di=1&idpays=fr&idprov=43hl=0x53x17&cn=modem&hm=0&lng=fr-ch&r=1680x1050xundefinedx32&idclient=6443799&idpays=fr&idprov=43&ref=http://www.google.fr mozilla/4.0+(compatible;+msie+6.0;+windows+nt+5.1;+funwebproducts;+.net+clr+1.1.4322) http://myxiti.intranet.net/admin/gestion_plv.asp
 

Spécificités IIS

Il peut arriver que certains serveurs IIS génèrent des logs sensiblement différents, de part leur configuration interne (non modifiable par un utilisateur). La colonne « IP utilisateur » peut ainsi se retrouver en 4e position au lieu de la 2e attendue. IIS ne permettant que de sélectionner les colonnes à prendre en compte, sans pouvoir spécifier leur ordre, vous ne pourrez pas rendre le log conforme au format attendu par AT Internet. Dans ce cas, vous obtiendrez une ligne comme l 'exemple ci-dessous, ce 2ème type de format de logs est pris en compte si vous étiez dans ce cas particulier.

Cas particulier IIS format 2 :

00:53:23 /spacer.gif s=11025&s2=5&p=section_admin::gestion_PLV&di=1&hl=0x53x17&cn=modem&hm=0&lng=fr-ch&r=1680x1050xundefinedx32&idclient=6443799&idpays=fr&idprov=43&ref=http://www.google.fr 123.123.234.215 mozilla/4.0+(compatible;+msie+6.0;+windows+nt+5.1;+funwebproducts;+.net+clr+1.1.4322) http://myxiti.intranet.net/admin/gestion_plv.asp
 

Transfert des fichiers entre le client et AT Internet

Le client dépose ses fichiers sur un serveur FTP hébergé par AT Internet.

Le domaine à autoriser est : corpoftp.xiti.com.

 

Transfert

Les fichiers envoyés chez nous seront zippés sans cryptage selon la nomenclature spécifiée dans la section « Règle de nommage des fichiers de logs ».

Les fichiers de la veille sont récupérés à 05h (GMT+1) du matin dans l 'ordre chronologique :

  • à 05h00 (GMT+1)  le fichier 00 de la veille est récupéré
  • puis juste après le fichier 01
  • et enfin le fichier 23

Au delà de cette heure, tous les fichiers des la veille doivent être rendus disponibles par le client, et ceux qui ne le seront pas ne seront pas traités.

Il est fortement conseillé de déposer les fichiers logs horaires à notre disposition toutes les heures.

 

Cas particulier d 'un log horaire vide

Le client doit générer un fichier au format du log horaire avec le mot « vide » dedans. Il sera ainsi pris en compte, sans générer de warning sur un éventuel dépôt de fichier défectueux.

Les transferts sont soumis à une validation définitive basée sur une journée de test par la personne désignée chez AT Internet. A partir de cette date, un process automatisé peut être mis en place.

Dernière mise à jour : 21/04/2023