Version 38 - Historique - Projet agregation - tetaneutral.net

Projet agregation » Historique » Version 38

Version 37 (Yanick Delarbre, 08/01/2012 12:28) → Version 38/225 (Yanick Delarbre, 08/01/2012 12:28)

h1. Projet agregation

* [[Bibliographie du projet]]
* [[L'installation de gitolite]]
* http://pad.rhizome-fai.net/U7HSgxYvDM | Le code du tunnel tun rÃ©alisÃ© avec python
* http://pad.rhizome-fai.net/TS2HBLkTnN | SpÃ©cification de l'iperf (de quel maniÃ¨re on dÃ©tecte la capacitÃ© d'un lien de maniÃ¨re opportuniste ? Monitoring ?)

* http://lists.tetaneutral.net/listinfo/projet-agregation
* http://chiliproject.tetaneutral.net/issues/16

* discussion sur le sujet http://www.spinics.net/lists/lartc/msg21455.html

h2. Prototype v1

http://lists.tetaneutral.net/pipermail/projet-agregation/2011-November/000023.html

h2. Test de tunproxy.py

On utilise "tunproxy.py":http://www.secdev.org/projects/tuntap_udp/files/tunproxy.py. Entre 2 machines
* client-adsl (une machine chez nous)
* gateway (la VM)

h3. Sur la gateway (= VM ttn)

DÃ©marrer le tunnel, il crÃ©e lui-mÃªme une interface _toto0_ (dÃ©truite Ã la sortie).

<pre>
./tunproxy.py -s 6000
ifconfig toto0 10.0.0.1/24 mtu 1468
</pre>

La MTU est calculÃ©e comme suit :

MTU de l'iface virtuelle = MTU de l'iface physique - taille_max(header IP) - taille(header UDP)
MTU de l'iface virtuelle = 1500 - 24 - 8

http://www.commentcamarche.net/faq/7185-introduction-au-mtu

h3. Sur le client

<pre>
./tunproxy.py -c rhizome-fai.tetaneutral.net:6000
ifconfig toto0 10.0.0.2/24 mtu 1468
</pre>

Tout le trafic vers les adresses en 10.0.0.x passera par le tunnel.

* http://lists.tetaneutral.net/listinfo/projet-agregation
* http://chiliproject.tetaneutral.net/issues/16

Un test de perf sur un tÃ©lÃ©chargement d'un fichier de 40Mio donne :

* avec tunnel : 909kb/s
* sans tunnel : 942kb/s

h1. DÃ©tection de la saturation d'un lien / bufferbloat

Un des points sur lesquels nous nous penchons est la dÃ©tection de la capacitÃ© d'un lien et de son Ã©volution, ceci 1) pour utiliser au mieux des liens de capacitÃ© diffÃ©rente et Ã©ventuellement changeante.

Tout le challenge est de dÃ©tecter (passivement) plutÃ´t que de mesurer (activement) la capacitÃ© du lien, sans induire de trafic supplÃ©mentaire.

Nous avons fait des mesures sur deux liens :

h2. Mesure ADSL Free (Freebox)

Il semble que de la QoS soit appliquÃ©eâ¦ l'effet de bufferbloat n'est pas vraiment visible : on passe d'un ping de 40 Ã 70/80msâ¦ (TODO: prendre le temps de collecter des rÃ©sultats des deux cÃ´tÃ©s du tunnel un peu plus sÃ©rieusement que juste l'impression donnÃ©e ceci-dit). Tous les paquets de ping arrivent, mÃªme lorsque le lien est saturÃ©.

h2. Lien ADSL (OVH)

L'effet de la saturation se fait clairement ressentir sur le ping : on passe de 70 Ã plus de 300ms de ping lorsque le lien est saturÃ©.

DonnÃ©es du test et graphiques : attachment:saturation_et_ping___uplink_seulement__udp_sctp.ods

h3. Conditions du test :

* Tunnel tap basÃ© sur tunproxy.py (cf dÃ©pÃ´t git), qui est le seul Ã utiliser la connexion
* DonnÃ©es collectÃ©es toutes les secondes, chaque peer enregistre :
** timestamp
** stats des paquets entrants
** ping
* On teste la connection au repos en la saturant par moments avec iperf
** en UDP : en metant l'option -b Ã une valeur supÃ©rieure Ã la capacitÃ© d'uplink
** en TCP
* Les donnÃ©es des 2 peers sont fusionnÃ©es Ã posteriori (script merge_tunproxy_csv.py) en fonction des timestamp.
* Les donnÃ©es sont graphÃ©es sur un tableur (ouais je sais, beurk ;-) ).

Le comptage du volume sortant n'est pas pertinent puisque la moitiÃ© des paquets peuvent-Ãªtre dropÃ©s en routeâ¦

h3. Analyse des rÃ©sultats

(voir document joint)
* On note systÃ©matiquement une corrÃ©lation forte entre lien saturÃ© et augmentation du ping. Que le lien soit saturÃ© en UDP ou TCP.
* En UDP, on peut saturer le lien complÃ¨tement. Il en rÃ©sulte qu'une part des pings se perd -> Prendre non seulement en compte le RTT mais Ã©galement le taux de pings perdus.
* En TCP, on observe aussi une montÃ©e du ping significative, mais jamais de pings perdus. On constate d'ailleurs que TCP se rend compte qu'il sature le lien et divise sa fenÃªtre (trou dans le graphe).
* -> Quid de la rÃ©alitÃ© de la saturation d'un lien par rapport Ã ces deux exemples simples ?

h2. Demi-dÃ©lai

Nous pouvons donc corrÃ©ler une saturation du lien (qu'elle soit effectuÃ©e par un protocole qui gÃ¨re la congestion ou non) avec une augmentation du ping. Reste un autre problÃ¨me, nous voulons dÃ©tecter dans quel sens a lieu la saturation. Or un ping nous donne le temps d'aller retour (RTT, Round-Trip-time). Il n'est en outre pas possible de mesure la durÃ©e absolue d'une trame entre deux sites, les horloges n'Ã©tant pas synchronisÃ©es. Deux approches sont envisagÃ©es

h3. Synchronisation par NTP

NTP est un protocole permetant de synchroniser via le rÃ©seau les horloges de machines distantes. Si NTP fournit une prÃ©cision suffisante, il serait intÃ©ressant pour pouvoir effectuer des demi-ping :Â

* On maintient les horloges synchronisÃ©es grace Ã NTP entre machine 1 et machine 2
* Machine1 envoie un paquet Ã machine2 contenant un timestamp
* Machine 2 peut connaÃ®tre le temps de trajet machine1->machine2 en comparant ce timestamp avec sa propre horloge.

On mesure des ping entre 20 et 100ms en gÃ©nÃ©ral, soit des demi-ping entre 10 et 50ms. Or, les Ã©tudes sur NTP (ex: http://www.eecis.udel.edu/~mills/database/brief/perf/perf.pdf) montrent qu'Ã travers un rÃ©seau WAN (ex: l'ADSL que nous utilisons), l'erreur de NTP est autour de *10ms*. Soit une erreur relative entre 10% et 50%, ce qui n'est pas acceptable. La seule solution viable, selon l'Ã©tude mentionnÃ©e, pour synchroniser rÃ©ellement des Ã©quipements serait d'avoir une source GPS qui permet d'avoir une erreur en-dessous de la milliseconde. Cela nÃ©cessite de l'Ã©quipement supplÃ©mentaire et n'est souhaitable.

Voir aussi http://www.frameip.com/ntp/

h3. Par Ã©volution du dÃ©lai relatif

Une autre approche discutÃ©e est de mesurer non pas le dÃ©lai absolu mais la variation de celui-ci.
On mesure timestamp_envoi_site1 - timestamp_reception_site2 pour chaque paquet, la valeur absolue n'a aucun sens (on utilise deux horloges diffÃ©rentes).

Un autre problÃ¨me est alors la dÃ©rive relative des horloges des deux machines qu'il ne faut pas nÃ©gliger (exemple donnÃ© dans l'article sur UTP de 17ms de dÃ©rive en 10 minutes)

Cette idÃ©e est d'ailleurs reprise dans le protocole UTP de bittorrent : http://www.rasterbar.com/products/libtorrent/utp.html

Un outil faisant ce type de mesure a Ã©tÃ© implÃ©mentÃ© dans le dÃ©pÃ´t : _delta_half_trip_time.py_

CÃ´tÃ© serveur :

./delta_half_trip_time.py -s 2244

CÃ´tÃ© client:

./delta_half_trip_time.py -s <ip_serv>:2244

Le script mesure en permanence les dÃ©lais toutes les secondes. Il ne prend pas en compte la dÃ©rive d'horloge pour l'heure. La sortie est du CSV contenant les dÃ©lais dans les deux sens (de chaque cÃ´tÃ©). Le format est :

pkt_type,sequence number,delay

_pkt_type_ vaut *'t'* (comme _timer_) pour les mesures entrantes (download) et *'d'* (comme _delay_) pour les rÃ©ponses aux paquets sortants (upload).

h4. mesures

Pour l'instant, seules des mesures avec iperf en TCP : attachment:one-way_delay.ods

Note sur ces mesures (iperf TCP) : correspond peut-Ãªtre au cas le plus difficile Ã dÃ©tecter (une unique connection TCP qui sature le lien) Ã©tant donnÃ© que le backoff de TCP va essayer d'Ã©viter de saturer le lien en permanence.

h4. dÃ©rive

Le fichier attachment:one-way_delay.ods prÃ©sente Ã©galement une mesure de la dÃ©rive sur 40 minutes entre 2 machines. L'enjeu est de savoir si il est nÃ©cessaire de mettre en place un mÃ©canisme pour dÃ©tecter et prendre en compte la dÃ©rive des horloges qui rendraient la comparaison de deux dÃ©lais relatifs peu pertinents si elle Ã©tait trop importante.

Bien que l'expÃ©rience ne porte que sur un cas et ne fasse pas loi, elle nous expose une dÃ©rive de 0.5ms sur 40 minutes d'observation (dÃ©rive relative de ~1.4%). Ne souhaitant garder pour nos mesures de capacitÃ© de lien qu'une fenÃªtre glissante que de quelques minutes ou dizaines de minutes tout au plus, il n'apparaÃ®t pas nÃ©cessaire de prendre en compte cette dÃ©rive.

h1. Petits points techniquesâ¦

h2. Que mesure iperf et comment (en UDP) ?

Iperf mesure le dÃ©bit du client vers le serveur (dans un seul sens). En UDP, il envoie Ã une vitesse nominale (par dÃ©fait 1M). Le rÃ©sultat donnÃ© par le client n'est pas une mesure mais correspond Ã cette vitesse nominale. *Seul le _server repport_ correspond Ã la "vraie" mesure.*

La saturation d'un lien gÃ©nÃ©rant des pertes, pour mesurer les pertes liÃ©es Ã la qualitÃ© du lien (et non Ã sa capacitÃ©), il faut demander au client d'Ã©mettre un peu en-dessous de la vitesse Ã laquelle peut recevoir le serveur.

h2. Quelques outils rÃ©seaux bien pratique

* tcpdump | http://openmaniak.com/fr/tcpdump.php
<pre bash>
tcpdump -D #Interfaces rÃ©seaux disponibles pour la capture
tcpdump port 80 -i eth0 -w capture.log #Enregistre le trafic Web vers le fichier capture.log pouvant Ãªtre ouvert avec Wireshark
tcpdump icmp #Affiche tout le trafic associÃ© au protocole icmp
</pre>
* ping | http://www.bortzmeyer.org/ping-taille-compte.html
** Permet de tester un problÃ¨me de MTU grÃ¢ce Ã l'option -s de ping permettant de fixer une taille de paquet
* hping3
<pre bash>
hping --syn -p 80 --data 1200 10.0.0.1 #Envoie de paquet tcp syn sur le port 80 de taille 1200
</pre>

*tracepath* pour dÃ©couvrir le PMTU

h1. TODO Ã©tapes suivantes

* Chercher relation entre variations de latence et saturation de lien. ConcrÃ¨tement, Ãªtre capable de dÃ©tecter *l'Ã©vÃ¨nement "mon lien est saturÃ©"* et de mÃ©moriser la capacitÃ© max. du lien
* Finir de lire/comprendre le code de Fernando (linkagreg)
* Lire/comprendre le bout de script python de Laurent (multi-UDP pour contourner les QoS)

h1. Journal (Ã partir du 28 oct)

ActivitÃ©s du projet de Yanick & Jocelyn (TX)

h2. 8 janvier
* ComprÃ©hension du script multy.py de Laurent Guerby
* Documentation du script multy.py
** SchÃ©ma graphique du fonctionnement de multy.py
* Adaptation de l'algorithme de round robin avec des mÃ©triques
** Ajout d'un coefficient pour "plus" utiliser une connexion qu'une autre

h2. 28/29 dÃ©c. dÃ©c

* DÃ©tection de saturation : nouvel outil pour mesurer les dÃ©lais dans un sens
** CrÃ©ation de l'outil, qui fonctionne de maniÃ¨re bidirectionelle et rapporte les informations aux deux pairs
** PremiÃ¨re mesure rapide sur un iperf en TCP, dans un sens puis dans l'autre, simplement pour valider la dÃ©tection.

h2. 5 dÃ©c.

* DÃ©tection de saturation :
* Output CSV en direct vers le fichier plutÃ´t que statiquement au bout de 3 minutesâ¦
* Ãcriture d'un outil de script de logs CSV
* Collecte de mesures sur l'effet sur le ping de la saturation d'un lien en UDP et TCP
* Analyse basique des rÃ©sultats

h2. 27 nov.

* Lecture et utilisation de linkagreg (outil d'agrÃ©gation de Fernando)
* Faire fonctionner linkagreg sur une architecture 64bits
* Faire fonctionner linkagreg avec une connection sur le client //Fonctionnel
* Faire fonctionner linkagre avec n connection sur le client //Non fonctionnel
** Test avec une connection filaire et WiFi //Non fonctionnel car perte (important) de paquet sur le lien WiFi
** Test avec des connections virtuelles //Non fonctionnel car QoS inapplicable sur des interfaces virtuelles
** Test avec deux interfaces physiques //Non fonctionnel car QoS dÃ©ficiente

* Ajout de la collecte de donnÃ©es sur les temps de rÃ©ponse (ping) pÃ©riodiquement.
* Export des donnÃ©es en CSV (pour exploitation/grapheâ¦ etc.)
* Premier jeu de mesure (mauvais) sur une ligne adsl.
*

h2. 11 nov.

* Debuggage du problÃ¨me de MTU (c'est honteux mais c'est bÃªtement la taille des buffers qui n'Ã©tait pas assez grande dans le programme. Notamment dÃ» aux pseudo en-tÃªtes, cf plus bas).
* Configuration auto des adresses IP de chaque cÃ´tÃ© du tunnel (plus besoin d'ifconfig Ã la main)
* Ajout sur tunproxy.py de compteurs de dÃ©bit
* mÃ©morise le traffic sur les x derniÃ¨res tranches de n secondes (dÃ©faut 10 tranches de 1 seconde)
* Affiche les moyennes et les max.
* ComprÃ©hension de ce qui passe dans TUN : bien qu'Ã©tant un tunnel de niveau 3, il y a une pseudo-en-tÃªte de L2, cf "doc officielle":http://www.mjmwired.net/kernel/Documentation/networking/tuntap.txt#102 (merci Laurent!)
* discussion avec Laurent sur les intÃ©rÃªts de faire un tunnel L2 (qui rajoute pourtant l'overhead de l'en-tÃªte L2), en bref :
* Ã©vite de gÃ©rer les soucis spÃ©cifiques du niveau IP
* TUN ne supporte pas IPV6 par exemple â¦

h2. 5 nov.

* Mise en place d'un dÃ©pÃ´t git (gitolite) pour partager du code avec Fernando Alves de Sames Wireless :

# DÃ©pot public : (lecture-seule)
git clone git://rhizome-fai.tetaneutral.net/agregation.git

h2. 28 oct.

* Initiation python (dÃ©couverte pour Yanick)
* Commentaire intÃ©gral du tunproxy.py et premiers tests de ce dernier
** ping ok (+1ms)
** iperf Ã travers le tunnel : BP ~= celle de l'uplink ADSL. Le dernier datagrame ne reÃ§oit pas d'ACK

<pre>
[ 3] local 10.0.0.2 port 50191 connected with 10.0.0.1 port 5001
[ ID] Interval Transfer Bandwidth
[ 3] 0.0-10.0 sec 1.25 MBytes 1.05 Mbits/sec
[ 3] Sent 893 datagrams
[ 3] WARNING: did not receive ack of last datagram after 10 tries.
</pre>

h2. 2 novembre

* Modification de la MTU pour Ã©viter la fragmentation de paquet

h1. FonctionnalitÃ©

* Ajouter plusieurs sockets sur le tunnel pour Ã©viter le traffic shaping de la part d'un opÃ©rateur

Projet

Général

Profil

Projet agregation » Historique » Version 38