L’importance des liens a été mise en exergue dans une recherche menée en 2000 par Altavista, Compaq et IBM, d’où il résulte que les sites peuvent être classifiés de la façon suivante :
* le cœur du réseau : environ 30% des sites les plus interconnectés qui se partagent et où convergent un maximum de liens et de trafic ;
* les sites d’origine : environ 20% des sites d’où les internautes sont dirigés vers le cœur du réseau, avec très peu de liens qui pointent en sens inverse ;
* les sites de destination : environ 20% de pages accessibles depuis le cœur mais n’y renvoyant que très peu ;
* les sites déconnectés : environ 30% d’îlots épars n’ayant que peu de liens et générant peu de trafic.
La topographie d’Internet qui s’en dégage a été dénommée la Théorie du nœud papillon :