Vous êtes ici :
-
Consultations
-
Commandes publiques de l'Afnic
-
Documents de référence
-
Statistiques
-
Publications
-
Blog
- Brexit et .fr
- Radioscopie du .RE
- Les marques répondent présentes au 2nd rendez-vous du Cercle des .marque
- À propos de l’attaque sur les résolveurs DNS de FAI français
- Utiliser l'open data de l'Afnic : exemple avec le terme COVID
- Héberger un nom de domaine avec caractères composés
- L’éligibilité d’un titulaire situé sur le territoire du Royaume-Uni post BREXIT
- Peut-on avoir des caractères composés dans un nom de domaine ?
- Le fonctionnement de l'Afnic pendant le confinement
- Quels domaines de premier niveau ont une adresse IP ?
- Lala Andriamampianina nous a quittés
- 6 conseils pour éviter les piratages de son site web
- Résolutions 2020: l'Afnic se met à l'elliptique
- À la recherche des nTLD low cost
- Balade au cœur du .paris - à la découverte de sa communauté
- Le .ORG – une autre perspective
- Retour sur le succès de la première rencontre du Cercle des .marque
- Facteurs clés de succès des extensions internet : une grille d’analyse
- [Vidéo] Retour sur le Forum de la Gouvernance Internet (FGI) France 2019
- Un petit exemple d'utilisation des données ouvertes de l'Afnic
- Réflexions sur les modèles économiques des « nouveaux TLD »
- 30 ans, des succès, et des risques ; le Web, l'URL et le futur
- [Success stories] Renforcer son infrastructure pour l’adapter à ses ambitions
- 1er février 2019 : le DNS va-t-il trembler ?
- [Success stories] Ils ont fait le choix d’une extension internet personnalisée
- [Success stories] Le .museum, une extension internet historique redynamisée
- Les grandes étapes pour lancer efficacement votre .marque
- 6 secrets pour améliorer le renouvellement des noms de domaine
- [Vidéo] Retour en images sur l'IGF 2018 Paris
- Le .MARQUE pour optimiser l'expérience client
- L’Afnic s’implique dans la sécurité du DNS au niveau international
- Remplacement de la clé KSK de la zone racine : Êtes-vous prêts ?
- Comment la SNCF a mis en oeuvre sa nouvelle stratégie digitale avec oui.sncf ?
- Projet de R&D: classification automatique des abus en matière de noms de domaine
- Mémorisation auditive des noms de domaine
- Quelles actions mener face aux abus sur les noms de domaine ?
- Usurpation d’identité par nom de domaine : ce que fait l’Afnic
- Cybersquatting, Spam, Phishing… les différents types d’abus sur noms de domaine
- [Vidéo] Retour sur le Forum de la Gouvernance de l'Internet France 2018
- Les extensions internet personnalisées : quelles opportunités pour les marques ?
- Comment éviter l'irrecevabilité dans la procédure SYRELI
- Quels sont les termes anglophones les plus utilisés dans les domaines en .FR ?
- Sécurité des noms de domaine, l'exemple des cryptomonnaies
- Test de personnalité : êtes-vous prêts pour le RGPD ?
- Les extensions comme le .alsace ont-elles un effet sur le SEO local ?
- Quels sont les termes les plus utilisés dans les noms de domaine en .fr ?
- Les 11 endroits incontournables où votre adresse internet doit apparaitre !
- Quels moyens d'actions pour les ayants-droits non éligibles à la charte du .fr ?
- Litige sur un nom de domaine: la reconnaissance des droits d'une AOC dans SYRELI
- Pourquoi utiliser un nom de domaine sous une nouvelle extension ?
- L'Afnic, une communauté avant tout !
- La défense des droits de la personnalité dans la procédure SYRELI
- Le prochain round des nouveaux gTLD, c’est pour quand ?
- Pourquoi venir à l’Afnic Forum ?
- Résolveur public de DNS-sur-TLS Yeti
- 2016, début d’un nouveau cycle pour l’Afnic
- Le .fr vient de franchir le cap des 3 millions de noms de domaine
- Mon expérience au sein du service Juridique de l'Afnic
- [Vidéo] 4 conseils pour réussir le lancement de votre entreprise sur Internet
- Futur de l’ICANN: Ni privatisation, ni internationalisation, ni supervision
- Excellence à l’Afnic – le coming out
- Offre exclusive : votre nom de domaine 100% Remboursé* !
- Intervention à l'occasion de la remise du plan de transition IANA
- Afnic Football Club
- 8 astuces pour bien choisir son nom de domaine
- IPv6 et DNSSEC ont 20 et 19 ans. Même combat et mêmes défis !?
- Le projet Yeti d'expérimentation d'une racine DNS
- L.45-2 1° du CPCE : Quand le nom de domaine porte atteinte à la loi
- Comment éviter de se faire voler son nom de domaine par email ?
- Responsabilité et transition IANA : les coulisses
- République numérique : Ceci n’est pas une consultation publique
- Faut-il une approche globale pour les marques territoriales françaises ?
- Ne vendez plus de noms de domaine !
- abc.xyz : erratum.xyz
- abc.xyz : et pendant ce temps en France ?
- abc.xyz : pourquoi pas alphabet.com ? (Version théorie du complot)
- abc.xyz : le succès controversé du .xyz
- Communication institutionnelle : une tension permanente ?
- abc.xyz : pourquoi pas alphabet.com ?
- alphabet.xyz : comment Alphabet a acheté son nom de domaine ?
- abc.xyz : pas d’inquiétude, nous sommes aussi en train de nous habituer à ce nom
- La transition IANA franchit une étape majeure à Buenos Aires
- Une journée dans la vie de la communauté habilitée ICANN
- Transition IANA : la machine est lancée, mais l'échéance approche
- La Chine, une mutation à pas de géant
- Vers un DNS moins indiscret
- Les Parl : mettez toutes les chances de votre côté
- Icann : la gouvernance pour quoi faire ?
- ICANN Singapour. Un débat au bout du monde
- Synthèse de la table-ronde Afnic sur la solidarité numérique
- Mesurer la « qualité » de l'accès à l'Internet, mission difficile
- Réforme de l'Icann, la boite de Pandore est ouverte
- Comment se porte l'Internet en France ?
- Forum sur la Gouvernance de I’Internet : Que faire ?
- Spam suffit !
- Icann : ne bougez plus !
- Escroqueries et usurpations d’identité, expérience d’un rapporteur SYRELI
- La reforme des régions ne sonnera pas la fin des geoTLD français
- Que retenir de NETmundial ?
- Avis de changement à l'Afnic !
- Suggestions pour une transition IANA réussie
- Sur la gouvernance de l'Internet, les Etats Unis jouent la carte Icann
- Retour vers le futur du service juridique de l’Afnic
- Pourquoi les territoires veulent-ils leur place sur Internet ?
- Vers une nécessaire rationalisation du « panier gTLDs » des registrars ?
- L'éléphant IANA est dans la salle
- Syreli fête ses deux ans
- 2014 : changement de jalons pour le système de nommage
- Le système de nommage de GNUnet
- Gouvernance de l’Internet : Au travail !
- La responsabilité sociétale et l'ADN des ccTLDs
- Mais que fait l'Afnic ?
- Conseil d'Etat, Léon Blum, Lawrence Lessig et l'Afnic
- Qui est derrière le Whois ?
- Registrars Atlas 2013, ce qu'il faut retenir
-
FAQ
-
Lexique
-
Certificats
Utiliser l'open data de l'Afnic : exemple avec le terme COVID
09 juin 2020 - Par Pierre-Aymeric Masse
L'Afnic met à disposition du grand public un ensemble de données mises à jour tous les mois. Parmi ces données nous retrouvons:
- noms de domaine en .fr
- indicateurs par pays titulaire du .fr
- indicateurs par mois trimestre année du .fr
- nombre de noms de domaines par code postal du .fr
- indicateurs par type titulaire du .fr
- indicateurs par département titulaire du .fr
- indicateurs par type de domaine du .fr
- indicateurs par bureau d enregistrement du .fr
On peut donc par exemple étudier la distribution des titulaires de noms de domaine sur le territoire, étudier la proportion d'entreprises ayant un nom de domaine, etc.
Ces données sont facilement téléchargeables en allant sur http://opendata.afnic.fr
On va regarder aujourd'hui comment étudier la création des noms de domaine associé au terme Covid dans le .fr.
Pour ce faire, il existe de nombreuses solutions. Nous allons nous orienter sur du traitement en Python et avec une librairie peu connue, Vaex.
Python est un langage de programmation très utilisé pour la manipulation des données et est très souvent couplé à cet usage avec Pandas.
Le fichier "noms de domaine en point fr" une fois décompressé fait tout de même 0,45go ! Avec cette taille de fichier, utiliser Pandas est possible mais des traitements seraient assez longs.
Vaex est justement une implémentation de l'API de Pandas avec des choix techniques permettant de traiter ce genre de volume quasiment instantanément.
La première étape consiste à télécharger le fichier. Rien de bien compliqué puisque les données sont dans un fichier csv zippé. Un classique !
On importe les librairies et on importe le fichier:
On remarquera qu'il y a l'année et le mois dans le nom du fichier. Si on veut automatiser l'import et le traitement il suffira de simplement générer l'url. Le fichier est en latin1, puisqu'en français avec des accents.
Ensuite, il est nécessaire de faire un petit traitement pour supprimer les espaces et les accents dans les noms de colonnes. On va en profiter pour changer le format des dates qui sont en français.
Maintenant que l'on a le fichier importé dans le Dataframe "df", regardons ce que nous avons. On remarque que l'on a plus de 6M de domaine, certains avec des "date de retrait du whois". On se trouve donc devant un fichier avec l'ensemble de la zone depuis sa création, ou du moins depuis la mise à disposition de l'open data avec les domaines encore actif, ceux n'ayant pas de date de retrait, et les autres, inactifs.
Nous n'allons garder uniquement que les domaines créés depuis janvier 2020.
On se retrouve avec beaucoup moins de ligne, seulement 208732 domaines. On va donc préparer nos analyses en filtrant nos données. Vaex est très intéressant dans ce cas puisqu'il propose un système de lazy computation, c'est-à-dire qu'il va nous permettre de taguer très rapidement un ensemble de données et réaliser des opérations sur les données seulement lorsqu'on en aura besoin.
On regarde maintenant le nombre de noms de domaine qui nous intéressent.
Environ 1200 domaines soient finalement assez peu au vu du nombre de création.
Regardons rapidement le nombre de créations durant cette période
Le top 5 est parlant, on voit que le mois d'avril a été le meilleur en terme de création de domaines.
Pour finir, jetons un œil sur les domaines
Avec cette petite démonstration, nous avons vu la simplicité d'utilisation des données de l'open data de l'AFNIC. On peut réaliser différentes analyses tel que l'évolution des créations de domaines, leur durée d'enregistrement moyenne, etc..
L'ensemble du code est disponible sur github de l'Afnic.
Pierre-Aymeric Masse
![]() | Data scientist |
Ce nom de domaine
est-il disponible ?
Actualités
- 1 mars 2021 Rapport Internet des Objets & Souveraineté Numérique
- 12 février 2021 L’Afnic marraine de l’émission Connecte Ta boîte de France Num
- 11 février 2021 Augmenter les compétences numériques des jeunes : l’Afnic et le service pub...
- 15 décembre 2020 Présence en ligne des TPE/PME : résultats 2019/2020 de l'étude Afnic « ...
- 10 décembre 2020 Trois projets d’ampleur sur la feuille de route du Collège international de l...