Running Data Lab

Running Data Lab

Explorer les événements de course à pied.

|Clinique (adj.) — Qui observe directement les manifestations de la maladie|

Sans entrer dans des considérations propres à la médecine clinique, le Running DataLab est donc le lieu d’observation des pratiques associées aux activités de courses à pied. Les événements sportifs comptent parmi les manifestations observables du “phénomène“ actuel. Clinique également dans le sens d’un espace de consultation, où les données sont rendues visibles par tous d’une part.

Les recherches issues de ce projet Running DataLab #RDL contribuent à comprendre les données associées aux différentes pratiques et activités de courses à pied. Il s’agit notamment de qualifier les événements de courses à pied.

Objectifs

Cette clinique des données répond au besoin de rassembler et de structurer des données liées aux événements de courses à pied. La base de données découlant de ce travail doit permettre d’analyser les événements pour comprendre leur impact territoriaux (développement local, enjeux de renommée, touristique, etc.) et sociaux (profils des coureurs, création de communautés locales, etc.).

Des questionnements émergent à la fois sur l’engouement de la course à pied et sur la prolifération des données, le Big Data — publications sur les réseaux sociaux des personnes, des sites spécifiques, etc. Un double questionnement émerge en lien avec les sciences humaines et sociales et les humanités numériques.

Il s’agit de qualifier les impacts territoriaux et sociaux de l’enthousiasme actuel pour les activités de course à pied — précisément, pour les événements associés (1). Le Running DataLab interroge également l’effet de ces événements sur le Web. L’objectif est ici de capter la résonance sociale et territoriale d’un événement particulier en explorant le réseau social Twitter (2).

Le Running DataLab, ou clinique des données, vise à construire des méthodologies (i), à produire des outils d’analyse innovant (ii) sur les événements de courses à pied à partir de sources numériques. Le Running DataLab se veut lieux d’expérimentations, d’essais, de tests, et de bricolages. Compositions et recompositions rythment le projet. Les voies sans issues sont empruntées avec entrain. Les détours sont nombreux et contribuent à l’élaboration de soubassements solides pour penser la suite. Le Running DataLab se doit en effet de clarifier, chemin faisant, chaque étape de production des données — cf. publication des conditions de production des données à l’occasion de DataPaper. L’ambition est simple, faire du Running DataLab une pépinière de projets. Autrement dit, la méthode pour point de départ afin de rassembler la suite de façon structurée.

S’inscrivant dans une démarche géographique, les outils développés dans le cadre du DataLab ont pour objectif d’étudier les différents espaces et les jeux d’échelles des événements de courses à pied.

> Dimension multiscalaire d’explorations à différents niveaux :

— International : le réseau de courses à pied, une vision du monde réticulaire

— Local : outil de marketing (fonction économique de l’événement), création de lien social (capital social ?) et de patrimonialisation/ valorisation du patrimoine (fonction identitaire ?)

— Individuel : « dire je » et se construire à travers la pratique sportive : se chercher, se dépasser, se montrer

> Dimension multispatiale :

— L’espace numérique

— L’espace géographique

— L’espace social

Missions — Faire parler les données des évènements de courses à pied

1. Observations

La première mission du Running DataLab est de créer un observatoire des données liées aux événements des courses à pied à travers le monde. Cette démarche vise la création d’un corpus de données sur les pratiques de courses à pied, les événements sportifs, et les communautés. Les jeux de données sont structurés pour observer, évaluer et analyser ces pratiques.

2. Expertises

Le Running DataLab a également pour mission de mettre au point des méthodologies innovantes de récoltes et d’analyses de données. Aussi, des phases de tests explorent des aspects techniques d’accès et de recueil des données.

Ces tests doivent permettre de  :

  1. réaliser des méthodologies qui soient opérationnelles et interopérables sur d’autres projets de sciences humaines et sociales,
  2. trouver des moyens de représentations graphiques qui permettent une lecture simple de jeu de données complexes et riches, telles celles du big data,
  3. penser un indicateur pour qualifier l’impact d’évènements de course à pied à travers l’étude de réseaux sociaux.

3. Diffusions

Le Running DataLab  est une plateforme de libre accès aux données. La mission de diffusion des données est centrale dans la démarche. Il s’agit de rendre accessible au plus grand nombre les informations produites afin d’impulser une dynamique de co-création des connaissances en sollicitant directement les communautés de coureurs et de coureuses — notamment à travers des questionnaires dans la rubrique En-Quête du site.

Equipe scientifique :

Mathilde Plard – Responsable scientifique, Géographe et chercheuse au CNRS en Sciences Humaines et Sociales – UMR 6590 ESO.

Violaine Guichet, Ingénieure d’études, responsable technique et création graphique – Urbaniste-géomaticienne.

Productions scientifiques :

Atlas International des évènements running 2017

Densités / Intensités internationales Des précautions doivent être prises concernant le jeu de données créé à l’échelle internationale (cf. Précautions sur les données « atlas running 2017′). Cependant, des intensités se dessinent entre les latitudes 55 ° et 30 °. Zoom sur les sous-régions L’Amérique du Nord et l’Europe de l’Ouest sont les deux sous-régions ayant le plus de…

Lire la suite Atlas International des évènements running 2017

Lire la suite...

Evénements de running

Les atlas des événements de running ont été réalisés à différentes échelles.Voici des extraits des différents territoires étudiés. Atlas international des événements de courses à pied en 2017 Atlas de la France métropolitaine des événements de courses à pied en 2017 Atlas des événements de courses à pied en Pays de la Loire, 2017

Lire la suite...

Construction de l’objet running à partir de sources numériques hétérogènes — Working Paper / Document de travail

  Le processus de publications académiques s’inscrit dans un temps long. La diffusion d’un document de travail permet d’inscrire les travaux de recherche dans un rythme de communication plus dynamique et de diffuser plus rapidement des pistes d’analyses, des premiers résultats. Il ne s’agit pas d’un positionnement définitif mais d’une étape d’avancement. Construction de l’objet…

Lire la suite Construction de l’objet running à partir de sources numériques hétérogènes — Working Paper / Document de travail

Lire la suite...

Constitution d’un jeu de données social à partir des données twitter — Working Paper / Document de travail

    Le processus de publications académiques s’inscrit dans un temps long. La diffusion d’un document de travail permet d’inscrire les travaux de recherche dans un rythme de communication plus dynamique et de diffuser plus rapidement des pistes d’analyses, des premiers résultats. Il ne s’agit pas d’un positionnement définitif mais d’une étape d’avancement. Constitution d’un…

Lire la suite Constitution d’un jeu de données social à partir des données twitter — Working Paper / Document de travail

Lire la suite...

No posts found!

RÉPARTITION DÉPARTEMENTALE

ÉVÈNEMENTS & DÉPARTEMENTS Les limites d’une lecture régionale de la répartition des évènements mènent le géographe à changer d’échelle pour changer de perspective. En effet, la région semble être une trop petite échelle pour réaliser une étude de dynamique de répartition spatiale — la grandeur des territoires «lisse» trop les résultats. Aussi, pour fournir une…

Lire la suite RÉPARTITION DÉPARTEMENTALE

Lire la suite...

RÉPARTITION RÉGIONALE

QUALIFIER LA RÉPARTITION SPATIALE DES ÉVÈNEMENTS Quelles sont les régions les plus dotées en événements ? Le nombre d’événement oscille énormément par région. Ce chiffre parait plus élevé dans la partie sud de la France (excepté pour la Corse) et plus faible dans les régions nord, en particulier le centre – Val de Loire. Les…

Lire la suite RÉPARTITION RÉGIONALE

Lire la suite...

CRITÈRES ENVIRONNEMENTAUX

Hypothèse : les typologies de territoires ont un impact sur la répartition spatiale des événements. Différentes variable relatives à l’«environnement», au sens large, des territoires sont présentées afin d’apporter quelques premiers éléments de réponse L’occupation du sol et les évènements de courses à pied Les données utilisées pour réaliser cette carte d’occupation des sols sont…

Lire la suite CRITÈRES ENVIRONNEMENTAUX

Lire la suite...

CRITÈRES SOCIO-ÉCO

Économie & évènements de course à pieds L’objectif de la carte ci-dessous est de comprendre s’il existe des liens entre richesse économique des territoires et nombre d’événements. Le PIB régional correspond au Produit Intérieur Brut. Il « est le principal agrégat mesurant l’activité économique. Il correspond à la somme des valeurs ajoutées brutes nouvellement créées…

Lire la suite CRITÈRES SOCIO-ÉCO

Lire la suite...

DENSITÉ(S)

REPÉRER DES LOGIQUES D’IMPLANTATION Il s’agit précisément d’étudier les différentes variables régionales qui pourraient intervenir pour favoriser ou contrarier dans le processus d’implantation d’événements de courses à pied. DENSITÉ DE POPULATION & RÉPARTITION SPATIALE Objectif : comparer le nombre d’événements au nombre d’habitants. Une corrélation entre le poids démographique des régions et les événements de…

Lire la suite DENSITÉ(S)

Lire la suite...

Audit SémantiK #UTMB

ANALYSER L’UNIVERS SÉMANTIQUE DE L’ESPACE SOCIAL TWITTER

 

Méthode

À partir des tweets extraits, seuls les hashtags sont conservés. Chaque nœud représente un hashtag. La taille du noeud dépend de la redondance de l’hashtag dans le réseau, soit le nombre de fois où il utilisé dans un tweet.

À partir de ce recueil de données, une catégorisation a été réalisée. Cette catégorisation comprend 22 types (acteur, actualité, alimentation, critère de courses, culture, économie, événement de courses à pied, expression, media, santé, sport, temporalité, territoire, environnement, interaction sociale, météorologie, parcours, sentiment, préparation, résultat, vocabulaire du running).

Ce graphe permet d’analyser l’univers sémantique et thématique de l’événement. Cerner ces univers permet de mieux saisir les communautés sociales des différents types de courses à pied.

Capture d’écran 2018-10-15 à 15.49.34.png

Auteur.e.s : M. Plard & V. Guichet, 2018

ESPACE SOCIAL & THÉORIE DES GRAPHES

 

Réseau social et évènement
de course à pied

Pour compléter les informations de spatialisation des évènements de courses à pied, les informations relatives à l’espace social tiennent une place importante dans le Running DataLab.

L’objectif est d’interroger l’aspect social des running event avec des études de cas précises basées sur des analyses exploratoires de comptes Twitter officiels. Analyser l’espace social à partir de ce réseau social permet de saisir l’impact de l’événement : sa résonance territoriale et celle sociale.

 

Deux études de cas ont été menées sur les éditions 2017 de l’Ultra Trail du Mont Blanc, du marathon de New York.

La méthodologie utilisée est la même pour ces deux études. Tous les tweets contenant le hashtag officiel — respectivement   — de l’événement ayant été postés 10 jours avant la date de début de l’événement et 10 jours après cette date sont extraits.

Capture d’écran 2018-10-15 à 12.30.27Capture-d’écran-2018-10-15-à-12.28.32.png

Les données sont nettoyées et standardisées afin d’être exploitées dans un logiciel de visualisation et de réseaux. Le logiciel Gephi permet de transformer la donnée en graphe, plus spécifiquement en graphe de réseaux.

À partir de ce logiciel deux graphes principaux sont réalisés. Le premier concerne les acteurs et permet d’analyser les différentes relations ainsi que les jeux d’acteurs ; les différentes communautés qui se créent, les acteurs prépondérants ou encore ceux isolés. Un second graphe est créé ne contenant que les acteurs et les hashtags associés. Celui-ci permet de saisir l’univers sémantique de l’événement : le champ lexical ou encore interroger la visibilité du territoire-support.

 

Théorie des graphes

Un graphe est définit « mathématiquement comme un ensemble fini de sommets (…) et un ensemble fini (mais éventuellement vide) de liens (…) » (L. Beauguitte, 2010).

« Un sommet qui n’est adjacent à aucun lien est dit isolé (isolate). Lorsqu’un graphe est constitué de plusieurs sous-graphes non connectés les uns aux autres, ces sous-graphes sont nommés composants (component). Un composant formé d’un seul sommet est dit trivial. Si enlever un sommet s d’un graphe G augmente le nombre de composants du graphe, s est appelé point d’articulation (cutpoint ou, plus rare- ment, cut-vertex ). Si enlever un lien l d’un graphe G augmente le nombre de composants du graphe, l est appelé isthme (bridge) » (L. Beauguitte, 2010).

Pour en savoir plus : Laurent Beauguitte. Graphes, réseaux, réseaux sociaux : vocabulaire et notation : Version 1 – Septembre 2010. Groupe f.m.r. (flux, matrices, réseaux) animé par César Ducruet et Laurent Beauguitte

Capture d’écran 2018-10-15 à 12.04.26

Des Tweets au graphes

La traduction d’un tweet et de son contenu en graphe reprend la même logique de sommets et de liens. Chaque élément du tweet (le texte, le(s) hashtag(s) associé(s), utilisateur(s) mentionné(s), média(s) ou lien(s) vers d’autres sites) deviendra un sommet. Ils seront tous connectés au tweet initial par des liens. Ces liens sont orientés, on pourra dire, l’utilisateur a tweeté « Real local success for MCC, … ».

Plus untweet est retweeté, un utilisateur a tweeté ou est mentionné, un hashtag utilisé, plus leur sommet devient important, une polarité.

 

Exemple

Capture d’écran 2018-10-15 à 12.40.04.pngCapture d’écran 2018-10-15 à 12.39.54.png

Auteur.e.s : M. Plard & V. Guichet, 2018

 

 

 

 

 

L’ESPACE SOCIAL DE L’UTMB — édition 2018

Capture d’écran 2018-10-15 à 14.23.08.png

LES ACTEURS DE L’UTMB 2017

En octobre 2018, 53’000 abonnés suivent le compte officiel de l’évènement
https://twitter.com/UTMBMontBlanc  // Hashtag associé #UTMB

 

Capture d’écran 2018-10-15 à 14.22.59.png


 

Noeuds & acteurs

À partir des tweets extraits, seuls les acteurs sont conservés. Chaque nœud représente un acteur. La taille du noeud dépend de la redondance de l’acteur dans le réseau, soit le nombre de fois où il tweete cumulé au nombre de fois où il est mentionné.

Le graphe ci-dessous permet de visualiser le jeu d’acteurs et éclaire sur le poids des acteurs, leur visibilité ou encore les connexion (liens forts, liens faibles).

L’organisateur, UTMBMontBlanc, occupe une place centrale dans le réseau. Cette importance est engendrée d’une part, par la multitude de liens entre l’organisateur et d’autres acteurs. Ceci montre que de manière générale, l’organisateur est bien identifié dans le réseau d’acteurs. D’autre part, le poids de l’UTMBMontBlanc est généré par un lien fort entre ce dernier et trailrunningrvw (trailrunningreview revue de matériel de trail running espagnol).

Les polarités secondaires correspondent aux vainqueurs des courses (Nuria, Picas, François d’Haenes, Kilian Jornet). Ces acteurs sont cités par nombre d’individus, et sont surtout relayés par les médias (TerritorioTrail, trailrunningrvw, etc.).

Le média I run far, spécialisé dans le trail running et l’ultra trail, fait aussi parti des polarités secondaires. Cependant, il occupe une place plus périphérique et ne fait pas partie du cluster organisateur/runners. Il occupe cette place grâce à un autre réseau social au sein de ce graphe, constitué essentiellement d’individus. 

Enfin, les partenaires financiers (Salomon, entre autres) ne se démarquent pas au sein du graphe.

 

Capture d’écran 2018-10-15 à 12.37.40

Capture d’écran 2018-10-15 à 12.38.03

 

Le graphe s’articule autour de stars de la discipline. Kilian Jornet (286’000 abonnés), François D’Haene (11’900abonnés) et Nuria Picas (48’800 abonnés) principalement.


LES ACTEURS QUI TWEETENT

Le poids attribué aux noeudS est basé sur leur degrés sortant, soit le nombre de fois où un acteur a tweeté sur un événement. Le graphe qui en résulte permet de comprendre les personnes qui tweetent le plus sur l’événement afin de connaître la communauté mobilisée autour de l’événement.

On observe ainsi une forte présence des médias espagnols dans cet espace social. L’acteur qui tweet le plus ne correspond pas au compte officiel de l’événement (UTMBMontBlanc). Ce sont deux médias espagnols spécialisés dans le trail, TerritorioTrail et CarreraTrail. Ces deux clusters sont clairement visibles ci-dessous.

Les acteurs qui tweetent le plus sur l’événement sont essentiellement des médias espagnols. L’organisateur occupe encore une place centrale dans le graphe. Il est donc non seulement cité, mais est aussi actif au sein du réseau. Si les sportifs sont beaucoup cités (cf. graphe «Les acteurs de l’UTMB 2017»), en revanche, ils tweetent peu. Ces polarités sont alors dans une relation unilatérale où les liens sont quasi essentiellement entrants et non sortants. Ils font parler d’eux grâce à leur performance, en cela ils influencent le réseau.

Capture d’écran 2018-10-15 à 13.08.16

 

Capture d’écran 2018-10-15 à 13.08.29


DE L’INDIVIDU À LA COMMUNAUTÉ
— IDENTIFIER DES CLUSTERS

Le poids des noeuds dépend de leur redondance. Ici un algorithme de modularité a été appliqué (paramétré à 1,5). Cet algorithme permet de mettre en lumière des communautés. Ce graphe permet de comprendre les différentes communautés sociales qui se créent.

Ici, quatre communautés ressortent :
– la communauté de l’organisateur (vert),
– la communauté des sportifs (violet),
– la communauté I run far (rose),
– la communauté des individus (rouge)

La communauté de l’organisateur est basée sur un modèle monocentrique où l’UTMBMontBlanc occupe la place centrale. Cet acteur est alors un réel influenceur au sein du réseau.

Capture d’écran 2018-10-15 à 13.10.43.png

La communauté des sportifs est polycentrique, structurée autour de trois runners : Nuria Picas, Kilian Jornet et François d’Haene.

La communauté I run far est, comme celle de l’organisateur, monocentrique.
C’est ce dernier qui est la polarité centrale.

Capture d’écran 2018-10-15 à 13.10.26

 

La communauté des individus est quant à elle particulière. Il s’agit de tous les individus qui tweetent sur l’événement, mais ne font pas partie d’un réseau préétabli. Se trouvent au sein de cette communauté des individus qui tweetent sur l’événement sans mentionné d’autres personnes, soit des «individus isolés». Dans ce réseau sont aussi présents des individus qui tweetent en mentionnant d’autres individus, créant des petits clusters au sein de cette communauté. Il s’agit alors de groupes familiaux ou amicaux.

Auteur.e.s : M. Plard & V. Guichet, 2018

Courses Natures. Spatialiser les courses sur sentiers – trail

Répartition spatiale des évènements
« courses Nature » en 2017

Capture d’écran 2018-10-15 à 11.29.31

Sources : Running DataLab, 2018
Conception & Réalisation : Mathilde Plard (Chercheuse CNRS) et Violaine Guichet (Ingénieure d’étude)

 

Polarité et densité des évènements
« courses Nature“ en 2017

Capture d’écran 2018-10-15 à 11.37.23.png

Sources : Running DataLab, 2018
Conception & Réalisation : Mathilde Plard (Chercheuse CNRS) et Violaine Guichet (Ingénieure d’étude)

 

Auteur.e.s : M. Plard & V. Guichet, 2018

Petit atlas du running 2017 en France métropolitaine

La course à pied en France

Il est difficile de connaître le nombre de courses pied organisées qui se déroulent autour du monde. Il est alors impossible de connaître le pourcentage d’exhaustivité de cette base de données constituées.
Cependant, selon une étude de 2014 publiée par Kantar Media et Uniteam Sport, en 2013 ont été organisées 5 971 événements de courses à pied en France. Le journal le parisien estime entre « 5 000 à 6 000 épreuves annuelles françaises ». Dans la base de données créée par le Running DataLab, la France comptabilise en 2017 6314 événements de courses à pied.
Les travaux cartographiques présentés sont fidèles aux réalités territoriales.

Les événements de courses à pied en quelques chiffres…

6 342 événements de courses à pied regroupant 15 547 courses à pied

Sur les 6 342 événements, nous connaissons le nombre de finishers pour 4 591 d’entre eux. Ce qui représent quasiment les trois-quarts des événements. Le nombre de finishers s’élève à 2 505 588 personnes. Sachant que tous les événements ne sont pas compatibilités et que seuls les finishers sont pris en compte (non tous les coureurs), cela signifie que l’on est dans une fourchette basse.

Répartition des événements de courses à pied

 

 

Atlas International des évènements running 2017

Densités / Intensités internationales

Des précautions doivent être prises concernant le jeu de données créé à l’échelle internationale (cf. Précautions sur les données « atlas running 2017′). Cependant, des intensités se dessinent entre les latitudes 55 ° et 30 °.

event_densite-01

methodologie_maillage-01

Zoom sur les sous-régions

L’Amérique du Nord et l’Europe de l’Ouest sont les deux sous-régions ayant le plus de nombres d’événements. L’Europe du Nord et du Sud ainsi que l’Australie et la Nouvelle-Zélande concentrent aussi un nombre important d’événements.

repartition_event_subreg_2017-01

En Europe de l’Ouest, les événements de courses à pied sont concentrés en France.

Northern America_repartition_event

Northern Europe_repartition_event

Western Europe_repartition_event

Southern Europe_repartition_event

Western Europe_repartition_event

 

 

RunPDL

Le projet RunPDL étudie les différents événements de courses à pied se déroulant dans la région des Pays de la Loire. Le premier objectif consiste à recueillir les données des événements dans un système d’information géographique afin de spatialiser les informations.

Petit atlas des évènements running 2017 en Pays de la Loire

La région Pays de la Loire comptabilise sur l’année 2017 un total de 610 événements de courses à pied. Sur ces 610 événements, le nombre de finishers est renseigné pour 263 et la totalité des coureurs est 159 535.

Quelles sont les courses à pied existantes ?

Une course à pied est définie par un certain nombre de critères. Certains critères peuvent être officiels et définis dans le cahier des charges des compétitions labellisées. Ces derniers sont alors arrêtés par les organismes compétents (Fédération Française d’Athlétisme — FFA, Association Internationale des Fédérations d’Athlétisme — IAAF, etc.). D’autres critères sont non-officiels puisque les courses en découlant ne sont pas labellisées et donc assujetties à un cahier des charges. C’est le cas par exemple des « color run » où tous des pigments de couleurs sont lancés tous les kilomètres ou encore les « mud run » qui se déroulent dans la boue et dont le parcours est ponctué par une succession d’obstacles.

critere_CAP

 

Cartographies Pays de la Loire

 

Nombre de finishers par évènement de courses à pied — Pays de la Loire 2017

nb_finisher_PDL

Évènements de courses à pied de fond — Pays de la Loire, 2017

Évènements de courses à pied de fond — Pays de la Loire, 2017

Évènements de courses “non renseignées“ — Pays de la Loire, 2017

PDL_CAP_2017_NR

 

Évènements de courses à pied sur route — Pays de la Loire, 2017

PDL_CAP_2017_sur route

Évènements de courses à pied sur sentiers, Pays de la Loire, 2017

PDL_CAP_2017_sur_sentier

Évènements de courses à pied — ULTRAFOND, Pays de la Loire, 2017PDL_CAP_2017_ultrafond

 

Auteur.e.s : M. Plard & V. Guichet, 2018

Aucune publication trouvée.