Description du jeu de données 2017

Explorer les événements de course à pied à partir des données du Web.

La description du jeu de données est disponible à cette adresse, ainsi que les jeux de données eux-mêmes pour les courses 2017 et les évènements de la même année.

https://www.nakala.fr/nakala/data/11280/d0ada45b

Dans le cadre d’une étude sur les événements de courses à pied internationaux, la connaissance de la répartition est une information nécessaire afin de comprendre l’ampleur de ce phénomène et pouvoir l’analyser spatialement.

Les fondements de cette base de données prennent naissance dans des sites internet divers. Il s’agit d’explorer l’espace du Web, comme une source de matériaux qui permet de nourrir des réflexions géographiques : comment mobiliser l’immensité de ces données ? Comment les extraire, les structurer, les organiser et les valoriser ? Comment passer des données virtuelles à des données géographiques ? Sont autant de questions qui ont été posées et auxquelles des solutions ont été testées pour parvenir à créer ce jeu de données.

from_the_web_to_the_maps

Le jeu de données a été créé à partir de 6 sites-sources. Pour extraire les données, deux méthodes ont été utilisées : semi-automatique et manuelle. Ces sites sont variés : institutionnels et non-institutionnels, francophones et anglophones, etc. Cette variété permet d’obtenir une base de données la plus complète soit il d’un point de vue quantitatif et sémantique.

Le jeu de données Running 2017 en quelques chiffres

jeu_donnees-01

In fine, le jeu de données est composé de quasiment 35 000 événements de courses à pied où se déroulent 88 000 courses à pied. Pour rappel, durant un événement de courses à pied peuvent se dérouler plusieurs courses (marathon, semi-marathon, 10 K, etc.).

event_datas-01
course_datas-01-01

Limites du jeu de données.

Du fait de la complexité des informations contenues sur le Web et de l’hétérogénéité des données publiées d’un site à l’autre, le jeu de données constitué a des limites.

Ces limites sont à prendre en compte lors de l’utilisation du jeu de données et dans les analyses qui en découlent.

Pour plus d’informations sur les précautions à prendre en compte, cliquez ici.

Auteur.e.s : M. Plard & V. Guichet, 2018

Construction de l’objet running à partir de sources numériques hétérogènes — Working Paper / Document de travail

 

HAL_couv_construction

Le processus de publications académiques s’inscrit dans un temps long. La diffusion d’un document de travail permet d’inscrire les travaux de recherche dans un rythme de communication plus dynamique et de diffuser plus rapidement des pistes d’analyses, des premiers résultats. Il ne s’agit pas d’un positionnement définitif mais d’une étape d’avancement.

Construction de l’objet running à partir de sources numériques hétérogènes est disponible en téléchargement sur les archives ouvertes HAL.

Citation : Violaine Guichet, Mathilde Plard. Construction de l’objet running à partir de sources numériques hétérogènes. 2018.

Dans le cadre du libre accès, « l’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion d’articles scientifiques de niveau recherche, publiés ou non, et de thèses, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. »

Résumé —  L’article revient sur les étapes de conception et de construction du jeu de données structurées et harmonisées dans le cadre du projet RUNNING DATALAB. Sur le format d’un data paper l’article doit favoriser la valorisation des données en les rendant accessibles, interopérables et réutilisables. Une introduction générale précise le contexte scientifique dans lequel s’inscrit cette volonté de structuration d’une base de données standardisée sur le thème des événements de courses à travers le monde. La première partie présente les étapes de mise en oeuvre de cette base de données.

 

Auteur.e.s : M. Plard & V. Guichet, 2018

 

Constitution d’un jeu de données social à partir des données twitter — Working Paper / Document de travail

 

HAL_couv_twitter

 

Le processus de publications académiques s’inscrit dans un temps long. La diffusion d’un document de travail permet d’inscrire les travaux de recherche dans un rythme de communication plus dynamique et de diffuser plus rapidement des pistes d’analyses, des premiers résultats. Il ne s’agit pas d’un positionnement définitif mais d’une étape d’avancement.

Constitution d’un jeu de données social à partir des données twitter est disponible en téléchargement sur les archives ouvertes HAL.

Citation : Violaine Guichet, Mathilde Plard. Constitution d’un jeu de données social à partir des données twitter. 2018.

Dans le cadre du libre accès, « l’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion d’articles scientifiques de niveau recherche, publiés ou non, et de thèses, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. »

Résumé —  Le présent article présente les étapes de construction d’un jeu de données sociales sur un événement de course à pied. Les informations sources sont extraites du réseau social Twitter.

Auteur.e.s : M. Plard & V. Guichet, 2018

Captation, extraction et restructuration de données à partir de sources numériques hétérogènes — Working Paper / Document de travail

 

HAL_COUV_captation

Le processus de publications académiques s’inscrit dans un temps long. La diffusion d’un document de travail permet d’inscrire les travaux de recherche dans un rythme de communication plus dynamique et de diffuser plus rapidement des pistes d’analyses, des premiers résultats. Il ne s’agit pas d’un positionnement définitif mais d’une étape d’avancement.

Captation, extraction et restructuration de données À partir de sources numériques hétérogènes est disponible en téléchargement sur les archives ouvertes HAL.

Citation : Violaine Guichet, Mathilde Plard. Captation, extraction et restructuration de données À partir de sources numériques hétérogènes. 2018.

Dans le cadre du libre accès, « l’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion d’articles scientifiques de niveau recherche, publiés ou non, et de thèses, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. »

Auteur.e.s : M. Plard & V. Guichet, 2018

 

L’Atlas France Métropolitaine des évènements running 2017 — Working Paper / Document de travail

 

titre.pngLe processus de publications académiques s’inscrit dans un temps long. La diffusion d’un document de travail permet d’inscrire les travaux de recherche dans un rythme de communication plus dynamique et de diffuser plus rapidement des pistes d’analyses, des premiers résultats. Il ne s’agit pas d’un positionnement définitif mais d’une étape d’avancement.

Le DOCUMENT DE TRAVAIL ATLAS FRANCE MÉTROPOLITAINE est disponible en téléchargement sur les archives ouvertes HAL.

Citation : Mathilde Plard, Violaine Guichet. Atlas du Running DataLab – les évènements de courses à pied en France métropolitaine en 2017. 2018.

Dans le cadre du libre accès, « l’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion d’articles scientifiques de niveau recherche, publiés ou non, et de thèses, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. »

 

Auteur.e.s : M. Plard & V. Guichet, 2018

 

 

Présentation du jeu de données

 

atlas_france_metropolitain_20173atlas_france_metropolitain_20175

atlas_france_metropolitain_20176

atlas_france_metropolitain_20177

 

 

Les évènements de courses à pied

 

atlas_france_metropolitain_20179atlas_france_metropolitain_201711atlas_france_metropolitain_201713atlas_france_metropolitain_201715atlas_france_metropolitain_201717

Sport&Society Conference.18

Capture d’écran 2018-10-15 à 09.46.30.png

par M. Plard & V. Guichet

Special Focus –
Sports Impacts: Reshaping Cities, Environments, People

Sports are forms of social organization. They depend upon, and are always supported by, institutional infrastructures. In what ways should we measure the material impact of sports on cities, environments, and their people? How might we consider infrastructures as agents of change, environmental, economic, and social?

 

Édition 2018 : Florida International University

Running 2.0, the Web Graph of a Running Event:
Case Study of UTBM and NYC Marathon

Mathilde Plard, Universite de Nantes, Nantes, France
Guichet Violaine, Universite de Nantes, Nantes, France

Running is turning into a very popular mass sport. CHALLENGE project aims to contribute to the understanding of whom the runners are and what are their connections to one running event. We choose the social space of the web to explore those relationships. Web 2.0 provides new insights into the ability of sports events to structure social territories. Data from Twitter are used to assess the dynamic of the WebSpace from the accounts of two iconic races: Ultra-Trail du Mont-Blanc in France and the New York City Marathon in the United States. Web Graphs are valuable tools for exploring and queering the relationships between polarities such as hashtags, users, twitter, links, media. An innovative two-step method has been used to shape the database: capture and extraction of the web to collect twitter data (step 1), import and processing in free software analysis and visualization Gephi (step 2). Results will be presented in the form of graphs to illustrate the analysis of lexical fields and representations associated with events; and mappings to show the spatial radiation of events from the user’s account. The exploratory results highlight the emergence of a social community whose territory functions in a reticular way.

Auteur.e.s : M. Plard & V. Guichet