Blog

Last modified by Carlos McGregor on 2025-03-24, 23:46

Jan 27 2025

Bienvenue au nouvel Explorateur de données !

Blog post in English here.

Nous sommes ravis d’annoncer aujourd'hui le nouvel Explorateur de données de Borealis. L’Explorateur de données est une application basée sur le web qui permet l’exploration, l’analyse et la conservation de variables dans des ensembles de données directement via Odesi et Borealis

Suivant la migration du répertoire de données Odesi de Nesstar à Borealis en automne 2023, les commentaires de la communauté nous ont informé que de nouveaux outils étaient nécessaire pour mieux supporter les conservateurs, les chercheurs, et les utilisateurs d’ensembles de données. Depuis, nous avons mis à jour et modernisé L’Explorateur de données original et l’outil de conservation de données (précédemment deux outils distincts) en les unissant sous une seule application connectée à Borealis et Odesi. 

L'Explorateur de données supporte désormais les utilisateurs et utilisatrices de Odesi et Borealis lors de la visualisation et l’exploration de fichier tabulaire, leurs variables associées, leurs métadonnées, leurs statistiques sommaires, leurs téléchargements et lors de la création de tableaux-croisés et graphiques récapitulatifs.

Le nouvel Explorateur de données permet à ses utilisateurs et utilisatrices qui possèdent les autorisations requises de voir et modifier les métadonnées de leurs ensembles de données en utilisant l’interface de programmation (API) de Dataverse et les métadonnées conformes au standard Data Documentation Initiative (DDI). Grâce à l’union des deux outils précédent, les nouvelles fonctions de l’Explorateur de données permettent aux administrateurs et conservateurs d’ensembles de données de facilement créer et modifier les métadonnées de variables pour tous fichiers tabulaires (tel que SPSS, R, Excel, CSV) directement au travers de Odesi et Borealis.

L’Explorateur de données est un logiciel open source basé sur le web conçu et développé par Scholars Portal (OCUL). Notre logiciel est entièrement intégré avec le logiciel open source “Dataverse repository project” (dataverse.org) développé par l’IQSS de l’université Harvard à l’aide de collaborateurs de la communauté internationale.

Pour en savoir plus sur l'utilisation du nouvel Explorateur de données, consultez la section L’Explorateur de données du guide pour utilisateur de Odesi, ainsi que deux nouveaux tutoriels vidéos.

Mis à jour de l’interface utilisateur

Le nouvel Explorateur de données offre une interface utilisateur modernisée, dorénavant plus accessible et facile à utiliser grâce aux nouvelles icônes de navigations.

Nous avons ajouté de nouveaux boutons pour les groupes de variables et une nouvelle option pour voir toutes les variables de l’ensemble de données dans un seul groupe. L’interface utilisateur comporte désormais les nouveaux onglets “Variables” et “Tableaux croisés” pour simplifier le processus d’ajout de variables et de catégories lors de la création de tableaux croisés et de graphiques récapitulatifs. 

L’interface utilisateur est disponible an Français et en Anglais et peut aussi être passé au mode sombre si désiré. L’interface utilisateur améliore aussi l’utilisation de l’Explorateur de données sur les appareils mobiles. 

Capture d’écran qui met l’emphase sur les outils de navigation de l’interface utilisateur principal de l’Explorateur de données ainsi que le mode sombre et le menu déroulant pour changer le langage. 

Exploration des variables améliorée

Le nouvel explorateur de données facilite désormais la recherche, la filtration et la visualisation des variables.

Les utilisateurs de l’Explorateur de données peuvent chercher les noms de variables, leurs étiquettes et leur code d’identification à l’aide de la barre de recherche située au haut du tableau des variables. Les variables peuvent aussi être accédées par groupes, catégories, et étiquettes pour plus facilement créer des tableaux croisés et des graphiques récapitulatifs. 

Les utilisateurs de l’Explorateur de données peuvent aussi sélectionner l’option “Visualiser une variable” pour accéder à son graphique récapitulatif et ses données, aux statistiques sommaires et aux informations de la variable telles que la question littérale, l’univers, les remarques et plus encore. Les données du graphique incluent les fréquences, le pourcentage de chaque fréquence, la fréquence pondérée, et le pourcentage de chaque fréquence pondérée. Chaque valeur présentée dans le graphique récapitulatif peut être ajoutée ou retirée à l'aide de leur case à cocher. Les utilisateurs peuvent passer de variable en variable sans fermer la fenêtre “Visualiser une variable” à l’aide des flèches de navigation situées au haut la fenêtre. 

Capture d’écran de l’interface utilisateur de l’Explorateur de données mettant l’emphase sur le bouton “Visualiser une variable”.

Capture d’écran illustrant les flèches de navigation de la fenêtre “Visualiser une variable”.

Capture d’écran de la fenêtre “Visualiser une variable”. Celle-ci met l’emphase sur le titre des colonnes du tableau des données du graphique et le rôle que joue les cases à cocher lors de la personnalisation du graphique récapitulatif.

Capture d’écran de la section des statistiques sommaires sur la fenêtre “Visualiser une variable”.

Capture d’écran de la section des information sur la variable sur la fenêtre “Visualiser une variable”.

Création des tableaux croisés

Le nouvel Explorateur de données permet de plus facilement créer des tableaux croisés. 

Pour créer des tableaux croisés, il faut d’abord sélectionner l’icône “Ajouter au tableau croisé” pour chaque variable désirée. Une fois qu’elles sont sélectionnées, vous pouvez ouvrir l’onglet “Tableaux croisés” situé au-dessus de la colonne des groupes. 

Capture d’écran de l’interface utilisateur principale de l’Explorateur de données mettant l’emphase sur le bouton “Ajouter au tableau croisé”.

À partir de l’onglet des tableaux croisés, vous pouvez assigner à le rôle de ligne ou de colonne à chaque variable à l’aide du menu déroulant “Ligne ou colonne?”. Le tableau est automatiquement créé pour refléter vos décisions. 

Capture d’écran de la page des tableaux croisés mettant l’emphase sur comment le rôle de ligne et de colonne affectent la création du tableau croisé.

Vous avez l’option de télécharger votre tableau croisé à l’aide du bouton rose “Exporter le tableau au format CSV” situé au-dessus du tableau croisé nouvellement créé. 

Téléchargement de variable 

Les utilisateurs de l’Explorateur de données ont aussi l’option télécharger les variables de leur choix. À partir de l’onglet des variables, les utilisateurs peuvent sélectionner les cases à cocher de chaque variable désirée. En sélectionnant ensuite le menu déroulant “Télécharger”, l’option “Télécharger le sous-ensemble” sera disponible. Le nombre de variables sélectionnées peut être trouvé sur le bouton “Télécharger”. 

Capture d’écran de l’interface utilisateur principale de l’Explorateur de données avec le menu déroulant “Télécharger” ouvert.

Bien que l’Explorateur de données soit robuste pour les analyses de données préliminaires, les utilisateurs sont fortement encouragés à consulter les fichiers de données originales et, si applicable, les documents d’informations additionnels associés à l’ensemble de données en question. 

Téléversement des Métadonnées conformes au standard DDI

Le nouvel Explorateur de données permet aussi aux administrateurs et aux conservateurs de données de téléverser et réutiliser leur métadonnées conformes au standard DDI sous format XML. Ceci peut être accomplie en sélectionnant l’option “Importer les métadonnées” situé au-dessous de la fenêtre sous la colonne des groupes. Une fois sélectionné, le fenêtre “Importer XML” s’ouvrira et permettra aux utilisateurs de sélectionner quelles sections du fichier des métadonnées conformes au standard DDI à importer lors du téléversement.

Notez que seuls les fichiers XML générés par l’Explorateur de données peuvent être téléversé à ce moment. 

Capture d’écran dans laquelle une flèche pointe le bouton “Importer les métadonnées”. Cette capture d’écran montre aussi le fenêtre “Importer XML” dans laquelle une flèche pointe le bouton de sélection du fichier à téléverser.

Téléchargement des livres de codes des métadonnées conformes au standard DDI sous format PDF et HTML

Une fois qu’un ensemble de données est publié, un livre de codes des métadonnées conformes au standard DDI sera automatiquement créé. Ce livre de code peut être téléchargé à l’aide du menu déroulant “Conditions d’accès au fichier”, dans lequel se trouve l’option “Métadonnées des variables”. Les métadonnées de l’ensemble de données peuvent aussi être téléchargées sous format PDF ou HTML à partir du menu déroulant “Télécharger” situé sur la l'interface utilisateur principale de l’Explorateur de données. 

Capture d’écran de la page principale de l’ensemble de données avec le menu déroulant “Conditions d’accès au fichier” ouvert. Une flèche rouge pointe l’option de téléchargement “Métadonnées des variables”.

Capture d’écran de l’interface utilisateur principale de l’Explorateur de données. Le menu déroulant “Télécharger” est ouvert. Une flèche verte pointe l’option de téléchargement “Télécharger le fichier en format PDF” et une autre pointe l’option “Télécharger le fichier en format HTML”.

Nouveaux guides et tutoriels vidéos

Pour accompagner le nouvel Explorateur de données, nous avons préparé de nouveaux guides et tutoriels vidéos pour supporter les chercheurs et les conservateurs d’ensemble de données. 

Nous avons révisé le guide pour utilisateur de Odesi et le guide pour utilisateur de Borealis pour inclure les nouvelles fonctions de l’Explorateur de données. Le guide d’administration Borealis fut aussi mis à jour.  

Deux nouveaux tutoriels vidéos sont maintenant disponibles sur la page des vidéos de formation de Odesi ainsi que sur la chaîne YouTube de Borealis. La première vidéo offre un aperçu du nouvel Explorateur de données. La deuxième offre plus d’information pour la conservation d’ensemble de données et s'adresse donc principalement aux administrateurs et conservateurs d’ensemble de données. 

Le dépôt GitHub de l’Explorateur de données est également accessible au public.

Contactez-nous 

Si vous avez des questions par rapport au nouvel Explorateur de données, n’hésitez pas à nous contacter à odesi@scholarsportal.info. Un membre de notre équipe sera en contact avec vous aussi tôt que possible. 

Jan 27 2025

Introducing the new Data Explorer!

Article de blogue en français ici.

We are excited to announce the official release of the new and improved Data Explorer in Borealis. Data Explorer is a comprehensive web application designed to support data exploration, analysis, and curation at the variable-level in Odesi and Borealis

Following the Odesi data repository migration from Nesstar to Borealis in fall 2023, feedback from the community indicated a need for additional functionality in connected tools to better support data depositors, curators, researchers and users. Over the past year, we re-developed the Data Explorer and Data Curation Tool (previously two separate tools) and combined them into a single, enhanced application connected to Borealis and Odesi.

Data Explorer supports users in Odesi and Borealis with viewing and exploring tabular data files and variables by groups or category/subject, variable metadata, summary frequencies and statistics, building cross-tabulations, charts, subsetting, and downloading data. 

The new Data Explorer allows authorized users to view and edit variable metadata using the Dataverse APIs and Data Documentation Initiative (DDI) metadata. New features enable data administrators and curators to create and edit variable-level metadata for tabular files (e.g., SPSS, R, Excel, CSV) in Odesi and Borealis for enhanced curation workflows, combining the full functionalities of the previous Data Curation Tool.

Data Explorer is an open-source web application built and developed by Scholars Portal (OCUL). The application is fully integrated with the open-source Dataverse repository project (dataverse.org) developed by IQSS, Harvard University together with global collaborators. 

An overview of the new features and functionalities in Data Explorer is provided below. To learn more about getting started with the new Data Explorer, refer to the Using the Data Explorer section of the Odesi User Guide, as well as two new video tutorials

Updated Web Interface

The new Data Explorer offers a refreshed, accessible web interface with updated navigation and icons. 

New navigational buttons for variable “Groups” and option to show “All Variables” are added, along with new “Cross Tabulation” and “Variables” tabs in order to view selected variables and categories to create tables and charts. 

The new user interface can be viewed in English or French, and users can view the application in dark mode, if desired. The updated interface also provides an improved experience for mobile-device users.

Screenshot indicates key variable navigation features (including the search bar and the items per page options) as well as language and dark mode settings 

Enhanced Variable Exploration

The new Data Explorer provides enhanced variable searching, filtering, viewing, and exploration capabilities. 

Users can search by variable names, labels, and IDs using the “Search table” bar at the top of the center panel. Users can also view and filter variables by groups, categories, and labels to view frequencies and build cross-tabulations and charts. 

Users can select the “View Variable” graph icon to view variable frequencies and chart data, summary statistics, and additional variable information such as questions, interview instructions, weights, universes, and more. Charted data shows values, categories, counts, count percentages, weighted counts, and weighted percentages. Users can select or deselect checkboxes for each variable to include or remove selected categories and values from the summary graphs provided.

In the “View Variable” window, users can navigate between adjacent variables using the navigation arrows to view more variables.

Screenshot of the Data Explorer user interface with emphasis placed on the “View Variable” button

Screenshot of the “View Variable” window denoting the window’s navigation arrows.

Screenshot of the View Variable window depicting the Chart data

Screenshot of the Summary statistics and variable information sections of the View Variable window.

Cross-Tabulations & Chart Builder

The new Data Explorer also provides improved functionality for creating cross tabulations and charts.

To build a cross tabulation, select the “Add to cross tabulation” icon for each desired variable. Once all variables have been selected, navigate to the “Cross Tabulation” window using the tab in the top left. 

Screenshot of the main Data Explorer user interface placing emphasis on the “Add to cross-tabulation” button.

From here, assign the variables as a row or column using the drop down menus, and apply any desired “Group” or “Category” filters. The table will automatically generate based on these inputs.

Screenshot of the cross-tabulations tab demonstrating how assigning variables as rows or columns affects the cross tabulation table construction.

Users now have the option to export cross tabulation tables and charts from Data Explorer in CSV format for further analysis. Toggling between Chart and Table to choose the desired export format, click the “Export chart/table as CSV” button.

Variable Subsetting & Download 

Users can also download select variables as a subset. From the variables tab, users can select the check boxes next to the desired variables in order and then click the “Download” drop-down button in the top right corner. The number of selected variables will appear next to the “Download” button. Select “Download selected variables as a subset”. 

Screenshot of the main Data Explorer user interface with the “Download” scroll down menu open.

Note that we strongly recommend downloading the original data file in addition to any subsets, and users are strongly encouraged to consult original data files and accompanying documentation when conducting data analysis for their research. 

Import DDI XML 

With newly combined functionality for both exploration and curation, the new Data Explorer allows depositors and curators to import and reuse DDI XML metadata. 

Alt-text: Screenshot of the main Data Explorer page with an emphasis placed on the “Import Metadata” button.

In the bottom left corner of the “Groups” panel in Data Explorer, select “Import Metadata”. From the “Import XML” page, depositors and curators can select or deselect DDI sections and texts to include in the import. 

Screenshot of the “Import XML” page, which includes the File Select option, as well as the “Select DDI sections and texts to include” check-box options.

Please note that the “Import XML” feature only allows for import and re-use of Dataverse-generated DDI metadata at this time. 

DDI Codebook HTML & PDF Download

Upon publishing a dataset, a DDI standard metadata ‘DDI Codebook’ will be automatically created for that dataset. This Codebook can be downloaded through the “Access File” drop-down option in Borealis. Under “Metadata Download” select “Variable Metadata” to download the DDI Codebook.Users can also access a DDI Codebook as an HTML or PDF file through the Data Explorer’s “Download” tab.

Screenshot of the Dataset main page with the “Access File” drop down menu with an emphasis placed on the “Variable metadata” download option.

Screenshot of the Data Explorer main user interface with the Download drop down menu open. Green arrows point towards the “Download PDF format file” and “Download HTML format file” options.

New Documentation & How-to Videos

With the release of the new Data Explorer, we have prepared updated documentation to support researchers, depositories, and curators with the new interface and functionalities. 

The existing Odesi User Guide and Borealis User Guide have been revised to reflect the new Data Explorer, including updated screenshots. The Borealis Admin Guide has also been updated to reflect changes to curation workflows using the new Data Explorer. 

Two new video tutorials are also now available on the Video Tutorials tab of the Odesi User Guide and on the Borealis YouTube channel. The first video provides an overview of the new Data Explorer. The second video provides more information about using Data Explorer for data curation. 

The GitHub Repository for Data Explorer is also publicly available. 

Contact Us

If you have any questions or concerns about the new Data Explorer, please reach out to odesi@scholarsportal.info and a member of our team will be in touch as soon as possible.

Jan 23 2025

Borealis passe à la version 6.4 - Nouvelles fonctionnalités

Article de blogue en anglais ici

Borealis est passé à la version 6.4 le 27 janvier 2025. Cet article de blog présente plusieurs nouvelles fonctionnalités, notamment :

Les autres nouveautés sont :

  • Amélioration de la gestion des fichiers shapefile/zip
  • Normes de métadonnées étendues, y compris la prise en charge de Croissant
  • Améliorations de l'API de recherche
  • Les balises de métadonnées incomplètes ne sont plus visibles par le public.
  • Amélioration de l'indexation et des performances
  • Corrections de bogues et plus encore !

Tous les détails sur les nouvelles fonctionnalités et les changements peuvent être trouvés dans les pages GitHub Release de l'IQSS (en anglais uniquement).  Veuillez noter que toutes les fonctionnalités disponibles ne seront pas activées dans Borealis.

N'hésitez pas à nous contacter si vous avez des questions ou des commentaires.

Explorateur de données entièrement redessiné

Nous avons le plaisir d'annoncer la sortie officielle du nouvel explorateur de données amélioré dans le cadre de cette mise à jour. L'explorateur de données est une application web complète conçue pour faciliter l'exploration, l'analyse et la conservation des données au niveau des variables pour les ensembles de données tabulaires dans Borealis et Odesi . Voici quelques-unes de ses caractéristiques :

  • Interface Web actualisée et accessible
  • Exploration améliorée des variables
  • Calculateur de tableaux croisés
  • Sous-ensemble de données et téléchargement
  • Importation de DDI XML pour les flux de travail de curation

Veuillez consulter notre article de blog détaillé sur la version de Data Explorer pour en savoir plus sur les nouvelles fonctionnalités et les améliorations.

Nouveau champ « Type de relation » pour les métadonnées de publication connexe afin de se conformer au schéma DataCite Metadata 4.5

De quoi s'agit-il ?

Dans le champ « Publication connexe », un nouveau sous-champ a été ajouté, appelé « Type de relation », qui est utilisé pour décrire la relation entre l'ensemble de données et la ressource connexe.  

Quel est le cas d'utilisation ?

Avec ce changement, le logiciel Dataverse supporte désormais le schéma DataCite v4.5 et les champs de métadonnées sont inclus dans la sortie XML de DataCite. Le menu déroulant comprend les types de relations disponibles basés sur les valeurs les plus courantes recommandées par DataCite :

  • Est cité par
  • Cite
  • Est un supplément de
  • Est supplémenté par
  • Est cité par
  • Référé à

Pour les ensembles de données nouveaux ou existants pour lesquels le « Type de relation » n'a pas été spécifié, « Est un supplément de » est supposé dans l'exportation XML de DataCite.

Comment accéder à cette fonctionnalité ?

Le champ « Publication connexe » est disponible dans le bloc de métadonnées de la citation lors de la création de l'ensemble de données ou lors de l'édition des métadonnées.

Capture d'écran des métadonnées de la publication associée avec le menu déroulant « Type de relation ».

Les utilisateurs doivent saisir un DOI ou un autre identifiant permanent pour que les informations soient incluses dans l'exportation XML de DataCite.

Bien que les valeurs soient fournies en français dans le menu déroulant si l'interface utilisateur est en français, seules les valeurs en anglais sont exportées dans le fichier XML de DataCite.

La capture d'écran suivante montre la sortie XML de DataCite avec le nouveau champ « type de relation » inclus.

Capture d'écran de la sortie XML de DataCite montrant les nouvelles métadonnées de type identifiant apparenté mises en évidence 

Le bloc de métadonnées du flux de travail informatique comporte désormais des URL cliquables

De quoi s'agit-il ?

Le bloc de métadonnées du flux de travail informatique permet aux utilisateurs de créer un lien vers un référentiel de code externe où sont stockés le code et les étapes du flux de travail. Cette mise à jour améliore l'affichage des métadonnées en incluant un lien cliquable vers l'URL du référentiel de code externe.

Quel est le cas d'utilisation ?

L'inclusion des flux de calcul dans la documentation des ensembles de données fait de plus en plus partie des meilleures pratiques pour soutenir la gestion transparente des données et la reproductibilité. 

Comment accéder à cette fonctionnalité ?

Une fois l'ensemble de données sauvegardé, allez dans l'onglet « Metadata »  et sélectionnez  « Ajouter + Modifier les métadonnées », puis naviguez jusqu'au bloc « Métadonnées du flux de travail informatique ». Ensuite, remplissez les champs appropriés, y compris l'URL dans le champ « Adresse URL du dépôt de codes externe » que vous souhaitez lier à votre jeu de données. Ensuite, enregistrez et consultez les métadonnées. Il y aura maintenant un lien cliquable. Pour plus d'informations, n'hésitez pas à consulter notre précédent article de blog.

Capture d'écran de la section « métadonnées sur le flux de travail informatique » avec un lien cliquable.

Amélioration des notifications par courrier électronique lorsqu'un registre de visites est utilisé pour des demandes d'accès à des fichiers

De quoi s'agit-il ?

Les registres des visites sont conçus pour recueillir des informations sur les utilisateurs au moment de la prévisualisation/du téléchargement d'un fichier ou au moment de la demande d'accès à un fichier (selon la configuration de la collection). Lorsque les utilisateurs remplissent un registre de visites, les administrateurs et les conservateurs des ensembles de données reçoivent un courriel de notification. Cette mise à jour apporte des améliorations aux courriels de notification lorsque les utilisateurs complètent un registre des visites au moment de la demande d'accès au fichier. Les améliorations sont les suivantes :

  • Le sujet du courriel comprend maintenant le nom et l'identifiant de l'utilisateur ou du demandeur.
  • Le texte du courriel comprend maintenant l'identifiant de l'utilisateur du demandeur.
  • Le formatage du texte des réponses au registre des visites a été amélioré afin de le rendre plus lisible.

Quel est le cas d'utilisation ?

Les registres des visites aident les administrateurs de collections et les propriétaires d'ensembles de données à suivre les utilisateurs qui téléchargent leurs fichiers et à examiner les informations avant d'accorder ou de refuser l'accès à des fichiers à accès restreint. Ces améliorations facilitent l'organisation et le traitement de ces flux de travail.

Comment accéder à cette fonctionnalité ?

Les administrateurs de collections et les conservateurs d'ensembles de données qui ont configuré un registre des visites sur un ensemble de données recevront automatiquement ces courriels lorsque les utilisateurs entreront des réponses dans le registre des visites.

Pour plus d'informations sur les registres des visites, veuillez consulter le Guide de l'utilisateur et le Guide d'administration de Borealis.



Capture d'écran du courriel de demande d'accès au registre des visites.

Bouton pour délier de l'ensemble de données

Qu'est-ce que c'est ?

Un nouveau bouton « Délier les données » a été ajouté à la page des données pour permettre aux utilisateurs de dissocier un jeu de données d'une collection. 

Quel est le cas d'utilisation ?

Auparavant, les utilisateurs n'étaient pas en mesure de délier les jeux de données des collections sans l'aide de l'équipe d'assistance de Borealis.

Comment accéder à ces fonctionnalités ?

Une fois qu'un jeu de données a été lié à une autre collection à l'aide de la fonction « Lier un jeu de données  », l'option de  « délier » le jeu de données apparaîtra dans le menu du group de données.

Note : En raison d'un problème d'autorisation du système, les utilisateurs peuvent voir un message d'erreur lorsqu'ils essaient de délier l'ensemble de données. Des améliorations de cette fonctionnalité sont prévues dans la prochaine version. Veuillez contacter l'équipe Borealis pour obtenir de l'aide. 

Capture d'écran du bouton « Délier l'ensemble de données »  en surbrillance dans le menu d’ensemble de données .