Odesi Blog

Last modified by Julia Gilmore on 2025-01-27, 13:13

Sep 16 2025

Data Explorer Updates: September 2025

Article de blogue en français.

An updated version of the Data Explorer for Odesi and Borealis is now available!

Following the release of the new and improved Data Explorer earlier this year, we have continued to make improvements to the tool’s features and interface over the past few months. This updated version of the Data Explorer includes bug fixes and improvements for variable selection and groups, cross tabulations, bulk editing, applying weights, importing DDI XML files for reuse, and generally increased speed and performance.

An overview of the updated features and fixes for the Data Explorer is provided below. For more resources on getting started with the Data Explorer, please refer to the Odesi User Guide

Variable selection & groups

Previously, some curators had issues creating and adding to variable groups, noting that once a variable group had been created and they attempted to assign a variable to that group through the ‘edit variable’ option, they would receive an error message and were unable to save their changes back to Dataverse. Some users also noted occasional duplication when selecting variables to add to groups, as well as lag times for variable selection in some browsers, specifically Chrome. These issues have now been addressed and users are able to add and remove variables from groups with no error message, with increased speed for selecting variables, and without duplication. 

Additional updates to variable features include automatic sorting of variables alphabetically, as well as a new option for users with admin permissions to remove weights from multiple variables at once using the “select” menu when curating datasets. 

Cross tabulations

Following reports from some users of issues with weight applications in the cross tabulation feature, cross tabulations and charts will now automatically update when weights are applied to the selected variables.

Please note that the team is currently fixing the "Show Value" options to display percentages in addition to counts in the table view.

Cross-Tabulation tab with arrows pointing at the weighing variable setup option and the automatically formatted cross-tabulation table.

Additionally, the “Categories (Filter)” option in the Cross Tabulation builder now shows all categories applicable to the selected variable(s) as automatically checked to be included in the table. Previously, the default was to include all applicable categories and users would need to select a given category from the drop-down list in order to exclude (show as a checked box). In order to make this feature more intuitive, the applicable categories will still be included by default, however this will be shown as all categories selected in the drop-down menu and users may deselect a category to exclude it from the table.

Cross Tabulation table showing all Categories selected in the “Categories (Filter)” drop-down menu.

By default, all categories are checked. When users deselect a category in the Filter drop-down, it is automatically removed from the cross tabulation table.

Cross Tabulation showing all but one of the categories selected in the “Categories (Filter)” drop-down menu. An arrow points to the updated table where the deselected category is removed from the table.

XML import and file uploads

The Data Explorer allows users with curator and admin permissions to reupload DDI XML for metadata reuse when curating datasets within a continuous series (for example, the monthly releases of the Labour Force Survey). Previously, the Data Explorer only allowed an XML file to be uploaded once for any given dataset. Some curators noted use cases where it would be helpful to be able to upload DDI XML metadata for reuse multiple times, and this option is now enabled in the Data Explorer.

Arrows pointing at the Import Metadata option at the bottom left of the main page. A close up of the import metadata menu is presented with an arrow pointing at the option to choose and select a file.

Bulk editing

Users previously reported errors with the bulk editing features for variables in the Data Explorer. The bulk editing feature has now been improved to allow for bulk weighting or removal of weights for variables, as well as bulk editing variable information once a weight has already been applied.

In previous versions of the Data Explorer, users making bulk edits to datasets would occasionally encounter issues when attempting to save edits back to Dataverse. When making bulk edits to a dataset, it takes time for the system to process these changes and apply them to the dataset. If a user attempted to save bulk updates to a dataset immediately after applying them - while these updates are still being processed - an error would occur resulting in a corrupted file being uploaded to Dataverse.

In order to make users aware of the processing time needed for bulk edits, the updated version of the Data Explorer now includes notifications to inform the user when the bulk edits to a dataset are being processed, and subsequently when these updates have been applied and can now be saved back to Dataverse. These notifications appear in the top right-hand corner of the screen as “Saving Variable Info” and then “Variable Saved” as confirmation that the user can now proceed. 

Arrow pointing at a notification informing users of the successful saving and uploading of the Data Explorer updated variables.

Speed, performance, and UI

This updated version of the Data Explorer provides generally enhanced performance and speed across all features. However, larger datasets (over 500 MB), such as census files, may take several minutes to load in the Data Explorer due to file size. We are working on adding a notice to the loading page in these cases to warn users of longer than usual loading times.

Recommended Browsers

We have also been made aware of dataset loading problems in chromium-based browsers, specifically Google Chrome and Microsoft Edge. While datasets under 500 MB will load in the Data Explorer using these browsers, datasets over 500 MB will not. This is unfortunately an issue with the browser and not with the Data Explorer itself or Dataverse. While we investigate possible solutions for this issue, we recommend using Firefox or Safari when using the Data Explorer for larger datasets. We have updated the Odesi User Guide and Borealis User Guide to reflect this browser issue and recommendation, and the message added to the “Loading dataset” page in the Data Explorer will include a note to users that Firefox and alternate browsers are recommended for datasets over 500 MB. 

Image of the dataset loading page with a notice about longer than usual wait times and Firefox as the recommended browser for large datasets.

Contact us

If you continue to experience issues with the Data Explorer, please contact odesi@scholarsportal.info with information about the dataset in question and specific features in need of troubleshooting, and a member of our team will be in touch as soon as possible.

About Data Explorer

Data Explorer is an open-source web application built and developed by Scholars Portal. The application is fully integrated with the open-source Dataverse repository project developed by IQSS, Harvard University, together with global collaborators. Data Explorer supports users in Odesi and Borealis with viewing and analyzing tabular data files and variables by groups or category, as well as variable metadata, summary frequencies and statistics, building cross-tabulations and charts, subsetting and downloading data. 

Sep 16 2025

Mise à jour de l’Explorateur de données: septembre 2025

Blog post in English. 

Une nouvelle mise à jour pour l’Explorateur de données est maintenant disponible pour Odesi et Borealis!

Après avoir déployé la nouvelle version de l’Explorateur de données plus tôt cette année, nous avons continué le processus de développement de l’outil afin de raffiner et optimiser certains de ses atouts, ainsi que l’interface utilisateur. Cette nouvelle version de l’Explorateur de données adresse aussi certains bugs informatiques reliés à sa performance lors de la sélection de groupes et variables, lors de la création de tableaux croisés et de la modification en masse, et lors de l’ajout de pondérations de variables et le téléversement de fichier XML conforme au standard DDI.

Un survol des mises à jour de l’Explorateur de données est disponible ci-dessous. Pour plus d’information par rapport à l'utilisation de l’Explorateur de données, veuillez consulter le guide utilisateur de Odesi

Sélection de variables et création de groupes

Auparavant, certains des conservatrices et conservateurs des ensembles de données avaient de la difficulté à ajouter des variables aux groupes qu’ils avaient créé dû à un bug où, lorsqu’ils essayaient d’assigner une variable à ces groupes à l'aide de l’option située sous “Modifier une variable”, ils recevaient un message d’erreur et n'étaient point capable de sauvegarder leurs modifications au Dataverse. Certains usagers ont aussi mentionné que certaines variables étaient occasionnellement dupliquées lorsqu’elles étaient ajoutées à un groupe, ainsi que des délais lors de la sélection de case à cocher de variable quand ils utilisaient certains navigateurs internet (tel que Google Chrome). Ces problèmes sont désormais résolus, les usagers de l’Explorateur de données pourront désormais ajouter et retirer des variables dans leurs groupes sans message d’erreur tout en bénéficiant d’une meilleure performance utilisateur lors de la sélection de variable, sans devoir se soucier de duplications de variables accidentelles.

Nous avons aussi fourni une mise à jour additionnelle dans laquelle nous avons inclus un tri alphabétique des variables, ainsi qu’une nouvelle option pour retirer plusieurs poids de variables d’un coup à l'aide du menu de sélection.

Tableaux croisés

Suites à certains rapports de nos usagers par rapport au fait que les poids attribués aux variables n'étaient pas automatiquement pris en considération lors de la création de tableaux croisés, les tableaux croisés et graphiques sommaires seront dorénavant automatiquement mis à jour quand un poids est attribué à une de ses variables.

Veuillez noter que l'équipe est actuellement en train de corriger les options d’afficher la valeur afin d'afficher les pourcentages en plus des comptes dans la vue tableau.

Onglet de tableau croisé avec des flèches pointant vers l'option de configuration de la variable de pondération et le tableau croisé formaté automatiquement.

En plus, nous avons mis à jour l’outil de sélection “Catégories (Filtrer)” des tableaux croisés. Auparavant, toutes variables étaient automatiquement incluse lors de la création du tableau croisé et leur boîtes à cocher devaient être sélectionnés (crochet bleu) pour les retirer du tableau croisé. Pour faciliter l’utilisation de l’outil, celui-ci coche désormais automatiquement toutes les boîtes à cocher des catégories de variables sélectionnées lors de la création de tableau croisé; elles doivent maintenant être décocher pour être retiré du tableau croisé.

Tableau croisé présentant toutes les catégories sélectionnées dans le menu déroulant « Catégories (filtre) ».

Par défaut, toutes les catégories sont cochées. Quand une catégorie est décochée, elle sera automatiquement retirée du tableau croisé. 

Tableau croisé présentant toutes les catégories sélectionnées dans le menu déroulant « Catégories (Filtre) », à l'exception d'une seule. Une flèche pointe vers le tableau mis à jour, dans lequel la catégorie désélectionnée a été supprimée.

Importation & téléversement de fichier XML

L’Explorateur de données permets à ses conservateurs et conservatrices, pourvu qu’ils aient l’autorisation requise, de réutiliser et téléverser les fichiers XML conforme au standard DDI lors du processus de conservation pour les ensembles de données d’une même séries (comme la publication mensuelle de l'enquête sur la population active). Auparavant, l’Explorateur de données permettait qu’un seul téléversement de fichier XML par ensemble de données. Certains usagers ont mentionné qu’il serait utile d'être capable de mettre à jour les métadonnées pour le même ensemble de données plusieurs fois au fil du temps. Cette option est dorénavant disponible dans l’Explorateur de données.

Flèches pointant vers l'option « Importer des métadonnées » en bas à gauche de la page principale. Un gros plan du menu d'importation des métadonnées est présenté avec une flèche pointant vers l'option permettant de choisir et de sélectionner un fichier.

Modification en masse

Certains usagers ont aussi rapporté l'occurrence d'erreurs lors de modification en masse dans l’Explorateur de données. Nous avons amélioré et mis à jour l’outil de modification en masse - celui-ci permet maintenant d'attribuer et de retirer le poids de variable, ainsi que de modifier en masse l’information des variables une fois qu’un poids est appliqué. Les modifications ont maintenant une notification de chargement.

Dans l'ancienne version de l’Explorateur de données, la modification en masse de variable pouvait occasionnellement mener à des problèmes de téléversement lors du processus de sauvegarde dans Dataverse. La modification en masse de variable peut prendre quelque instant puisque l'Explorateur de données doit appliquer ces changements aux variables sélectionnées. Si un utilisateur tante de téléverser l’emsemble de donnees immédiatement après avoir soumis leur modification en masse (et si les modifications sont encore en train d’être appliquées), le fichier devient corrompu et mène ultimement à une erreur.

Pour aider à éviter ce type d’erreur, nous avons intégré un système de notification qui contribue à informer les utilisateurs de l’Explorateur de données des temps de chargement des modifications en masses. L’Explorateur de données notifie désormais ses utilisateurs lorsque les modifications en masse ont été appliquées à l'ensemble de données. Ces notifications apparaissent dans le coin droit au haut de la page. 

Flèche pointant vers une notification informant les utilisateurs de la réussite de l'enregistrement et du téléchargement des variables mises à jour à l’aide de l’explorateur de données.

Vitesse, performance et interface utilisateur

La mise à jour de l’Explorateur de données offre aussi une meilleure performance d’utilisation pour plusieurs de ses outils. Il faut tout de même noter que les plus grands ensembles de données, comme les fichiers du recensement du Canada, peuvent prendre quelques minutes à charger dans l’Explorateur de données dû au volume du fichier. Nous sommes en train de développer un système d’avertissement pour aviser les usagers des plus longs temps de chargement pour ces fichiers-ci.

Navigateurs recommandés

Nous avons également été mis au courant de problèmes de chargement des ensembles de données dans les navigateurs basés sur Chromium, en particulier Google Chrome et Microsoft Edge. Alors que les ensembles de données inférieurs à 500 Mo se chargent dans l’Explorateur de données en utilisant ces navigateurs, les ensembles de données de plus de 500 Mo ne le font pas. C’est malheureusement un problème avec le navigateur et non pas avec l’Explorateur de données lui-même ou Dataverse. Bien que nous étudions des solutions possibles à ce problème, nous recommandons d’utiliser Firefox ou Safari lorsque vous utilisez l’Explorateur de données pour des ensembles de données plus grands. Nous avons mis à jour le Guide de l’utilisateur d’Odesi et le Guide de l’utilisateur de Borealis pour refléter ce problème de navigateur et cette recommandation, et le message ajouté à la page « Chargement du jeu de données » dans l’Explorateur de données inclura une note aux utilisateurs indiquant que Firefox est recommandés pour les ensembles de données de plus de 500 Mo.

Image de la page de chargement de l’ensemble de données avec une message indiquant des temps de chargement plus longs que d’habitude et que Firefox est le navigateur recommandé pour les grands ensembles de données.

Contactez-nous

Si vous continuez à faire face à des problèmes dans l’Explorateur de données, n'hésitez pas à nous contacter a odesi@scholarsportal.info pour nous en faire part - un membre de notre équipe vous répondra aussitôt que possible.

A propos de l’Explorateur de données

L’Explorateur de données est une application open source basée sur le web conçue et développée par Scholars Portal. L’application en soi est entièrement intégrée avec le Dataverse repository project développée par l’IQSS, située à l'université Harvard, a l’aide de collaborateurs internationaux. L’Explorateur de données permet aux utilisateurs et utilisatrices de Odesi et Borealis de visualiser et d’analyser des ensembles de données tabulaires par variables, groupes ou catégories. L’Explorateur de données permet aussi aux usagers de visualiser les métadonnées des variables et les statistiques sommaires, créer des tableaux croisés et de télécharger des sous-ensembles de données.

 

Jan 27 2025

Bienvenue au nouvel Explorateur de données !

Blog post in English here.

Nous sommes ravis d’annoncer aujourd'hui le nouvel Explorateur de données de Borealis. L’Explorateur de données est une application basée sur le web qui permet l’exploration, l’analyse et la conservation de variables dans des ensembles de données directement via Odesi et Borealis

Suivant la migration du répertoire de données Odesi de Nesstar à Borealis en automne 2023, les commentaires de la communauté nous ont informé que de nouveaux outils étaient nécessaire pour mieux supporter les conservateurs, les chercheurs, et les utilisateurs d’ensembles de données. Depuis, nous avons mis à jour et modernisé L’Explorateur de données original et l’outil de conservation de données (précédemment deux outils distincts) en les unissant sous une seule application connectée à Borealis et Odesi. 

L'Explorateur de données supporte désormais les utilisateurs et utilisatrices de Odesi et Borealis lors de la visualisation et l’exploration de fichier tabulaire, leurs variables associées, leurs métadonnées, leurs statistiques sommaires, leurs téléchargements et lors de la création de tableaux-croisés et graphiques récapitulatifs.

Le nouvel Explorateur de données permet à ses utilisateurs et utilisatrices qui possèdent les autorisations requises de voir et modifier les métadonnées de leurs ensembles de données en utilisant l’interface de programmation (API) de Dataverse et les métadonnées conformes au standard Data Documentation Initiative (DDI). Grâce à l’union des deux outils précédent, les nouvelles fonctions de l’Explorateur de données permettent aux administrateurs et conservateurs d’ensembles de données de facilement créer et modifier les métadonnées de variables pour tous fichiers tabulaires (tel que SPSS, R, Excel, CSV) directement au travers de Odesi et Borealis.

L’Explorateur de données est un logiciel open source basé sur le web conçu et développé par Scholars Portal (OCUL). Notre logiciel est entièrement intégré avec le logiciel open source “Dataverse repository project” (dataverse.org) développé par l’IQSS de l’université Harvard à l’aide de collaborateurs de la communauté internationale.

Pour en savoir plus sur l'utilisation du nouvel Explorateur de données, consultez la section L’Explorateur de données du guide pour utilisateur de Odesi, ainsi que deux nouveaux tutoriels vidéos.

Mis à jour de l’interface utilisateur

Le nouvel Explorateur de données offre une interface utilisateur modernisée, dorénavant plus accessible et facile à utiliser grâce aux nouvelles icônes de navigations.

Nous avons ajouté de nouveaux boutons pour les groupes de variables et une nouvelle option pour voir toutes les variables de l’ensemble de données dans un seul groupe. L’interface utilisateur comporte désormais les nouveaux onglets “Variables” et “Tableaux croisés” pour simplifier le processus d’ajout de variables et de catégories lors de la création de tableaux croisés et de graphiques récapitulatifs. 

L’interface utilisateur est disponible an Français et en Anglais et peut aussi être passé au mode sombre si désiré. L’interface utilisateur améliore aussi l’utilisation de l’Explorateur de données sur les appareils mobiles. 

Capture d’écran qui met l’emphase sur les outils de navigation de l’interface utilisateur principal de l’Explorateur de données ainsi que le mode sombre et le menu déroulant pour changer le langage. 

Exploration des variables améliorée

Le nouvel explorateur de données facilite désormais la recherche, la filtration et la visualisation des variables.

Les utilisateurs de l’Explorateur de données peuvent chercher les noms de variables, leurs étiquettes et leur code d’identification à l’aide de la barre de recherche située au haut du tableau des variables. Les variables peuvent aussi être accédées par groupes, catégories, et étiquettes pour plus facilement créer des tableaux croisés et des graphiques récapitulatifs. 

Les utilisateurs de l’Explorateur de données peuvent aussi sélectionner l’option “Visualiser une variable” pour accéder à son graphique récapitulatif et ses données, aux statistiques sommaires et aux informations de la variable telles que la question littérale, l’univers, les remarques et plus encore. Les données du graphique incluent les fréquences, le pourcentage de chaque fréquence, la fréquence pondérée, et le pourcentage de chaque fréquence pondérée. Chaque valeur présentée dans le graphique récapitulatif peut être ajoutée ou retirée à l'aide de leur case à cocher. Les utilisateurs peuvent passer de variable en variable sans fermer la fenêtre “Visualiser une variable” à l’aide des flèches de navigation situées au haut la fenêtre. 

Capture d’écran de l’interface utilisateur de l’Explorateur de données mettant l’emphase sur le bouton “Visualiser une variable”.

Capture d’écran illustrant les flèches de navigation de la fenêtre “Visualiser une variable”.

Capture d’écran de la fenêtre “Visualiser une variable”. Celle-ci met l’emphase sur le titre des colonnes du tableau des données du graphique et le rôle que joue les cases à cocher lors de la personnalisation du graphique récapitulatif.

Capture d’écran de la section des statistiques sommaires sur la fenêtre “Visualiser une variable”.

Capture d’écran de la section des information sur la variable sur la fenêtre “Visualiser une variable”.

Création des tableaux croisés

Le nouvel Explorateur de données permet de plus facilement créer des tableaux croisés. 

Pour créer des tableaux croisés, il faut d’abord sélectionner l’icône “Ajouter au tableau croisé” pour chaque variable désirée. Une fois qu’elles sont sélectionnées, vous pouvez ouvrir l’onglet “Tableaux croisés” situé au-dessus de la colonne des groupes. 

Capture d’écran de l’interface utilisateur principale de l’Explorateur de données mettant l’emphase sur le bouton “Ajouter au tableau croisé”.

À partir de l’onglet des tableaux croisés, vous pouvez assigner à le rôle de ligne ou de colonne à chaque variable à l’aide du menu déroulant “Ligne ou colonne?”. Le tableau est automatiquement créé pour refléter vos décisions. 

Capture d’écran de la page des tableaux croisés mettant l’emphase sur comment le rôle de ligne et de colonne affectent la création du tableau croisé.

Vous avez l’option de télécharger votre tableau croisé à l’aide du bouton rose “Exporter le tableau au format CSV” situé au-dessus du tableau croisé nouvellement créé. 

Téléchargement de variable 

Les utilisateurs de l’Explorateur de données ont aussi l’option télécharger les variables de leur choix. À partir de l’onglet des variables, les utilisateurs peuvent sélectionner les cases à cocher de chaque variable désirée. En sélectionnant ensuite le menu déroulant “Télécharger”, l’option “Télécharger le sous-ensemble” sera disponible. Le nombre de variables sélectionnées peut être trouvé sur le bouton “Télécharger”. 

Capture d’écran de l’interface utilisateur principale de l’Explorateur de données avec le menu déroulant “Télécharger” ouvert.

Bien que l’Explorateur de données soit robuste pour les analyses de données préliminaires, les utilisateurs sont fortement encouragés à consulter les fichiers de données originales et, si applicable, les documents d’informations additionnels associés à l’ensemble de données en question. 

Téléversement des Métadonnées conformes au standard DDI

Le nouvel Explorateur de données permet aussi aux administrateurs et aux conservateurs de données de téléverser et réutiliser leur métadonnées conformes au standard DDI sous format XML. Ceci peut être accomplie en sélectionnant l’option “Importer les métadonnées” situé au-dessous de la fenêtre sous la colonne des groupes. Une fois sélectionné, le fenêtre “Importer XML” s’ouvrira et permettra aux utilisateurs de sélectionner quelles sections du fichier des métadonnées conformes au standard DDI à importer lors du téléversement.

Notez que seuls les fichiers XML générés par l’Explorateur de données peuvent être téléversé à ce moment. 

Capture d’écran dans laquelle une flèche pointe le bouton “Importer les métadonnées”. Cette capture d’écran montre aussi le fenêtre “Importer XML” dans laquelle une flèche pointe le bouton de sélection du fichier à téléverser.

Téléchargement des livres de codes des métadonnées conformes au standard DDI sous format PDF et HTML

Une fois qu’un ensemble de données est publié, un livre de codes des métadonnées conformes au standard DDI sera automatiquement créé. Ce livre de code peut être téléchargé à l’aide du menu déroulant “Conditions d’accès au fichier”, dans lequel se trouve l’option “Métadonnées des variables”. Les métadonnées de l’ensemble de données peuvent aussi être téléchargées sous format PDF ou HTML à partir du menu déroulant “Télécharger” situé sur la l'interface utilisateur principale de l’Explorateur de données. 

Capture d’écran de la page principale de l’ensemble de données avec le menu déroulant “Conditions d’accès au fichier” ouvert. Une flèche rouge pointe l’option de téléchargement “Métadonnées des variables”.

Capture d’écran de l’interface utilisateur principale de l’Explorateur de données. Le menu déroulant “Télécharger” est ouvert. Une flèche verte pointe l’option de téléchargement “Télécharger le fichier en format PDF” et une autre pointe l’option “Télécharger le fichier en format HTML”.

Nouveaux guides et tutoriels vidéos

Pour accompagner le nouvel Explorateur de données, nous avons préparé de nouveaux guides et tutoriels vidéos pour supporter les chercheurs et les conservateurs d’ensemble de données. 

Nous avons révisé le guide pour utilisateur de Odesi et le guide pour utilisateur de Borealis pour inclure les nouvelles fonctions de l’Explorateur de données. Le guide d’administration Borealis fut aussi mis à jour.  

Deux nouveaux tutoriels vidéos sont maintenant disponibles sur la page des vidéos de formation de Odesi ainsi que sur la chaîne YouTube de Borealis. La première vidéo offre un aperçu du nouvel Explorateur de données. La deuxième offre plus d’information pour la conservation d’ensemble de données et s'adresse donc principalement aux administrateurs et conservateurs d’ensemble de données. 

Le dépôt GitHub de l’Explorateur de données est également accessible au public.

Contactez-nous 

Si vous avez des questions par rapport au nouvel Explorateur de données, n’hésitez pas à nous contacter à odesi@scholarsportal.info. Un membre de notre équipe sera en contact avec vous aussi tôt que possible. 

Jan 27 2025

Introducing the new Data Explorer!

Article de blogue en français ici.

We are excited to announce the official release of the new and improved Data Explorer in Borealis. Data Explorer is a comprehensive web application designed to support data exploration, analysis, and curation at the variable-level in Odesi and Borealis

Following the Odesi data repository migration from Nesstar to Borealis in fall 2023, feedback from the community indicated a need for additional functionality in connected tools to better support data depositors, curators, researchers and users. Over the past year, we re-developed the Data Explorer and Data Curation Tool (previously two separate tools) and combined them into a single, enhanced application connected to Borealis and Odesi.

Data Explorer supports users in Odesi and Borealis with viewing and exploring tabular data files and variables by groups or category/subject, variable metadata, summary frequencies and statistics, building cross-tabulations, charts, subsetting, and downloading data. 

The new Data Explorer allows authorized users to view and edit variable metadata using the Dataverse APIs and Data Documentation Initiative (DDI) metadata. New features enable data administrators and curators to create and edit variable-level metadata for tabular files (e.g., SPSS, R, Excel, CSV) in Odesi and Borealis for enhanced curation workflows, combining the full functionalities of the previous Data Curation Tool.

Data Explorer is an open-source web application built and developed by Scholars Portal (OCUL). The application is fully integrated with the open-source Dataverse repository project (dataverse.org) developed by IQSS, Harvard University together with global collaborators. 

An overview of the new features and functionalities in Data Explorer is provided below. To learn more about getting started with the new Data Explorer, refer to the Using the Data Explorer section of the Odesi User Guide, as well as two new video tutorials

Updated Web Interface

The new Data Explorer offers a refreshed, accessible web interface with updated navigation and icons. 

New navigational buttons for variable “Groups” and option to show “All Variables” are added, along with new “Cross Tabulation” and “Variables” tabs in order to view selected variables and categories to create tables and charts. 

The new user interface can be viewed in English or French, and users can view the application in dark mode, if desired. The updated interface also provides an improved experience for mobile-device users.

Screenshot indicates key variable navigation features (including the search bar and the items per page options) as well as language and dark mode settings 

Enhanced Variable Exploration

The new Data Explorer provides enhanced variable searching, filtering, viewing, and exploration capabilities. 

Users can search by variable names, labels, and IDs using the “Search table” bar at the top of the center panel. Users can also view and filter variables by groups, categories, and labels to view frequencies and build cross-tabulations and charts. 

Users can select the “View Variable” graph icon to view variable frequencies and chart data, summary statistics, and additional variable information such as questions, interview instructions, weights, universes, and more. Charted data shows values, categories, counts, count percentages, weighted counts, and weighted percentages. Users can select or deselect checkboxes for each variable to include or remove selected categories and values from the summary graphs provided.

In the “View Variable” window, users can navigate between adjacent variables using the navigation arrows to view more variables.

Screenshot of the Data Explorer user interface with emphasis placed on the “View Variable” button

Screenshot of the “View Variable” window denoting the window’s navigation arrows.

Screenshot of the View Variable window depicting the Chart data

Screenshot of the Summary statistics and variable information sections of the View Variable window.

Cross-Tabulations & Chart Builder

The new Data Explorer also provides improved functionality for creating cross tabulations and charts.

To build a cross tabulation, select the “Add to cross tabulation” icon for each desired variable. Once all variables have been selected, navigate to the “Cross Tabulation” window using the tab in the top left. 

Screenshot of the main Data Explorer user interface placing emphasis on the “Add to cross-tabulation” button.

From here, assign the variables as a row or column using the drop down menus, and apply any desired “Group” or “Category” filters. The table will automatically generate based on these inputs.

Screenshot of the cross-tabulations tab demonstrating how assigning variables as rows or columns affects the cross tabulation table construction.

Users now have the option to export cross tabulation tables and charts from Data Explorer in CSV format for further analysis. Toggling between Chart and Table to choose the desired export format, click the “Export chart/table as CSV” button.

Variable Subsetting & Download 

Users can also download select variables as a subset. From the variables tab, users can select the check boxes next to the desired variables in order and then click the “Download” drop-down button in the top right corner. The number of selected variables will appear next to the “Download” button. Select “Download selected variables as a subset”. 

Screenshot of the main Data Explorer user interface with the “Download” scroll down menu open.

Note that we strongly recommend downloading the original data file in addition to any subsets, and users are strongly encouraged to consult original data files and accompanying documentation when conducting data analysis for their research. 

Import DDI XML 

With newly combined functionality for both exploration and curation, the new Data Explorer allows depositors and curators to import and reuse DDI XML metadata. 

Alt-text: Screenshot of the main Data Explorer page with an emphasis placed on the “Import Metadata” button.

In the bottom left corner of the “Groups” panel in Data Explorer, select “Import Metadata”. From the “Import XML” page, depositors and curators can select or deselect DDI sections and texts to include in the import. 

Screenshot of the “Import XML” page, which includes the File Select option, as well as the “Select DDI sections and texts to include” check-box options.

Please note that the “Import XML” feature only allows for import and re-use of Dataverse-generated DDI metadata at this time. 

DDI Codebook HTML & PDF Download

Upon publishing a dataset, a DDI standard metadata ‘DDI Codebook’ will be automatically created for that dataset. This Codebook can be downloaded through the “Access File” drop-down option in Borealis. Under “Metadata Download” select “Variable Metadata” to download the DDI Codebook.Users can also access a DDI Codebook as an HTML or PDF file through the Data Explorer’s “Download” tab.

Screenshot of the Dataset main page with the “Access File” drop down menu with an emphasis placed on the “Variable metadata” download option.

Screenshot of the Data Explorer main user interface with the Download drop down menu open. Green arrows point towards the “Download PDF format file” and “Download HTML format file” options.

New Documentation & How-to Videos

With the release of the new Data Explorer, we have prepared updated documentation to support researchers, depositories, and curators with the new interface and functionalities. 

The existing Odesi User Guide and Borealis User Guide have been revised to reflect the new Data Explorer, including updated screenshots. The Borealis Admin Guide has also been updated to reflect changes to curation workflows using the new Data Explorer. 

Two new video tutorials are also now available on the Video Tutorials tab of the Odesi User Guide and on the Borealis YouTube channel. The first video provides an overview of the new Data Explorer. The second video provides more information about using Data Explorer for data curation. 

The GitHub Repository for Data Explorer is also publicly available. 

Contact Us

If you have any questions or concerns about the new Data Explorer, please reach out to odesi@scholarsportal.info and a member of our team will be in touch as soon as possible.