120, rue Beacon, Somerville, MA 02143
Introduction aux fichiers de données NeuroMaker BCI Connect

Introduction à nos données

Vous voulez donc en savoir plus sur Comme nous l'avons appris dans nos autres publications sur NeuroMaker BCI, il existe une quantité incroyable de données intéressantes que nous pouvons recueillir à partir de nos casques Focus 1. Nous pouvons observer notre état attentif, notre état méditatif et nos ondes cérébrales allant de l'alpha au gamma en temps réel. Afin de collecter des données pour les très nombreuses expériences que nous souhaitons mener, nous devons stocker ces informations dans un endroit où nous pouvons analyser et interpréter les résultats.

En bas à droite de votre application NeuroMaker BCI Connect, vous remarquerez des boutons « démarrer la collecte » et « arrêter la collecte ». C'est ainsi que nous pouvons collecter des données pour nos expériences ! Dès que vous appuyez sur "Démarrer la collecte", une minuterie commencera à compter le nombre de secondes de données collectées. Une fois que vous avez terminé d'enregistrer les éléments de données dont vous avez besoin, appuyez sur "arrêter la collecte". Une fois que vous aurez appuyé sur ce bouton, votre compteur disparaîtra et un fichier .csv apparaîtra dans le dossier racine de votre dossier programme qui affichera les données que vous avez enregistrées !

Nous utiliserons souvent ces fichiers de données dans notre programme NeuroMaker BCI. Parfois, ceux-ci seront utilisés pour collecter des données sur la façon dont nous réagissons aux différents états mentaux que nous souhaitons mesurer. D'autres fois, cela sera utilisé pour créer des données que nous pouvons utiliser pour programmer différentes applications python. Dans tous les cas, la compréhension et l'utilisation de ces données seront cruciales dans notre parcours pour devenir des praticiens BCI.

Que contient nos fichiers

Une fois que vous avez trouvé le fichier de données dans votre dossier racine, vous remarquerez de nombreuses colonnes de données contenant les informations que vous avez enregistrées. De gauche à droite, chaque colonne répertorie chacune des différentes lectures du tableau de bord NeuroMaker BCI Connect. La première chose que vous remarquerez est que chaque colonne de données a une quantité différente de points de données. Par exemple, au cours de 60 secondes d'enregistrement, nous devrions trouver environ 60 cellules avec des données de méditation, 60 cellules avec des données d'attention et des centaines de valeurs pour l'EEG brut.

C'est parce que le taux d'échantillonnage est différent pour chaque valeur différente de nos lectures. Ceci est généralement mesuré en échantillons par seconde appelés Hertz. Nos algorithmes d'attention et de méditation mesurent les données en 1 Hertz, ce qui signifie que nous aurons un nombre dans une cellule pour chaque seconde où nous enregistrons des données. Notre taux d'échantillonnage EEG brut, quant à lui, mesure les données à 160 Hertz, ce qui signifie que nous aurons cent soixante numéros dans les cellules pour chaque seconde d'enregistrement effectuée. Enfin, les lectures pour différentes ondes cérébrales, comme les ondes Alpha ou Gamma, sont collectées à environ 2 Hertz, ce qui signifie que nous aurons deux nombres dans les cellules pour chaque seconde de données enregistrées.

Toutes ces informations seront enregistrées dans un fichier par enregistrement. C'est pourquoi certaines colonnes sont plus longues et les autres plus courtes !

Considérations relatives aux fichiers de données

La programmation de nos bandeaux Focus 1 est codée pour fournir ces données aux taux d'échantillonnage dont nous avons discuté ci-dessus. Cependant, lors de l'un de ces enregistrements, vous ne verrez probablement pas la même quantité de données enregistrées. Par exemple, bien que notre EEG brut doive collecter environ 160 échantillons par seconde, nous ne verrons peut-être que 100 échantillons en une seconde de vos données enregistrées. Ceci est tout à fait normal pour un appareil comme celui-ci et peut être dû aux raisons suivantes :

  • L'électrode de votre bandeau a légèrement glissé pendant votre session d'enregistrement et n'a pas pu détecter de signal
  • La qualité de votre signal Wifi entre le bandeau et l'ordinateur a été légèrement interrompue
  • Votre appareil a été couplé plusieurs fois entre plusieurs ordinateurs différents et doit être calibré
  • La batterie de votre casque Focus 1 est faible

Cette situation est appelée perte de paquets et est tout à fait normale. En tant que scientifique BCI en herbe utilisant ce type de technologie, nous devons être conscients de ces légers changements.

Exemple d'un bon fichier de données

Les images ci-dessous montrent des segments d'un "bon" fichier de données. Dans ce cas, nous définirons «bon» comme ayant une perte de paquet minimale possible pour montrer des résultats significatifs de nos expériences. Jetons un coup d'œil complet au fichier lié ici, puis nous détaillerons quelques points importants à garder à l'esprit.

Cliquez ICI pour voir la feuille de calcul DataFile.  

Ce fichier a été collecté pour fournir des données expérimentales permettant de détecter l'état mental d'un élève lors de l'exécution de différentes tâches.

Dans le cadre du programme NeuroMaker BCI, nous pouvons utiliser des modèles pour détecter dans quelle mesure vous pouvez vous concentrer sur vos devoirs ou d'autres activités en utilisant vos casques EEG ! Mais nous devrons d'abord déterminer si l'ensemble de données que nous avons reçu est suffisamment précis pour nos besoins.

Dans ce fichier, nous avons enregistré un peu plus de 2 minutes de données, qui ont finalement duré 132 secondes. Décomposons les différents éléments que nous pouvons examiner dans un fichier comme celui-ci pour déterminer si ces données sont utilisables ou non.

Explorons le fichier de données !

Image 1 : Le fichier de données d'origine enregistré

Le fichier .xlsx initial enregistré après avoir cliqué sur "Arrêtez la collecte ».   

Cliquez ICI pour voir la feuille de calcul DataFile. 

Illustration 2 :  Le nombre de Les points de données d'attention et de méditation sont égaux à la durée de l'enregistrement.

Les données d'attention et de méditation sont échantillonnées à un taux d'échantillonnage de données de 1 hertz. 

Ce fichier de données provient d'un enregistrement d'un peu plus de 2 minutes.

Les colonnes de données Attention & Méditation ont chacune 132 points de données collectés, ou 132 secondes enregistrées.

Ce fichier montre que le "Arrêter la collecte" le bouton a été cliqué un peu après le point de temps de 2 minutes.

Cliquez ICI pour voir la feuille de calcul DataFile. 

Les images 2 à 4 correspondent à la deuxième page de la feuille de calcul.

Image 3 : Les données Brainwave sont collectées à un taux d'échantillonnage de données de 2 Hertz.

Les colonnes de données Brainwave ont 261 points de données. C'est logique.

Le taux d'échantillonnage des ondes cérébrales est d'environ 2 x le taux d'échantillonnage des données d'attention et de méditation, soit 2 hertz.

Idéalement, nous nous attendrions à 262 points de données. (132 * 2 ≈ 262).

Aucune perte de paquet de données signifierait que la comparaison de la longueur des données Attention : Brainwave serait exactement de 1:2. La valeur de cet enregistrement, cependant, est essentiellement de 2:1. L'imprécision est d'environ 0,761 TP2T, ce qui est négligeable.

Cliquez ICI pour voir la feuille de calcul DataFile. 

Les images 2 à 4 correspondent à la deuxième page de la feuille de calcul.

Image 4 : Les données EEG brutes ont un taux d'échantillonnage de données de 160 Hertz.

La colonne de données EEG brutes contient 20722 points de données.

Le taux d'échantillonnage des données pour les données EEG est de 160 Hertz ou 160 échantillons par seconde.

Si nous comparons à la situation idéale, 132 secondes et 160 échantillons collectés par seconde, nous nous attendrions à 21120 points de données. L'imprécision est d'environ 1,881 TP2T, ce qui est négligeable.

Cliquez ICI pour voir la feuille de calcul DataFile. 

Les images 2 à 4 correspondent à la deuxième page de la feuille de calcul.

Vous ne verrez peut-être jamais un fichier qui remplit complètement 100% des données que nous attendons, mais s'assurer que la perte de paquets reste à 5% ou moins est une bonne règle empirique pour les expériences que nous allons mener avec NeuroMaker BCI.

Exemple de fichier de données incorrect

Ci-dessous, nous avons une image d'un ensemble de données différent qui a enregistré 60 secondes de données EEG. Bien que nous ne puissions pas voir chaque cellule de la colonne Raw EEG, nous pouvons voir toute la longueur des données d'attention et de méditation. Nous savons que notre taux d'échantillonnage de l'attention et de la méditation est de 1 hertz et doit donc s'attendre à 60 points de données.

Malheureusement, nous ne voyons que 7 points de données sur les 60 attendus. Cela montre une perte de paquets importante et signifie que dans ce cas, 86.67% des données ont été perdues.

Les étudiants subissant cette expérience peuvent avoir retiré leurs bandeaux EEG, épuisé toute la batterie de leur appareil ou rencontré d'autres problèmes techniques. Quelle que soit la raison, la perte de paquets 86.67% est beaucoup, beaucoup plus élevée que le 5% que nous pouvons tolérer, donc cette expérience doit être menée à nouveau afin d'obtenir les résultats dont nous avons besoin.

Dernières pensées

En tant que futurs scientifiques et ingénieurs, nous devons toujours nous demander : « Ces données ont-elles un sens ? Bien que vous ayez accès à la technologie EEG capable de collecter et de traiter les signaux cérébraux des complications, le meilleur outil dont nous disposons pour utiliser nos données est notre propre bon sens. Veuillez utiliser les lignes directrices et les images ci-dessus pour vous aider à déterminer si les données que vous collectez au cours de vos expériences peuvent vous être utiles !

fr_FRFrench