Sigkdd2021 | l'Université des sciences et de la technologie de Chine utilise le réseau neuronal et le cadre de formation de bout en bout pour explorer l'influence de la situation éducative sur les capacités des étudiants

Le cœur de la machine 2021-09-15 03:33:59

Le niveau d'éducation des parents est - il lié au rendement scolaire des élèves??Conditions familiales、L'influence des ressources scolaires sur les capacités des élèves?Atmosphère de classe、Quelle est la relation entre l'attitude de l'enseignant et l'effet d'apprentissage des élèves??Comment une information similaire sur la situation de l'éducation influe - t - elle sur les capacités des élèves?,Suivez l'équipe de recherche sur l'éducation intelligente du professeur Liu Qi de l'Université chinoise des sciences et de la technologie.!

  • Adresse de la thèse:https://doi.org/10.1145/3447548.3467264
  • Adresse du projet:github.com/bigdata-ustc/ECD
  • Page d'accueil du Groupe d'étude:base.ustc.edu.cn/

Contexte éducatif et diagnostic cognitif

Information contextuelle sur le processus d'apprentissage des élèves(Comme les habitudes d'étude,Niveau d'instruction des parents,Conditions familiales, etc),Appelé information contextuelle éducative;Dans le domaine de l'éducation,Ces informations contextuelles sont utiles pour comprendre le processus éducatif et résoudre les problèmes éducatifs(Comme l'Organisation de l'enseignement,Équité en matière d'éducation, etc)Tout a une grande importance.
Graphique 1:Situation éducative、Capacité des élèves et rendement des élèves

Dans l'éducation intelligente , Le diagnostic cognitif est une tâche fondamentale et nécessaire ; Il recueille des informations sur les étudiants ( C'est généralement un dossier de comportement, comme une réponse à une question. ) Informations sur les questions d'examen ( Comme le texte de la question d'examen ), Pour déduire l'état actuel des connaissances de l'étudiant .Comme le montre la figure, Les élèves ont choisi des sujets pour la pratique , J'ai le dossier de réponse correspondant. , Chaque question contient des points de connaissance spécifiques ; Le diagnostic cognitif permet d'obtenir le degré de maîtrise de l'étudiant à différents points de connaissance. . Par exemple, les élèves répondent correctement aux questions d'examen e_1,Ete_1Contient「Bacteria」Ce point de connaissance, Il a donc été diagnostiqué que l'étudiant 「Bacteria」 Niveau élevé de maîtrise des points de connaissance (Par exemple 0.8 Attendez.), Près de l'extérieur de la Ligne bleue sur la carte Radar reflétée dans le rapport de diagnostic . Les résultats du diagnostic cognitif peuvent être utilisés pour recommander des ressources éducatives. 、 Prévision du rendement des étudiants 、 Soutien à l'application ultérieure de l'éducation intelligente, comme le regroupement des groupes d'étude .

Contexte

L'information contextuelle ou contextuelle est actuellement disponible Recherche d'informationDomaines connexes(Par exemple: Système recommandé,web Recherche,Publicité, etc) A une large gamme d'applications , Ils reflètent une connaissance générale de la psychologie : L'information contextuelle influence souvent la performance externe en influençant les caractéristiques intrinsèques des gens. .Par exemple: Système recommandéMoyenne, L'information contextuelle influence les préférences intrinsèques des utilisateurs , Pour guider le comportement de consommation de l'utilisateur . Et dans le domaine de l'éducation, , L'information sur la situation de l'éducation influe sur l'état des connaissances des élèves. , Et cela se reflète dans les résultats de la pratique des élèves. .

L'information sur la situation de l'éducation est discutée depuis longtemps dans la pédagogie traditionnelle. , Ils poursuivent principalement l'idée de la recherche empirique (Faire des hypothèses - Collecte de données - Analyse expérimentale - Tirer des conclusions), Obtenez d'abord la note ou la capacité de l'étudiant comme mesure ,Réutiliser Analyse des composantes principalesRégression linéaire Analyse de l'effet de l'information contextuelle sur l'éducation . Où les élèves obtiennent des notes comparables et doivent faire les mêmes exercices , Donc, dans l'analyse à grande échelle de l'information contextuelle, , Les capacités des élèves sont souvent mesurées à l'aide de la théorie traditionnelle du diagnostic cognitif. .

La recherche sur le diagnostic cognitif remonte au domaine de la psychologie de l'éducation. , Théorie représentative de la réflexion sur les projets (Item Response Theory,IRT).Ces dernières années,Avec Intelligence artificielle Et la montée de l'éducation intelligente , L'une des tâches fondamentales de l'application de l'éducation intelligente ,Basé sur Apprentissage automatiqueApprentissage profond Les méthodes de diagnostic cognitif ont été largement étudiées , Parmi eux, les travaux classiques comprennent la théorie multidimensionnelle de la réflexion sur les projets qui élargit la théorie de la réflexion sur les projets. (Multidimensional Item Response Theory,MIRT),Utiliser Réseau neuronal Cadre de diagnostic neurocognitif pour l'apprentissage de la fonction cognitive (Neural Cognitive Diagnosis,NeuralCD).Et pourtant, À l'heure actuelle, le diagnostic cognitif se concentre principalement sur l'information liée aux questions d'examen. ( Comme la matrice des points de connaissance des questions d'examen 、 Relation entre les points de connaissance 、 Texte des questions d'examen, etc. ) Excavation , Peu d'attention a été accordée à l'information sur la situation éducative liée au processus d'apprentissage des élèves. .

En outre, Bien que l'utilisation des résultats du diagnostic cognitif puisse résoudre dans une certaine mesure le problème de la comparabilité dans l'analyse de l'information contextuelle éducative , Mais les méthodes traditionnelles de recherche dans le domaine de l'éducation comportent encore des erreurs de transmission. 、 Impact difficile QuantificationAttendez..Dans ce contexte, L'étude propose un contexte éducatif Perception Cadre de diagnostic cognitif , Utilisation prévue Réseau neuronal Et le cadre de formation de bout en bout , Apprentissage adaptatif Information sur les différents contextes éducatifs QuantificationImpact,Et combiner les méthodes existantes de diagnostic cognitif, Résultats du diagnostic amélioré .

Situation éducativePerception Diagnostic cognitif

1、Définition du problème

Dans le système d'apprentissage N Les étudiants,T Questions d'information contextuelle et M Exercices .Rassemblement des étudiants , Ensemble de problèmes situationnels , Ensemble de questions pratiques . Les dossiers d'information situationnelle des élèves sont représentés par des triples EnsembleR_q; Le dossier de réponse est indiqué comme suit: Collection deR_e,Parmi eux r_qAvecr_e Étudiants, respectivement. s Questions situationnelles q Réponse et pratique e Score sur .

Un étudiant donné sLes dossiers de , L'objectif de l'étude était de prévoir le rendement des élèves au moyen d'un processus , Accès aux étudiants s Niveau de maîtrise des connaissances .

2、SituationPerception Cadre de diagnostic cognitif

Presque toutes les méthodes traditionnelles de diagnostic cognitif incluent les étudiants Paramètres、Questions d'examen Paramètres、 Les trois parties de la fonction d'interaction entre les élèves et les questions d'examen , Sa rationalité a été vérifiée par un grand nombre de travaux .En général, Le processus de réponse des élèves peut être formalisé comme suit: ,Parmi eux , Représente l'état des connaissances des étudiants 、Pratique pertinente Paramètres( Comme la difficulté ,Point de connaissance),F Est une fonction cognitive ,r Performance pour les étudiants . L'état des connaissances de l'étudiant peut être exprimé comme suit: :
Parmi euxC Saisie d'informations contextuelles ,H Fonction d'impact situationnel , , Les caractéristiques explicites qui représentent l'influence de la situation et les caractéristiques intrinsèques des élèves qui influencent l'apprentissage de l'histoire ,G Représentant les caractéristiques des élèves par rapport à l'état des connaissances CartographieFonctions.
L'étude propose un cadre en deux étapes : Modélisation de la situation éducative et renforcement du diagnostic .

  • Tout d'abord,, Dans la phase de modélisation de la situation éducative , L'étude propose un réseau d'attention hiérarchique pour modéliser l'effet externe de l'entrée situationnelle sur l'état des connaissances des élèves. , C'est - à - dire la fonction d'impact du scénario de modélisation H. La structure spécifique du réseau est décrite dans la section suivante. .
  • Deuxièmement,, Au stade de l'amélioration diagnostique , L'étude a permis aux étudiants Paramètres( État des connaissances des élèves ) L'harmonie entre les caractéristiques explicites formalisées de l'influence de l'information situationnelle et les caractéristiques intrinsèques de l'influence de l'apprentissage de l'histoire ( CartographieFonctionsG).
Parmi eux,d_t Pour les étudiants id CartographieDe Poids Paramètres, Apprendre par Internet .Voilà., L'information contextuelle représente la capacité de diagnostiquer les méthodes cognitives existantes ( Fonction cognitive F)Développer. L'étude a permis d'établir un lien entre IRT、MIRT Et NeuralCD La méthode a été étendue et mise en œuvre .
Graphique 3:ECD Cadre du modèle

3、 Modélisation de l'information contextuelle

L'information sur le contexte éducatif comprend principalement les caractéristiques suivantes: : Complexité du contenu , Différences individuelles , Pertinence intrinsèque . La complexité du contenu signifie que l'information contextuelle sur l'éducation contient du contenu provenant de sources riches. . Les différences individuelles signifient que l'impact de l'information contextuelle sur les élèves varie d'une personne à l'autre. . Par exemple, information contextuelle 「 Orientation 」 L'impact sur les étudiants est généralement positif , Mais l'impact sur les étudiants diligents est souvent plus évident que sur les étudiants ludiques ( Parce que les étudiants ludiques sont susceptibles de ne pas étudier sérieusement , Pour ne pas tirer pleinement parti de cette situation positive ). La corrélation intrinsèque signifie qu'il peut y avoir une interaction entre différentes informations contextuelles. .Par exemple,「Conditions familiales」 Peut également affecter 「 Orientation 」Effets de.

Pour les caractéristiques ci - dessus , L'étude a d'abord divisé l'information contextuelle en différents groupes en fonction du contenu. , Modéliser son impact séparément .Deuxièmement,,L'étude utilise Mécanisme d'attention Calculer la corrélation entre les caractéristiques des élèves et l'information contextuelle ,Et donc Apprentissage adaptatif L'influence de l'information contextuelle sur les élèves Poids.Et voilà., L'étude a été réalisée à partir de Mécanisme d'attention Module pour simuler l'interaction entre différentes entrées .
Graphique 4:Embedding Couche et Context filtering Couche

Plus précisément,, Le réseau de modélisation situationnelle comprend une structure de réseau à quatre niveaux :Intégration(embedding)Couche、Filtration(context filtering)Couche、Interaction(context interaction)Couche、Agrégation(context aggregation)Couche. L'étude a introduit des informations sur chaque situation au niveau de l'intégration. r_q Cartographie Est un vecteur d'impact situationnel c^v Et les vecteurs de caractéristiques situationnelles c^k, Étudiants id Entréet Cartographie Est un vecteur de personnalité x_t. Dans la couche filtrante , Différentes entrées pour un ensemble d'informations contextuelles , L'étude a montré que les étudiants x_tEn tant que Mécanisme d'attentionDans Requête query, Représentation des caractéristiques du contexte c^k Et représentation de l'impact situationnel c^vComme suit: Mécanisme d'attentionClé dans key Et valeurs value. En calculant la représentation de la personnalité de l'étudiant x_t Et représentation des caractéristiques situationnelles c^k La similitude cosinus de l'élève comme entrée dans une situation particulière , Ensuite, répartir l'influence des différentes situations dans le Groupe. c^v, Et ce groupe de caractéristiques situationnelles c^kDe Poids, Cela permet d'obtenir une représentation de l'impact des entrées contextuelles de chaque groupe. v Et représentation des propriétés k.
Graphique 5:Context interaction Couche et Context aggregation Couche

Dans la couche interactive ,Similaire, L'étude a utilisé des groupes de scénarios pour exprimer l'impact v Et caractéristiques k Représente respectivement Mécanisme d'attentionValeur en value Et les clés key, Ensuite, nous obtenons la représentation de l'influence de chaque groupe d'entrées contextuelles après l'interaction. v' Et représentation des propriétés k'.Enfin, Dans la couche d'agrégation , L'étude utilise encore l'expression de la personnalité x_tEn tant que Mécanisme d'attentionDans Requête query, Représenter l'impact des entrées contextuelles de chaque groupe v' Et représentation des propriétés k' Séparément Mécanisme d'attentionValeur en value Et les clés key, Pour regrouper les données contextuelles de chaque groupe , Obtenir la représentation finale de l'impact de l'apport situationnel sur les élèves .
L'expérience

Les données utilisées dans l'expérience proviennent du Programme international d'évaluation des étudiants. (Programme for International Student Assessment,PISA)2015 Ensemble de données publiques pour l'année (Ci - après dénommée PISA2015),Inclus dans 79 Données sur les questionnaires et les réponses des élèves de différents pays et régions .PISA Le projet a été réalisé par l'OCDE (OECD) Programmes internationaux d'évaluation des étudiants organisés , Les données du questionnaire sur les élèves, y compris l'information sur la situation de l'éducation conçue par des experts, et la relation entre les élèves en mathématiques 、Science、 Données de réponse aux tests dans des disciplines telles que la lecture ,PISA 2015 Le sujet principal du test est la science. , Par conséquent, les données sur les réponses des étudiants aux tests scientifiques sont utilisées dans les expériences. . L'étude est basée sur ,Oui. PISA2015 Trois ensembles de données ont été extraits des données scientifiques ,Respectivement. Asia、Europe Avec America, Le prétraitement spécifique des données peut se référer au contenu de la thèse. , Le tableau suivant présente les statistiques des ensembles de données. .
Tableaux 1: Statistiques des ensembles de données

1. Prévision du rendement des étudiants

L'étiquette de compétence du point de connaissance réel de l'étudiant n'est pas disponible , Par conséquent, l'étude utilise une mesure indirecte de l'exactitude des résultats diagnostiques. , C'est - à - dire l'utilisation des résultats diagnostiques des élèves pour prédire les scores des questions d'examen dans les données non liées à la formation. , C'est une pratique courante dans les modèles de diagnostic cognitif traditionnels. . L'expérience baseline Comprend deux catégories , L'un est le modèle traditionnel de ciblage cognitif sans renforcement de l'information contextuelle. (Par exemple: NeuralCD,IRT Et MIRT), Le premier est un cadre en deux étapes basé sur l'étude , Utiliser le contexte traditionnel pour modéliser le réseau (Par exemple: Deep FM Avec NeuralFM Réseau) Modèle de modélisation de l'impact de l'information contextuelle . Les résultats de l'expérience sont présentés dans le tableau suivant: , De l'étude ECD-NeuralCD、ECD-IRT、ECD-MIRT Comparaison de deux types de modèles dans différents ensembles de données régionaux baseline Une grande amélioration a été obtenue .En outre, Modèle stochastique (random) Sur différents ensembles de données AUC Tout est là. 0.5 Gauche et droite, La distribution de l'échantillon dans l'ensemble de données est vérifiée comme étant raisonnable. .
Tableaux 2: Prévision du rendement des étudiants

2. Expérience d'ablation

Pour prouver la rationalité de la structure du réseau de modélisation situationnelle , L'étude a effectué des expériences d'ablation en utilisant la couche de sommation au lieu de chaque couche du réseau dans le réseau de modélisation situationnelle. ,Les résultats sont présentés dans le tableau ci - dessous.. Le remplacement de n'importe quelle couche du réseau réduit l'effet expérimental final , Et l'effet de la couche de polymérisation est le plus évident .
Tableaux 3:Expérience d'ablation

3. Paramètres Expérience interprétative

Pour illustrer davantage l'interprétabilité du modèle , L'étude a également permis de: Paramètres Expérience interprétative : Expérience de visualisation du vecteur de personnalité , Expérience de visualisation du module d'attention dans la couche filtrante , Caractéristique explicite de l'influence de l'information situationnelle Poids Expériences statistiques .

1) Expérience de visualisation du vecteur de personnalité

L'étude commence par l'utilisation du vecteur de personnalité de l'étudiant t-SNE En cours Dimension réduite, Et visualisé en dispersion ; Ensuite, pour chaque dispersion , Selon le taux moyen de notation de l'étudiant pour l'exercice (0~1) Coloration , Voir la figure .Je vois., Il existe une corrélation entre la distribution du vecteur de personnalité de l'apprentissage et le taux de notation moyen des élèves. , Cela correspond également à l'intuition du chercheur .
Graphique 6: Analyse visuelle du vecteur de personnalité des élèves

2) Visualisation du module d'attention de la couche filtrante

L'étude a sélectionné l'attention de certains élèves sur l'apport situationnel. PoidsPour visualiser,Parmi eux NO.0~4 Les élèves dont le taux moyen de réussite est faible ,NO.5~9 Les élèves ont un taux de réussite plus élevé . Les chercheurs ont codé les scénarios correspondants ( Informations sur le même scénario , Plus le codage est important, plus l'effet sur l'état des connaissances des élèves est positif. ) Est également visualisé dans la figure .De “Books” Comparaison horizontale des informations , Vous pouvez voir que les élèves à faible score se concentrent sur des intrants plus négatifs , Les élèves qui obtiennent des notes élevées se concentrent sur les intrants plus positifs. ;De 4、8、9 Comparaison longitudinale des élèves , Des conclusions similaires peuvent être tirées . Cela signifie que le module d'attention simule la phase entre l'information contextuelle et la personnalité de l'étudiant. .
Graphique 7: Visualisation de l'attention

3) Impact situationnel Poids

L'étude a calculé les différences ECD Mise en œuvre du modèle ,Et ECD-MIRT Étudiants dans certaines parties du Centre ParamètresRépartition de, La grande majorité des résultats d_tTout est là. 0.5 Gauche et droite(0.4~0.6), Il montre que les caractéristiques explicites de l'influence de l'information situationnelle et les caractéristiques intrinsèques de l'apprentissage de l'histoire des élèves ont une influence importante sur l'état final des connaissances des élèves. .
Graphique 8:SituationPoidsAnalyse

4. Expérience de comparaison régionale

Enfin, L'étude est également basée sur l'agrégation (context aggregation) Attention à l'impact situationnel des différents contenus de la couche Poids, Compte les étudiants individuels top-3 Informations contextuelles pour , Statistiques régionales ,Les résultats sont présentés dans le tableau ci - dessous.. Il y a des découvertes intéressantes , Ressources éducatives information contextuelle importante dans toutes les régions , Par exemple, les conditions familiales (Home ESCS) Et des technologies de l & apos; information et des communications (ICT) Situation pertinente (PS:United States La région manque d'information contextuelle pour cette section ). La Chine et la Corée du Sud s'intéressent à l'éducation des parents , Les chercheurs ont émis l'hypothèse que cela pourrait être lié à un système similaire d'examen d'entrée à l'Université et à l'atmosphère en Chine et en Corée du Sud. . En Europe et aux États - Unis, “School learning“Avec”Teacher Attitude“ Il y aura plus d'attention. , Et l'Asie n'y prête pas autant attention. , Les chercheurs ont émis l'hypothèse que cela pourrait être lié aux différences entre les modèles d'enseignement et les objectifs d'enseignement. .
Tableaux 4: Information contextuelle sur les préoccupations des différentes régions

Avec la montée de l'éducation intelligente , La théorie du diagnostic cognitif est largement étudiée et développée . Les résultats du diagnostic cognitif peuvent fournir une mesure flexible pour l'analyse de l'information contextuelle éducative. , Cependant, il est difficile d'étudier empiriquement la pédagogie traditionnelle. Quantification、 Inconvénients de la transmission des erreurs , Ne s'adapte pas à la multidisciplinarité actuelle 、Scénarios à grande échelle. Cadre de réseau de bout en bout , Diagnostic cognitif assisté par des informations contextuelles éducatives , L'analyse de la fonction de l'information contextuelle éducative est une orientation qui mérite d'être explorée. .
版权声明
本文为[Le cœur de la machine]所创,转载请带上原文链接,感谢
https://fheadline.com/2021/09/20210914184047157G.html
相似文章