Je pourrais peut-être aider à répondre à cette question à partir d'une expérience en psychométrie. Là où je travaille, nous produisons de nombreux tests qui sont tous standardisés, puis assimilés à la même échelle. Cependant, ces échelles, d'un test à l'autre, ne sont pas reliées, à moins bien sûr que les deux tests différents aient une étude de mise en équivalence terminée pour déterminer le facteur de décalage pour transférer une échelle du test 1 à l'échelle du test 2.
Pour construire une échelle, nous analysons d'abord les données du test, donc les données de réponse des élèves et les données d'item (question). Nous faisons l'analyse en utilisant le modèle de Rasch, qui ne prend en compte que deux variables, les capacités des élèves et les difficultés des items. Cela nous permet de construire un jeu de données contenant les niveaux logit des capacités des élèves et des difficultés des items.
Définition de Logit:
Un logit est une unité de mesure pour signaler les différences relatives entre les estimations des capacités des candidats et les difficultés liées aux items Les logits sont un niveau de mesure à intervalle égal, ce qui signifie que la distance entre chaque point de l'échelle est égale (1-2 = 99-100).
Une fois les tables logit créées ils peuvent être utilisés pour créer une échelle en appliquant une simple transformation linéaire, telle que:
scale score = 10 * logit difficulté + 250
Dans certains du travail que je fais, nous avons des scores d'échelle qui sont en fait inférieurs à 0, mais la plupart du travail que je fais, les scores d'échelle sont construits de telle sorte que le minimum soit d'environ 200 ou plus. La construction de l'échelle est pour la plupart entièrement arbitraire.
Si vous souhaitez voir comment les logits des élèves et des éléments sont calculés, veuillez lire:
https://en.wikipedia.org/wiki/Rasch_model#The_mathematical_form_of_the_Rasch_model_for_dichotomous_data
Également comme note supplémentaire: il existe d'autres modèles pour faire des analyses de test, tels que le 2PL (introduit un paramètre supplémentaire au modèle Rasch (1PL), la discrimination des éléments), le 3PL (introduit un paramètre supplémentaire au 2PL, ce qui est un facteur de supposition, cela crée une probabilité minimale d'obtenir l'élément incorrect qui dépend de votre valeur de supposition), il existe également un 4PL qui ajoute un paramètre supplémentaire (le paramètre de glissement, qui crée une probabilité plafond, qui n'est pas de 1, pour obtenir un élément correct).
J'espère que cela aide et fournit des informations supplémentaires qui peuvent être utiles.