Friday, 3 March 2017

Standardisation Des Données Dans Stata Forex

À l'heure actuelle, la fonction egen officiellement écrite std () ne prend pas en charge les opérations par. Je ne peux pas identifier une raison statistique ou de calcul pour cela, mais il est bien documenté. (Pourquoi vous avez besoin de chance pour dépasser une limite documentée je ne comprends pas.) En principe, tout utilisateur pourrait écrire leur propre fonction egen pour soutenir ce que vous voulez être implémenté dans un appel d'une ligne. En pratique, personne ne semble assez gêné pour l'écrire étant donné le travail facile que vous avez utilisé. Dans la pratique, ces choses sont écrites quand quelqu'un s'irrite à la nécessité de taper trois lignes de code à plusieurs reprises. Une raison beaucoup plus positive que le code que vous citez est utile, c'est que statistiquement, vous devriez habituellement garder un suivi des moyens et des écarts-types de toute façon. A répondu Jan 14 15 at 18:28 Stata doesnt l'avoir, mais vous pouvez très facilement le faire vous-même. Et voici comment: 1- L'indice est que vous ne pouvez pas standardiser par groupe, mais vous pouvez prendre la moyenne et les écarts-types par groupe. Ainsi, (a) prendre la moyenne par groupe, (b) prendre l'écart type par groupe, et enfin (c) standardizedvariable (thevar-meanofthevar) stdofthevar 2- Exemple: ainsi, permet de standardiser les ventes variable par entreprise. Voici comment le code fonctionne: AVIS: Le groupe de consultation IDRE Statistical migrera le site Web vers le WordPress CMS en février pour faciliter la maintenance et la création de nouveaux contenus. Certaines de nos anciennes pages seront supprimées ou archivées de sorte qu'elles ne seront plus conservées. Nous essaierons de maintenir les redirections afin que les anciennes URL continuent à fonctionner de la meilleure façon possible. Stata FAQ Comment standardiser les variables dans Stata Une variable standardisée (parfois appelée z-score ou standard) est une variable qui a été rééchelonnée à Ont une moyenne de zéro et un écart-type de un. Pour une variable standardisée, la valeur de chaque cas sur la variable standardisée indique sa différence par rapport à la moyenne de la variable d'origine en nombre d'écarts types (de la variable d'origine). Par exemple, une valeur de 0,5 indique que la valeur pour ce cas est la moitié d'un écart-type au-dessus de la moyenne, alors qu'une valeur de -2 indique qu'un cas a une valeur deux écarts-types inférieurs à la moyenne. Les variables sont normalisées pour diverses raisons, par exemple, pour s'assurer que toutes les variables contribuent de façon égale à une échelle lorsque les éléments sont ajoutés ensemble ou pour faciliter l'interprétation des résultats d'une régression ou d'une autre analyse. La normalisation d'une variable est une procédure relativement simple. Tout d'abord, la moyenne est soustraite de la valeur pour chaque cas, ce qui donne une moyenne de zéro. Ensuite, la différence entre le score individuel et la moyenne est divisée par l'écart-type, ce qui entraîne un écart-type de un. Si on commence par une variable x. Et générer une variable x. Le processus est: où m est la moyenne de x. Et sd est l'écart-type de x. Pour illustrer le processus de normalisation, nous utiliserons le jeu de données High School and Beyond (hsb2). Nous allons créer des versions standardisées de trois variables, math. science . Et socst. Ces variables contiennent des notes d'élèves sur les tests de connaissances en mathématiques (mathématiques), sciences (sciences), études sociales (socst). Tout d'abord, nous utiliserons la commande de résumé (abrégée en tant que somme ci-dessous) pour obtenir la moyenne et l'écart type pour chaque variable. La moyenne des mathématiques est 52.645, et son écart type est 9.368448. Sur la base de ces informations, nous pouvons générer une version standardisée des mathématiques appelée z1math. Le code ci-dessous fait ceci avec la commande generate (abrégé en gen), puis utilise resume pour confirmer que la moyenne de z1math est très proche de zéro (en raison de l'erreur d'arrondi, la moyenne d'une variable standardisée sera rarement exactement 0) L'écart-type est un. Ci-dessous nous faisons la même chose pour la science et le socst. Créant deux nouvelles variables, z1science et z1socst. En utilisant leurs moyens respectifs et les écarts types tirés du premier tableau de statistiques sommaires. Le tableau des statistiques récapitulatives ci-dessous démontre que les deux variables sont en fait normalisées. Normaliser les variables n'est pas difficile, mais pour rendre ce processus plus facile, et moins sujettes aux erreurs, vous pouvez utiliser la commande egen pour créer des variables normalisées. Les commandes ci-dessous standardisent les valeurs de math. science . Et socst. Créant trois nouvelles variables, z2math. Z2science. Et z2socst. Encore une fois, nous pouvons examiner un tableau de statistiques sommaires pour confirmer que ces variables sont normalisées. Notez que les moyens ne sont pas exactement égaux à zéro, et qu'ils ne correspondent pas aux moyens de l'ensemble de variables normalisées créées ci-dessus à l'aide de la commande generate. Dans les deux cas, cela est dû à une très faible erreur d'arrondi. Le contenu de ce site Web ne doit pas être interprété comme un endossement d'un site Web particulier, d'un livre ou d'un produit logiciel par l'Université de Californie.


No comments:

Post a Comment