Sunday 19 February 2017

Mouvement Moyenne Exemples Séries Temps

Moyenne mobile Cet exemple vous enseigne comment calculer la moyenne mobile d'une série temporelle dans Excel. Une moyenne mobile est utilisée pour lisser les irrégularités (pics et vallées) pour reconnaître facilement les tendances. 1. Tout d'abord, jetez un oeil à notre série chronologique. 2. Sous l'onglet Données, cliquez sur Analyse des données. Remarque: ne trouve pas le bouton Analyse des données Cliquez ici pour charger le complément Analysis ToolPak. 3. Sélectionnez Moyenne mobile et cliquez sur OK. 4. Cliquez dans la zone Plage d'entrée et sélectionnez la plage B2: M2. 5. Cliquez dans la zone Intervalle et tapez 6. 6. Cliquez dans la zone Plage de sortie et sélectionnez la cellule B3. 8. Tracez un graphique de ces valeurs. Explication: parce que nous définissons l'intervalle sur 6, la moyenne mobile est la moyenne des 5 points de données précédents et le point de données actuel. En conséquence, les crêtes et les vallées sont lissées. Le graphique montre une tendance à la hausse. Excel ne peut pas calculer la moyenne mobile pour les 5 premiers points de données car il n'y a pas assez de points de données antérieurs. 9. Répétez les étapes 2 à 8 pour l'intervalle 2 et l'intervalle 4. Conclusion: Plus l'intervalle est grand, plus les sommets et les vallées sont lissés. Plus l'intervalle est petit, plus les moyennes mobiles sont proches des points de données réels. La mesure d'une moyenne mobile est un processus de lissage. Une autre façon de résumer les données passées est de calculer la moyenne des nombres successifs de nombres de données passés comme suit. Rappelons l'ensemble des numéros 9, 8, 9, 12, 9, 12, 11, 7, 13, 9, 11, 10 qui représentaient le montant en dollars de 12 fournisseurs choisis au hasard. Définissons (M), la taille du plus petit ensemble égal à 3. Alors la moyenne des 3 premiers nombres est: (9 8 9) 3 8.667. C'est ce qu'on appelle le lissage (c'est-à-dire une forme de calcul de la moyenne). Ce processus de lissage est poursuivi en avançant une période et en calculant la moyenne suivante de trois nombres, en laissant tomber le premier nombre. Exemple de moyenne mobile Le tableau suivant résume le processus, qui s'appelle Moyenne mobile. L'expression générale de la moyenne mobile est Mt frac cdots X. Résultats de la série Moyenne mobile Exemple Les exemples suivants illustrent comment XLMiner peut être utilisé pour explorer les données afin de découvrir les tendances et les saisonnalités. Sur le ruban XLMiner, dans l'onglet Application de votre modèle, sélectionnez Aide - Exemples. Puis ForecastingData Mining Exemples et ouvrez l'exemple de jeu de données, Income. xlsx. Cet ensemble de données contient le revenu moyen des contribuables par État. Généralement, les étapes suivantes sont effectuées dans une analyse de séries chronologiques. 1. Les données sont réparties en deux ensembles avec 60 des données affectées au groupe d'entraînement et 40 affectées au jeu de validation. 2. Des techniques exploratoires sont appliquées aux ensembles de formation et de validation. Si les résultats sont synchronisés, le modèle peut être ajusté. Si les parcelles ACF et PACF sont identiques, le même modèle peut être utilisé pour les deux ensembles. 3. Le modèle est adapté à l'aide de la méthode ARIMA (Autoregressive Integrated Moving Average). 4. Lorsqu'un modèle est adapté en utilisant la méthode ARIMA, XLMiner affiche les parcelles ACF et PACF pour les résidus. Si ces parcelles sont dans la bande de l'UCL et LCL, alors les résidus sont aléatoires et le modèle est adéquat. 5. Si les résidus ne se trouvent pas dans les bandes, certaines corrélations existent et le modèle devrait être amélioré. Tout d'abord, exécutez une partition sur les données. Sélectionnez une cellule dans l'ensemble de données, puis sur le XLMiner ribboon, dans l'onglet Série chronologique, sélectionnez Partition pour ouvrir la boîte de dialogue Données de partition des séries temporelles. Sous la liste Variables, sélectionnez Année et cliquez sur gt pour passer à Variable de temps. Sélectionnez les variables restantes dans la liste Variables, puis cliquez sur gt pour les inclure dans les Variables de la liste Données de partition. Sous Spécifier les options de partitionnement, sélectionnez Spécifier les enregistrements pour spécifier le nombre d'enregistrements affectés aux ensembles de formation et de validation. Sous Spécifier les enregistrements pour le partitionnement, sélectionnez Spécifier les enregistrements, puis entrez 50 pour le nombre d'enregistrements de formation et 21 pour le nombre d'enregistrements de groupe de validation. Si l'option Spécifier les pourcentages est sélectionnée sous Spécifier les options de partitionnement, XLMiner affecte un pourcentage d'enregistrements à chaque ensemble en fonction des valeurs saisies par l'utilisateur ou automatiquement saisies par XLMiner sous Spécifier les pourcentages pour le partitionnement. Cliquez sur OK. La feuille de données DataPartitionTS est insérée à droite de la feuille de calcul Revenu. Dans la sortie ci-dessus, la méthode de partitionnement est séquentielle (versus random). Les 50 premières observations ont été attribuées à l'ensemble d'entraînement et les 21 observations restantes ont été affectées à l'ensemble de validation. Sélectionnez une cellule dans la feuille de données DataPartitionTS, puis sur le ruban XLMiner, dans l'onglet Série chronologique, sélectionnez ARIMA - Autocorrélations pour afficher la boîte de dialogue ACF. Sélectionnez CA comme variable sélectionnée, entrez 10 pour les deux paramètres ACF pour les données de formation et les données de validation. Le diagramme ACF de tracé est sélectionné par défaut. Cliquez sur OK. La feuille de calcul ACFOutput est insérée après la feuille de données DataPartitionTS. Notez sur chaque graphique que l'autocorrélation diminue à mesure que le nombre de décalages augmente. Cela suggère qu'il existe un modèle précis dans chaque partition. Cependant, comme le modèle ne se répète pas, on peut supposer qu'aucune saisonnalité n'est incluse dans les données. De plus, comme les deux tableaux présentent un profil similaire, nous pouvons adapter le même modèle aux ensembles de validation et de formation. Cliquez de nouveau sur la feuille de données DataPartitionTS et sur le ruban XLMiner, dans l'onglet Série chronologique, sélectionnez ARIMA - Autocorrélations partielles pour ouvrir la boîte de dialogue PACF. Sélectionnez CA dans la liste Variables In Input Data, puis cliquez sur gt pour déplacer la variable vers la variable Selected. Entrez 40 pour Lag Maximum dans les paramètres PACF pour les données d'entraînement, et 15 pour les paramètres PACF pour les données de validation. Le graphique PACF de tracé est sélectionné par défaut. Cliquez sur OK. La feuille de calcul ACFOutput est insérée directement à droite de la feuille de données DataPartitionTS. Les deux tracés PACF présentent des modèles similaires dans les ensembles de validation et de formation. Par conséquent, nous pouvons utiliser le même modèle pour les deux ensembles. Sortie PACF pour données d'apprentissage Sortie PACF pour données de validation La fonction PACF affiche un modèle défini, ce qui signifie qu'il existe une tendance dans les données. Cependant, comme le modèle ne se répète pas, nous pouvons conclure que les données ne montrent pas de saisonnalité. Les deux tableaux ACF et PACF suggèrent qu'il existe un modèle défini, mais sans aucune saisonnalité. Les deux ensembles de données présentent le même comportement dans les ensembles de formation et de validation, ce qui suggère que le même modèle est approprié pour chacun. Maintenant, nous sommes prêts à adapter le modèle. Le modèle ARIMA accepte trois paramètres: p - le nombre de termes autorégressifs d - le nombre de différences non saisonnières, et q - le nombre d'erreurs retardées (moyennes mobiles). Rappelons que le graphique ACF n'a montré aucune saisonnalité dans les données, ce qui signifie que l'autocorrélation est presque statique, diminuant avec le nombre de décalages croissant. Cela suggère q q car il semble n'y avoir aucune erreur retardée. Le graphique PACF affiche une grande valeur pour le premier décalage, mais des parcelles minimales pour des décalages successifs. Ceci suggère le réglage p 1. Avec la plupart des ensembles de données, le réglage d 1 est suffisant ou peut au moins être un point de départ. Cliquez à nouveau sur la feuille de données DataPartitionTS et sur le ruban XLMiner, dans l'onglet Série chronologique, sélectionnez le modèle ARIMA-ARIMA pour afficher la boîte de dialogue Série chronologique - ARIMA. Sélectionnez CA dans la liste Variables In Input Data, puis cliquez sur gt pour déplacer la variable dans le champ Variable sélectionnée. Sous Paramètres non saisonniers, réglez Autoregressive (p) sur 1, Difference (d) sur 1 et Moyenne mobile (q) sur 0. Cliquez sur Avancé pour ouvrir la boîte de dialogue ARIMA - Options avancées. Sélectionnez Valeurs ajustées et résidus, Produire des prévisions et Indiquer les intervalles de confiance prévus. Le paramètre de niveau de confiance par défaut de 95 est automatiquement saisi. La matrice de variance-covariance est sélectionnée par défaut. Cliquez sur OK dans la boîte de dialogue Options avancées ARIMA et de nouveau sur la boîte de dialogue Série chronologique - ARIMA. XLMiner calcule et affiche différents paramètres et graphiques dans deux feuilles de sortie, ARIMAOutput et ARIMAResiduals. La feuille de calcul ARIMAOutput contient le modèle ARIMA, illustré ci-dessous. Sur cette même feuille de calcul, XLMiner a calculé le terme constant et le terme AR1 pour notre modèle. Ce sont les termes constant et f1 de l'équation de prévision. Voir la sortie suivante du test du Chi-carré. La petite valeur p pour le terme constant (0.9704) et AR1 terme (0) suggère que le modèle est un bon ajustement à nos données. Ouvrez la feuille de calcul ARIMAResiduals. Ce tableau présente les valeurs réelles et ajustées et les résidus résultants. Comme le montre le graphique ci-dessous, les valeurs réelles et prévues correspondent assez bien. L'utilité du modèle dans la prévision dépendra de la proximité des valeurs réelles et prévues dans le tracé temporel du jeu de validation. Ensuite, nous verrons les tracés ACF et PACF pour les erreurs trouvées au bas de la feuille de calcul ARIMAOutput. Tous les retards, à l'exception du décalage 1, se situent clairement dans les bandes UCL et LCL. Cela indique que les résidus sont aléatoires et ne sont pas corrélés, ce qui est la première indication que les paramètres du modèle sont adéquats pour ces données. Reportez-vous au tableau Prévisions de la feuille de calcul ARIMAOutput. Le tableau indique la valeur réelle et prévue. Les valeurs inférieure et supérieure représentent les limites inférieure et supérieure de l'intervalle de confiance. Il y a 95 chances que la valeur prévue entre dans cette fourchette. Le tracé de temps à droite indique comment le modèle, que nous avons équipé en utilisant le Training Set et effectué sur le Set de Validation. Les valeurs réelles et prévues sont assez proches, ce qui confirme que notre modèle devrait être bon pour la prévision. Pour tracer les valeurs sous la colonne Lower et Upper dans le même graphique, sélectionnez le graphe, puis sur le ruban Excel, sélectionnez Design - Select Data pour ouvrir la boîte de dialogue Select Data Source. Pour la plage de données du graphique, entrez ARIMAOutputB56: G77. Puis décochez l'option Erreur sous Entrées de légende. Cliquez sur OK. Ce graphique montre que les valeurs réelles et prévues se trouvent dans les bandes de niveau de confiance inférieur et supérieur. Bien que les valeurs réelles fluctuent un peu, ces valeurs tombent dans le centre de la plage. Nous pouvons conclure de la sortie d'ARIMA que notre modèle utilisant les paramètres (1, 1, 0) a été montré pour adapter convenablement les données.


No comments:

Post a Comment