Formations aux Statistiques

Formations de statistique

Introduction à la statistique

Informations pratiques

  • Durée : 1 jour (7 heures)
  • Intervenant : Emmanuel DUCLOS [cv]
  • Tarif : 1 300 €uros H.T. Hors frais de déplacement et d'hébergement
  • Taux de satisfaction : 100% sur 31 avis sur les 12 derniers mois (mis à jour le 24 novembre 2023 )
  • Session en intra - Nous contacter pour organiser une session
  • Disponibilité : Inscriptions tout au long de l'année. Prévoir un délai de 10 jours en amont de la formation, et en fonction des disponibilités du formateur

Objectifs pédagogiques

L'objectif de cette formation est de présenter les notions de base de la statistique pour représenter le comportement d'une ou plusieurs variables aléatoires.

  • Savoir construire des graphiques statistiques pour faire la synthèse de données
  • Savoir calculer et interpréter les paramètres d'une population
  • Savoir quantifier et interpréter un intervalle de confiance
  • Savoir quantifier et interpréter les relations entre deux variables

Public concerné

Techniciens et ingénieurs ayant à exploiter des données pour en faire la synthèse et communiquer les résultats de manière graphique ou numérique.

Pré-requis

Ce stage ne nécessite aucun pré-requis.

Moyens pédagogiques

Plusieurs supports de cours sont fournis aux apprenants (résumé des transparents présentés et fiches d'exercices).

Méthodes d'évaluation

  • Un questionnaire préformatif
  • Un questionnaire de positionnement Pré-formation
  • Un questionnaire de positionnement Post-formation
  • Un QCM d'évaluation de développement des connaissances (sur demande)
  • Une évaluation de satisfaction
Programme de formation - 1 jour

Les variables

  • Les variables du statisticien sont des variables aléatoires
  • Exemple de variables discrètes
  • Exemple de variables continues

Description d'une population

  • Les représentations graphiques les plus classiques
    • Histogramme
    • Boxplot
    • Fonction de répartition
    • Probability plot
    • Estimation de densité
  • Synthèse de la population à l'aide de paramètres
    • Paramètres de centrage
    • Paramètres de dispersion
    • Paramètres de forme

Notion d'estimation

  • Problématique de l'échantillonnage
  • Propriétés d'un estimateur
  • Estimation de la moyenne
  • Estimation de l'écart-type
  • Construction d'un intervalle de confiance

La décision statistique

  • Introduction à la décision statistique
  • Exemple de construction d'un test sur la moyenne
  • Les risques associés à l'utilisation d'un test
  • Présentation des problématiques industrielles qui peuvent être traitées par les tests (validation ou contrôle industriel)
  • Classification des tests et démarche d'analyse

Traitement de deux variables

  • Deux variables continues : notion de corrélation
  • Deux variables discrètes : utilisation des tableaux de contingence

Application de tests en milieu industriel

Informations pratiques

  • Durée : 2 jours (14 heures)
  • Intervenant : Emmanuel DUCLOS [cv]
  • Tarif : 2 600 €uros H.T. Hors frais de déplacement et d'hébergement
  • Taux de satisfaction : 96% sur 25 avis sur les 12 derniers mois (mis à jour le 24 novembre 2023 )
  • Session en intra - Nous contacter pour organiser une session
  • Disponibilité : Inscriptions tout au long de l'année. Prévoir un délai de 10 jours en amont de la formation, et en fonction des disponibilités du formateur

Objectifs pédagogiques

Ce stage a pour objectif de développer les connaissances nécessaires pour exploiter des données industrielles (labo, développement, production) afin de prendre des décisions tout en maîtrisant les risques. L'objectif de cette formation est, d'une part, de proposer une méthodologie dans l'exploitation de résultats expérimentaux, et d'autre part, de fournir une boite à outils des analyses les plus fréquemment pratiquées dans l'industrie.

  • Appliquer et interpréter la statistique descriptive unidimensionnelle
  • Faire une estimation et encadrer le résultat par un intervalle de confiance
  • Choisir et appliquer un test paramétrique ou non paramétrique
  • Appliquer et interpréter un test de normalité

Public concerné

Ce stage est destiné aux techniciens et ingénieurs souhaitant utiliser les approches statistiques pour comparer des résultats expérimentaux pour faire de la résolution de problème ou argumenter des modifications process ou de conception.

Pré-requis

Ce stage ne nécessite aucun pré-requis.

Moyens pédagogiques

Le cours sera agrémenté de nombreux exercices pratiques et de simulations informatiques, notamment avec le logiciel SOS Stat (ou autres). Plusieurs supports de cours sont fournis aux apprenants (résumé des transparents présentés et fiches d'exercices).

Méthodes d'évaluation

  • Un questionnaire préformatif
  • Un questionnaire de positionnement Pré-formation
  • Un questionnaire de positionnement Post-formation
  • Un QCM d'évaluation de développement des connaissances (sur demande)
  • Une évaluation de satisfaction
Programme de formation - 2 jours

Introduction

  • Notion de variable aléatoire et de probabilité
  • Variables discrètes et variables continues , exemples industriels
  • Présentation des principales lois de probabilité utilisées

Estimation

  • Échantillonnage
    • Échantillon représentatif
    • Cas d'une population stratifiée
    • Précision des estimations
  • Propriétés d'un estimateur
  • Lois de distribution de la moyenne et de l'écart-type
  • Construction et interprétation d'un intervalle de confiance

Tests - Introduction

  • Approche statistique d'une comparaison : Hypothèse, décision et risque
  • Notion de p-value et interprétation
  • Principe de construction d'une variable de test
  • Démarche d'analyse pour mettre en œuvre des tests de comparaison
  • Élimination de valeurs aberrantes et importance de la normalité

Tests paramétriques

  • Tests de comparaison de moyennes sur 1, 2 et k échantillons
  • Tests de comparaison de variances sur 1, 2 et k échantillons
  • Tests de comparaison de proportions sur 1, 2 et k échantillons
  • Mise en application sur SOSstat ou autre logiciel

Tests de normalité

  • Construction du test du Khi-deux, Kolmogorov et Shapiro Wilk ...
  • Comparaison de ces tests et règles de mise en œuvre

Tests non-paramétriques

  • Mise en œuvre de tests sur des critères non mesurables
  • Comparaison de 2, n échantillons sur un critère de centrage
  • Comparaison de 2, n échantillons sur un critère de dispersion

Introduction à l'analyse bivarée

  • Notion de corrélation

Statistique multivariée

Informations pratiques

  • Durée : 2 jours (14 heures)
  • Intervenant : Emmanuel DUCLOS [cv]
  • Tarif : 2 600 €uros H.T. Hors frais de déplacement et d'hébergement
  • Taux de satisfaction : Il n'y a pas encore de taux de satisfaction sur cette prestation sur les 12 derniers mois (mis à jour le 24 novembre 2023 )
  • Session en intra - Nous contacter pour organiser une session
  • Disponibilité : Inscriptions tout au long de l'année. Prévoir un délai de 10 jours en amont de la formation, et en fonction des disponibilités du formateur

Objectifs pédagogiques

Ce stage a pour objectif de rendre opérationnelle toute personne rencontrant dans son métier, le besoin d'analyser des données quantitatives ou qualitatives dans le but de déterminer quelles sont les méthodes multidimensionnelles appropriées à utiliser selon l'objectif de l'étude et la nature des données

  • Appliquer et interpréter la statistique descriptive unidimensionnelle
  • Appliquer et interpréter la statistique descriptive multidimensionnelle
  • Analyser les corrélations
  • Appliquer la régression multiple et la régression logistique
  • Identifier les structures ou groupes de données avec des méthodes de classification
  • Interprétation de l'analyse factorielle discriminante

Public concerné

Ce stage est destiné aux techniciens et ingénieurs souhaitant analyser des données multidimensionnelles issues d'un produit ou d'un processus.

Pré-requis

Ce stage ne nécessite aucun pré-requis.

Moyens pédagogiques

Les analyses seront faites à l'aide d'un tableur, SOSstat, R ou tout autre logiciel spécifié par le client. Plusieurs supports de cours sont fournis aux apprenants (résumé des transparents présentés et fiches d'exercices).

Méthodes d'évaluation

  • Un questionnaire préformatif
  • Un questionnaire de positionnement Pré-formation
  • Un questionnaire de positionnement Post-formation
  • Un QCM d'évaluation de développement des connaissances (sur demande)
  • Une évaluation de satisfaction
Programme de formation - 2 jours

Statistique descriptive (rappels)

  • Paramètres de localisation et d'échelle
  • Paramètres de forme

Notion d'estimation (rappels)

  • Les variables aléatoires, les lois et leurs relations
  • Loi de distribution d'un estimateur
  • Intervalle de confiance d'une estimation

Statistique descriptive multidimensionnelle

  • Notion de corrélation, nuage de points et ellipse
  • L'analyse en composantes principales

Construction d'un modèle explicatif

  • La régression linéaire, principe et mise en œuvre
  • Régression multiple
  • Principe de calcul, le modèle simple et le modèle généralisé
  • Simplification d'un modèle
  • Codage des variables continues et discrètes
  • Régression logistique (cas où la réponse est qualitative)
  • Régression Ridge et Lasso

Méthodes de classification

  • Analyse Factorielle Discriminante
  • Classification hiérarchique
  • Classification non-hiérarchique

Pratique de la régression

Informations pratiques

  • Durée : 1 jour (7 heures)
  • Intervenant : Emmanuel DUCLOS [cv]
  • Tarif : 1 300 €uros H.T. Hors frais de déplacement et d'hébergement
  • Taux de satisfaction : Il n'y a pas encore de taux de satisfaction sur cette prestation sur les 12 derniers mois (mis à jour le 24 novembre 2023 )
  • Session en intra - Nous contacter pour organiser une session
  • Disponibilité : Inscriptions tout au long de l'année. Prévoir un délai de 10 jours en amont de la formation, et en fonction des disponibilités du formateur

Objectifs pédagogiques

L'objectif de cette formation est d'étudier les relations qui existent entre des variables qui ne sont pas indépendantes. En premier lieu, on peut étudier l'intensité de la liaison qui peut exister entre ces variables (corrélation), puis modéliser des relations de cause à effet avec des techniques de régression.

  • Analyser une matrice de corrélation
  • Mettre en application la régression simple et interpréter les résidus
  • Mettre en application et interpréter la régression multiple
  • Simplifier un modèle de régression

Public concerné

Ce stage s'adresse aux techniciens et ingénieurs souhaitant modéliser des relations entre variables pour analyser un phénomène physique ou faire de la résolution de problème.

Pré-requis

Ce stage ne nécessite aucun pré-requis.

Moyens pédagogiques

Les concepts introduits seront illustrés par des exercices et simulations de procédés industriels (logiciels sous Windows) qui apportent un aspect interactif à la mise en pratique. Les exemples et exercices seront traités sur des simulateurs informatiques et le logiciel SOSstat. Plusieurs supports de cours sont fournis aux apprenants :

  • résumé des transparents présentés
  • fiches d'exercices
  • fichiers excel

Méthodes d'évaluation

  • Un questionnaire préformatif
  • Un questionnaire de positionnement Pré-formation
  • Un questionnaire de positionnement Post-formation
  • Un QCM d'évaluation de développement des connaissances (sur demande)
  • Une évaluation de satisfaction
Programme de formation - 1 jour

Les variables aléatoires

  • Introduction à la notion de variable aléatoire
  • Variables quantitatives et qualitatives
  • Rappel de statistique descriptive

Corrélation de variables

  • Introduction à la notion de corrélation
  • Coefficients de corrélation pour des variables quantitatives et qualitatives : coefficient de Kendall, Spearman et Pearson
  • Test appliqué à la corrélation

La régression linéaire simple

  • Principe de la régression simple et ses hypothèses
  • Identification des coefficients par les moindres carrés
  • Évaluation de la précision du modèle
    • Coefficient de détermination
    • Analyse de la variance
  • Construction d'un intervalle de confiance et de prédiction
  • Comparaison des coefficients du modèle avec un modèle théorique
  • Exercices d'application sur des exemples industriels.

Diagnostique de la régression

  • Analyse des résidus
  • Valider la robustesse d'un modèle avec des résidus studentisés ou une procédure Jacknife
  • Test sur les valeurs aberrantes
  • Test de normalité sur les résidus
  • Identifier les données influentes avec les distances de Cook
  • Cas de variance non constante
  • Utilisation de transformations pour améliorer la qualité de prédiction dans le cas de relations non linéaires

La régression multiple

  • Problématique de la régression multiple
  • Calcul des coefficients du modèle
  • Tests sur les coefficients du modèle
  • Validation du modèle avec les coefficients de détermination R2R2 et R2ajusteR{2}_{ajuste}
  • Exploitation des analyses de la variance
  • Simplification d'un modèle (ou sélection des variables) par des méthodes pas à pas ascendante et descendante
  • Cas particulier de la régression
    • Influence de la corrélation
    • Traiter des variables corrélées en utilisant la régression PLS
    • Régression logistique