Cours Analyse des Données MSVT 2012_Partie 2

Page 1

04/05/2012

Analyse des Données Processus de recherche de l’information et acquisition de connaissances

Recherche Bibliographique Approche initiale Rapide et peu coûteuse

Recherche Bibliographique

- Enquête - Observation - Expérimentation

Multiplication des sources

Validité ???

Décalée dans le temps

Evolution ???

Variabilité des objectifs Nécessité de validation

L’Observation Un regard porté sur une situation sans que celle-ci soit

Une enquête

modifiée. Regard de nature très générale dont le but est le recueil des données afférentes à la situation.

L’Expérimentation

Démarche intellectuelle qui a pour but la découverte de faits, l'amélioration de connaissances ou la résolution de doutes et de problèmes . Opération de recueil d'informations sur un sujet concernant une population déterminés.

Une interrogation particulière portée sur une situation créée et contrôlée par le chercheur de l’information.

1


04/05/2012

Démarche d’enquête

Connaître une population et d’étudier des liaisons entre les caractéristiques de cette population et l’objet de l’enquête Etudier et décrire des comportements, des attitudes et des opinions

Science de l’éducation Etude de marché Enquête d’opinion, de besoin, mesure des attentes… Suivis : enquêtes répétées dans le temps sur individus identiques Test produits : limite entre enquête et expérimentation

COMMENT MENER UNE ENQUETE En Théorie…

COMMENT MENER UNE ENQUETE En pratique…

Budget

OBJECTIFS

Construction du Questionnaire

Echantillonnage

Choix du mode de réalisation

Budget

OBJECTIFS

Echantillonnage

Choix du mode de réalisation

Construction du Questionnaire

2


04/05/2012

Aspects fondamentaux : DE QUELS MOYENS DISPOSEZ VOUS

?

Aspects fondamentaux : FORMULATION DE LA DEMANDE ET CONNAISSANCE DU BESOIN

TEMPS COMPETENCES HUMAINES MATERIEL

Connaître le milieu d’enquête Bibliographie sur le sujet, rencontre régulière avec le ou les commanditaire

FINANCIERS

Comprendre l’objectif général de l’enquête

LOGISTIQUE

Définition des objectifs particuliers

L’intégration de tous ces facteurs vous indiquera le type et la forme de votre enquête ; Enquête téléphonique, Face à face, Courier…

DEFINITION DE LA POPULATION CIBLE

Proposer des thèmes généraux

DEFINITION DE LA POPULATION CIBLE

Population de référence (ou cible): « Ensemble des éléments possédant les informations désirées pour répondre aux objectifs d’une étude »

Liste de personne à interroger

POPULATION Tirage aléatoire

Pour définir cette population: -- Quel est l’éléments et l’unité d’échantillonnage -- Critère géographique -- Critère temporel

Échantillon représentatif

Liste exhaustive Population disponible (taux de réponse > 80 %) Critère temporel : Evolution des comportements la durée de l’enquête doit être limité

3


04/05/2012

DIFFERENTES METHODES D’ECHANTILLONNAGE

Echantillonnage Echantillonnage probabiliste :

LA CONNAISSEZ VOUS

POPULATION

EST ELLE ACCESSIBLE

EST-ELLE DISPONIBLE

?

En thermes de caractéristique statistiques

?

?

L’échantillonnage aléatoire simple ou systématique est basé sur l’idée de donner à chaque élément de la population une probabilité égale de figurer dans l’échantillon. Lorsque la taille de l’échantillon est suffisamment grande, Cette égalité permet d’affirmer, avec un risque d’erreur connu, que les compositions de la population et de l’échantillon seront comparables. Simple : choix par une table de nombre au hasard Systématique : prise d’un pas stable sur critère sans relation avec l’étude

Echantillonnage probabiliste : L’échantillonnage Stratifié : La procédure de stratification consiste à subdiviser la population en sous-groupes (strates) définis par des variables jugées importantes (âge, sexe…). Ces catégories peuvent être exclusives ou exhaustives. Une catégorie exclusive signifie que toutes les réponses d'enquête possibles ne doivent pas faire partie d'une seule catégorie, alors qu'une catégorie exhaustive signifie qu'une catégorie doit tenir compte de toutes les réponses possibles.

Tirage proportionnel : Dans ce cas, il s’agit, par le biais de la stratification, de réduire la variance en réduisant le nombre de cas nécessaires.

Echantillonnage probabiliste : L’échantillonnage en grappe : découpage de la population en grappe exclusives et exhaustives sur des critères le plus souvent géographiques a) subdiviser la population de Marrakech en un nombre r de régions; b) tirer au sort un certain nombre de ces régions ; c) puis, dans chaque région sélectionnée, tirer un nombre ni de cas. Le but de l’opération est de pouvoir mettre en rapport des données individuelles avec des données contextuelles, ce qui serait difficile avec des données trop dispersées. Le calcul de la variance amène des résultats analogues à ceux du sondage probabiliste simple.

Tirage non proportionnel : Dans ce deuxième cas, il s’agit de « gonfler » les strates démographiquement, de manière à pouvoir les observer plus en détail.

4


04/05/2012

Echantillonnage non probabiliste :

Echantillonnage de convenance : Micro-trottoir ou questionnaire du magazines Aucune représentativité

Echantillonnage de jugement : Sélection a priori d’individu qui rentreraient dans les critères choisis

Echantillonnage non probabiliste : Echantillonnage par Quotas : Etudier la structure de la population selon des critères choisis pour ensuite reconstituer une reproduction en miniature de la population. - Equivalent Stratifié mais les individus ne sont pas choisis au hasard - Choix par un , deux, trois critères - Validation sur une base de données existante

Echantillonnage « boule de neige » : partir d’un faible nombre d’individus et intégrer d’autres par la connaissance des premiers. Il est utilisé quand les critères de sélection sont très spécifiques.

Echantillonnage

La méthode la plus utilisée

Détermination de la taille de l’échantillon Plus on souhaite des résultats précis, plus l’échantillon nécessaire est important ou grand

Détermination de la taille de l’échantillon

Cette question peut être appréhendée sous deux aspects : o Budget disponible : compte tenu du budget disponible et de la méthode d'enquête choisie, quel est le nombre de personnes qu’on peut interroger ?

Coût Coût total

Coût pour un recensement

Coût de constitution

Coût total minimum d’échantillonnage

o Calculs statistiques : pour obtenir une précision (et une puissance) donnée, combien de personnes faut-il interroger ?

Coût d’erreurs Taille d’échantillon optimale

N

n

5


04/05/2012

Détermination de la taille de l'échantillon en fonction du budget disponible Le coût total de réalisation d'une enquête sous-traitée à un bureau d'études ou à un institut de sondages peut généralement être décomposé de la façon suivante (les montants sont indicatifs et TTC ; ils peuvent varier d'une étude à l'autre et d'un consultant à l'autre) : o Préparation de l'enquête : élaboration des plans de sondage, rédaction des questionnaires, tirage des adresses, repérage sur site, pilotage des questionnaires. Le coût de cette phase est généralement compris entre 9 000 € et 12 000 €. o Réalisation des enquêtes/questionnaires. Le coût de cette phase est fonction du mode d'enquête, du nombre et de la durée des questionnaires. o Restitution des résultats (hors analyse) : codification, saisie, rapports. Le coût de cette phase est généralement compris entre 8 000 € et 12 000 € . Dans cette optique, la taille de l'échantillon s'obtient en divisant le budget consacré à la réalisation de l'enquête (étape 2) par le coût unitaire de réalisation d'un questionnaire. Le budget consacré à la réalisation de l'enquête s'obtient par différence entre le montant que l'on souhaite allouer à l'étude et le coût des deux autres phases.

Document de travail ETUDES, METHODES ET SYNTHESE, MEDD-France

Détermination de la taille de l'échantillon à partir de calculs statistiques La taille de l'échantillon a une influence à la fois sur la précision des résultats obtenus et sur la puissance des tests statistiques. Dans les études de valorisation, c'est surtout le premier élément qui est privilégié. Plus la taille de l'échantillon sera grande, plus les résultats seront précis et fiables. La théorie des sondages fournit des éléments pour déterminer de façon théorique la taille minimale d'un échantillon pour une précision donnée. La précision d'une enquête peut être décrite par o erreur absolue : écart (en valeur absolue) entre la vraie valeur (inconnue) et la valeur estimée sur l'échantillon; o erreur relative : écart en pourcentage entre la vraie valeur (inconnue) et la valeur estimée sur l'échantillon.

Document de travail ETUDES, METHODES ET SYNTHESE, MEDD-France

Taille de la population générale : 5 000 individus

Pour calculer la taille d'échantillon minimale, il est nécessaire de connaître la variance ou le coefficient de variation (rapport entre l'écart-type et la moyenne) de la variable (le consentement à payer ou à recevoir) pour la population générale. Or, ces deux grandeurs sont inconnues. On peut les obtenir à partir d'une enquête précédente portant sur un thème similaire ou par une enquête pilote.

Lecture : Si la population totale est de 5 000 ménages, pour obtenir une précision de 10 % avec un coefficient de variation de 1, il faut interroger 357 personnes. Les tableaux suivants présentent les tailles d'échantillon minimales pour différentes valeurs du coefficient de variation, différents degrés de précision (erreur relative) et différentes tailles de la population générale (habitants ou ménages selon le cas étudié).

Document de travail ETUDES, METHODES ET SYNTHESE, MEDD-France

Taille de la population générale : 10 000 individus

Document de travail ETUDES, METHODES ET SYNTHESE, MEDD-France

6


04/05/2012

Détermination de la taille de l'échantillon (calculs statistiques)

Exemple de Détermination de la taille de l'échantillon (calculs statistiques)

Trois facteurs déterminent essentiellement la taille de l'échantillon pour une enquête i) l’évolution estimative de la variable étudiée ii) le niveau de confiance visé iii) la marge d'erreur acceptable.

Etude de la malnutrition dans la région de Al Haouz. Dans le projet d'Al Haouz au Maroc, ils ont estimé qu'environ 30% (p = 0,3) des enfants de la zone souffraient de malnutrition chronique. Ce chiffre provenait des statistiques nationales sur la malnutrition en milieu rural. Ceci donne le calcul suivant.

Pour un modèle d'enquête fondé sur un échantillon aléatoire simple: on peut calculer la taille d'échantillon requise en appliquant la formule suivante.

n = 323

n : taille d'échantillon requise t : niveau de confiance à 95% (valeur type de 1,96) p : prévalence estimative de la malnutrition dans la zone du projet m : marge d'erreur à 5% (valeur type de 0,05)

n = 322.72

IFAD : Fonds International

de Développement Agricole

Exemple de Détermination de la taille de l'échantillon (calculs statistiques)

IFAD : Fonds International

de Développement Agricole

Pour conclure, on arrondit le chiffre obtenu au nombre le plus proche du nombre de grappes (30 villages) à étudier.

Pour un modèle d'enquête fondé sur un échantillon en grappe: Les enquête anthropométrique repose sur un échantillon en grappes (sélection représentative de villages), et non pas sur un échantillon aléatoire simple.

Trente est le nombre type de grappes fixé par le Programme élargi de vaccination de l'OMS (enquêtes

Pour corriger la différence, on multiplie la taille de l'échantillon par l'effet du plan d’échantillonnage (D).

le nombre peut être ajusté en cas de nécessité impérieuse.

On suppose généralement que cet effet est de 2 pour les enquêtes nutritionnelles faisant appel au sondage en grappes.

Taille d'échantillon finale: N = 690 enfants

en grappes du PEV). Il n'y a pas de raison statistique logique de s’en tenir exactement à 30 grappes et

On divise ensuite la taille d'échantillon finale (N) par le nombre de grappes (30) pour déterminer le nombre de sujets à observer par grappe. n x D = 323 x 2 = 646

n = 646

Impondérables On ajoute encore 5% à l'échantillon pour tenir compte d’impondérables comme les non-réponses ou les erreurs d'enregistrement. N ÷ no. grappes = 690 ÷ 30 = 23 enfants par village n + 5% = 646 x 1.05 = 678.3

n = 678

7


04/05/2012

Exemple de Détermination de la taille de l'échantillon (calculs statistiques) Le tableau ci-dessous présente les tailles d'échantillon recommandées pour divers niveaux estimatifs de malnutrition, avec prise en compte des valeurs types pour le niveau de confiance et la marge d'erreur. La taille d'échantillon finale, après inclusion du pourcentage relatif aux impondérables, est arrondie pour correspondre à une enquête portant sur 30 grappes.

S'il n'est pas possible de trouver la prévalence estimative de la malnutrition pour la zone du projet, il est recommandé de fixer à 810 la taille de l'échantillon.

8


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.