Magazine Entreprise

Echantillonnage de données : sélection aléatoire de données

Publié le 21 janvier 2010 par Auditsi

Intérêt d’une sélection aléatoire

Le commissaire aux comptes effectue la plupart de ses contrôles par sondage. La formation d’un échantillon de données à sonder est réalisée selon différentes méthodes au choix de l’auditeur. La sélection des données s’opère en fonction :

  • - d’un seuil de signification,
  • - d’une méthode statistique,
  • - d’une formule aléatoire,
  • - de critères plus ou moins subjectifs.

Ces différentes méthodes sont utilisables conjointement mais la plupart du temps, l’échantillon est formé à partir d’un seuil de signification (par exemple, toutes les données dont le montant est supérieur à 100 K€). L’utilisation dogmatique de ce critère de sélection éliminera systématiquement toutes les données inférieures au seuil (alors que précisément l’ensemble des membres d’une population donnée mérite l’attention du CAC) et ne répond pas au caractère imprévisible des contrôles du commissaire aux comptes institué par les NEP (normes d’exercice professionnel).

L’utilisation du hasard, en complément d’autres méthodes d’échantillonnage, est très intéressante à double titre :

  • - D’une part, cette méthode répond aux prescriptions des NEP sur l’imprévisibilité des contrôles du CAC; dans le cadre de la prévention de la fraude, ce genre de méthode introduit un climat d’insécurité pour le fraudeur ou l’éventuel fraudeur, en effet, toutes les transactions sont susceptibles d’entrer dans le périmètre de l’audit et non pas seulement les plus importantes.
  • - D’autre part, elle permet d’élargir l’éventail de données auditées… et finalement d’augmenter la probabilité de détecter erreurs et fraudes, ces dernières étant d’ailleurs le plus souvent découvertes par hasard.

Réalisation d’un échantillonnage aléatoire à l’aide d’une requête SQL

L’exemple qui suit servira d’illustration au propos précédent. Nous utiliserons un grand livre général (table ACCESS intitulée GL comprenant les champs de données compte, libellé (d’écriture), journal, débit, crédit et numéro de pièce). Il comprend dix-huit mille lignes d’écritures et nous souhaitons n’en retenir aléatoirement aux fins d’audit que dix lignes.

Texte de la requête SQL à rédiger :

SELECT TOP 10 GL.Compte, GL.Libellé, GL.Débit, GL.Crédit, GL.Journal, GL.Date, GL.Lettrage, GL.Pièce

FROM GL

ORDER BY Rnd(compte);

Explication :

L’échantillonnage tourne autour des deux fonctions suivantes :

  • - «ORDER BY Rnd(compte)» trie les lignes aléatoirement par le champ «compte»,
  • - «TOP 10» signifie que l’on ne sélectionne que les dix premières lignes du résultat de la requête.

Résultat obtenu :

ReqSélection aléatoire

Compte

Libellé

Débit

Crédit

Journal

Date

Lettrage

Pièce

701104 FACTURE 1035469  

2 261,52

VTS

40509

  1035469

411100 FACTURE 1037012

12 221,21

  VTS

221009

  1037012

411100 FACTURE 1036545

2 565,66

  VTS

90909

B 1036545

445720 FACTURE 1037045  

40,23

VTS

231009

F 1037045

467120 RETRO LITIGE XXX

644,88

  EUR

161009

D 9181

602610 F.MA147364 MAER

4 540,80

  ACH

51109

  9089449

701101 FACTURE 1037210  

1 435,84

VTS

61109

  1037210

701102 FACTURE 1036226  

603,60

VTS

40809

  1036226

616200 Extourne C.C.A. AU 31.07.2009

31 143,24

  OD

10809

  9082

701102 FACTURE 1035889  

1 069,50

VTS

240609

  1035889

Bien entendu, chaque exécution de la requête donne un résultat différent.


Retour à La Une de Logo Paperblog

A propos de l’auteur


Auditsi 2 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte l'auteur n'a pas encore renseigné son compte

Magazines