Πληροφορίες

Πώς προσδιορίζεται το μέγεθος του δείγματος στην έρευνα σε ζώα;

Πώς προσδιορίζεται το μέγεθος του δείγματος στην έρευνα σε ζώα;

Στην ανθρώπινη έρευνα, ορίζουμε το σύμπαν μας και υπολογίζουμε το μέγεθος του αποτελέσματος που περιμένουμε να παρατηρήσουμε, μετά μπορούμε να σχεδιάσουμε ένα δείγμα ενός δεδομένου μεγέθους.

Πώς προσδιορίζεται το μέγεθος του δείγματος για πειράματα στον τομέα της έρευνας σε ζώα;


Ο προσδιορισμός του μεγέθους του δείγματος για ένα πείραμα σε ζώα δεν διαφέρει από ό,τι στην έρευνα με ανθρώπους. Αυτό που πρέπει να γνωρίζετε είναι το μέγεθος του αποτελέσματος, το επίπεδο σημασίας και η ισχύς (η οποία είναι η πιθανότητα το τεστ να ανιχνεύσει ένα σημαντικό αποτέλεσμα υποθέτοντας ότι υπάρχει). Το δύσκολο κομμάτι είναι να αποκτήσετε το μέγεθος του εφέ (για μια ενδιαφέρουσα συζήτηση ρίξτε μια ματιά σε αυτό το νήμα). Τα άλλα δύο πράγματα επιλέγονται από εσάς ως πειραματιστή. Μια επισκόπηση της ανάλυσης ισχύος γράφτηκε από τον Cohen (1992).

βιβλιογραφικές αναφορές

Cohen, J. (1992). Ένα power primer. Psychυχολογικό Δελτίο, 112(1), 155. PDF


Επιθεώρηση Σχεδιασμού Έρευνας

Οι ποιοτικοί και ποσοτικοί σχεδιασμοί της έρευνας απαιτούν από τον ερευνητή να σκεφτεί προσεκτικά πώς και πόσους να δειγματολογήσει εντός του πληθυσμιακού τμήματος που ενδιαφέρει και σχετίζεται με τους ερευνητικούς στόχους. Με αυτόν τον τρόπο, ο ερευνητής λαμβάνει υπόψη τη δημογραφική και πολιτισμική ποικιλομορφία, καθώς και άλλα διακριτικά χαρακτηριστικά (π.χ. χρήση συγκεκριμένης υπηρεσίας ή προϊόντος) και πραγματιστικά ζητήματα (π.χ. πρόσβαση και πόρους). Στην ποιοτική έρευνα, ο αριθμός των γεγονότων (δηλαδή, ο αριθμός των σε βάθος συνεντεύξεων, συζητήσεων σε ομάδες εστίασης ή παρατηρήσεων) και των συμμετεχόντων συχνά λαμβάνεται υπόψη στο αρχικό στάδιο σχεδιασμού της έρευνας και στη συνέχεια ξανά στο στάδιο πεδίου (δηλ. όταν οι συνεντεύξεις, οι συζητήσεις ή οι παρατηρήσεις διεξάγονται). Αυτή η προσέγγιση δύο σταδίων, ωστόσο, μπορεί να είναι προβληματική. Ένας λόγος είναι ότι η παροχή ενός ακριβούς μεγέθους δείγματος πριν από τη συλλογή δεδομένων μπορεί να είναι δύσκολη, ιδιαίτερα όταν ο ερευνητής αναμένει ότι ο αριθμός θα αλλάξει ως αποτέλεσμα των επιτόπιων αποφάσεων.

Ένα άλλο πιθανό πρόβλημα προκύπτει όταν οι ερευνητές βασίζονται αποκλειστικά στην έννοια του κορεσμού για να εκτιμήσουν το μέγεθος του δείγματος όταν βρίσκονται στο πεδίο. Στη θεμελιωμένη θεωρία, ο θεωρητικός κορεσμός

«Αναφέρεται στο σημείο στο οποίο η συλλογή περισσότερων δεδομένων για μια θεωρητική κατηγορία δεν αποκαλύπτει νέες ιδιότητες ούτε παράγει περαιτέρω θεωρητικές γνώσεις σχετικά με την αναδυόμενη θεμελιωμένη θεωρία». (Charmaz, 2014, σελ. 345)

Με την ευρύτερη έννοια, ο Morse (1995) ορίζει τον κορεσμό ως ««επάρκεια δεδομένων» [ή] συλλογή δεδομένων έως ότου δεν ληφθούν νέες πληροφορίες» (σελ. 147).

Η εξάρτηση από την έννοια του κορεσμού παρουσιάζει δύο βασικές ανησυχίες: 1) Όπως συζητήθηκε σε δύο προηγούμενα άρθρα στο Επισκόπηση Σχεδιασμού Έρευνας – Πέρα από τον κορεσμό: Χρήση δεικτών ποιότητας δεδομένων για τον προσδιορισμό του αριθμού των ομάδων εστίασης για τη διεξαγωγή και τον σχεδιασμό μιας ποιοτικής μελέτης σε βάθος συνέντευξης: Πόσες συνεντεύξεις είναι αρκετές; – η έμφαση στον κορεσμό έχει τη δυνατότητα να κρύψει άλλες σημαντικές εκτιμήσεις στον ποιοτικό σχεδιασμό της έρευνας, όπως η ποιότητα των δεδομένων και 2) Ο κορεσμός ως εργαλείο αξιολόγησης δυνητικά οδηγεί τον ερευνητή να επικεντρωθεί στις προφανείς «νέες πληροφορίες» που λαμβάνονται από κάθε συνέντευξη, ομαδική συζήτηση, ή παρατήρηση αντί να αποκτήσουν μια βαθύτερη αίσθηση του περιεχομένου των συμμετεχόντων και βαθύτερη κατανόηση του ερευνητικού ερωτήματος. Όπως αναφέρει ο Morse (1995),

«Ο πλούτος των δεδομένων προκύπτει από τη λεπτομερή περιγραφή, όχι από τον αριθμό των φορών που δηλώνεται κάτι… Συχνά είναι το σπάνιο στολίδι που θέτει άλλα δεδομένα σε προοπτική, που γίνεται το κεντρικό κλειδί για την κατανόηση των δεδομένων και για την ανάπτυξη του μοντέλου. Είναι το σιωπηρή αυτό είναι ενδιαφέρον." (σελ. 148)

Με αυτό ως φόντο, έρχονται στο μυαλό μερικά πρόσφατα άρθρα σχετικά με τον κορεσμό. Στο «A Simple Method to Assess and Report the Thematic Saturation in Qualitative Research» (Guest, Namey, & Chen, 2020), οι συγγραφείς παρουσιάζουν μια νέα προσέγγιση για την αξιολόγηση του μεγέθους του δείγματος στη μέθοδο της εις βάθος συνέντευξης που μπορεί να εφαρμοστεί κατά τη διάρκεια ή μετά συλλογή δεδομένων. Αυτή η προσέγγιση γεννήθηκε από τον ποσοτικό σχεδιασμό της έρευνας και πράγματι οι συγγραφείς αναφέρονται σε έννοιες όπως «υπολογισμοί ισχύος», τιμές p και αναλογίες πιθανοτήτων. Όταν χρησιμοποιείται κατά τη συλλογή δεδομένων, ο ποιοτικός ερευνητής εφαρμόζει το εργαλείο αξιολόγησης υπολογίζοντας τον «αναλογία κορεσμού», δηλαδή τον αριθμό των νέων θεμάτων που προέρχονται από μια συγκεκριμένη «σειρά» συνεντεύξεων (π.χ. δύο) διαιρεμένο με τον «βασικό» αριθμό «μοναδικά θέματα», δηλαδή θέματα που προσδιορίστηκαν στο αρχικό στάδιο της συνέντευξης. Είναι σημαντικό ότι η λογική για αυτήν την προσέγγιση εντοπίζεται στην ιδέα ότι «οι περισσότερες νέες πληροφορίες σε ένα ποιοτικό σύνολο δεδομένων παράγονται νωρίς στη διαδικασία» (σελ. 6) και πράγματι «τα πιο διαδεδομένα θέματα υψηλού επιπέδου εντοπίζονται πολύ νωρίς στο συλλογή δεδομένων, μέσα σε έξι περίπου συνεντεύξεις» (σελ. 10).

Αυτή η προοπτική για την αξιολόγηση κορεσμού εξισορροπείται από δύο άλλα πρόσφατα άρθρα - «Να κορεστεί ή να μην κορεστεί; Η αμφισβήτηση του κορεσμού δεδομένων ως χρήσιμη έννοια για τη θεματική ανάλυση και τη λογική του μεγέθους του δείγματος» (Braun & Clarke, 2019) και «The Changing Face of Qualitative Inquiry» (Morse, 2020). Σε αυτά τα άρθρα, οι συγγραφείς εκφράζουν παρόμοιες απόψεις για τουλάχιστον δύο εκτιμήσεις που σχετίζονται με το μέγεθος του δείγματος και τη χρήση του κορεσμού στην ποιοτική έρευνα. Το πρώτο έχει να κάνει με τη σημασία του νοήματος 1 και την ιδέα ότι η εύρεση νοήματος απαιτεί από τον ερευνητή να αναζητά ενεργά κατανοήσεις με βάση τα συμφραζόμενα και να έχει καλές αναλυτικές δεξιότητες. Για τους Braun και Clarke, «το νόημα δεν είναι εγγενές ή αυτονόητο στα δεδομένα» αλλά μάλλον «το νόημα απαιτεί ερμηνεία» (σελ. 10). Με αυτόν τον τρόπο, τα θέματα δεν εμφανίζονται απλώς κατά τη συλλογή δεδομένων, αλλά είναι το αποτέλεσμα της ενεργούς διεξαγωγής μιας ανάλυσης για την κατασκευή μιας ερμηνείας.

Ο Μορς μιλά για τη σημασία του νοήματος από την προοπτική ότι ο κορεσμός εμποδίζει τις ουσιαστικές γνώσεις περιορίζοντας την εξερεύνηση των «νέων δεδομένων» από τον ερευνητή. Αντί να χρησιμοποιεί τον «πλεονασμό ως ένδειξη για τη διεύρυνση του δείγματος ή να αναρωτιέται γιατί συμβαίνει αυτή η αναπαραγωγή», ο ερευνητής σταματά να συλλέγει δεδομένα που οδηγούν σε μια «πιο ρηχή» ανάλυση και «τετριμμένα» αποτελέσματα (σελ. 5).

Η δεύτερη σκέψη που σχετίζεται με τον κορεσμό που συζητείται και στα άρθρα Braun και Clarke και Morse είναι η ιδέα ότι ο προσδιορισμός του μεγέθους του δείγματος απαιτεί μια διαφοροποιημένη προσέγγιση, με ιδιαίτερη προσοχή σε πολλούς παράγοντες που σχετίζονται με κάθε έργο. Για ερευνητές που χρησιμοποιούν αντανακλαστική θεματική ανάλυση, οι Braun και Clarke αναφέρουν 10 «διασταυρούμενες πτυχές», συμπεριλαμβανομένων «του εύρους και της εστίασης του ερευνητικού ερωτήματος», της πληθυσμιακής ποικιλίας, του «πεδίου και του σκοπού του έργου» και των «πραγματιστικών περιορισμών» (σελ. 11 ). Με παρόμοιο τρόπο, η Morse περιλαμβάνει στη λίστα με τα οκτώ «κριτήρια» της, όπως στοιχεία όπως «η πολυπλοκότητα των ερωτήσεων/φαινομένων που μελετώνται», «το εύρος της έρευνας» και «παραλλαγή των συμμετεχόντων» (σελ. 5).

Ο πιθανός κίνδυνος να βασιστεί κανείς στον κορεσμό για τον καθορισμό του μεγέθους του δείγματος στην ποιοτική έρευνα είναι πολλαπλός. Τα άρθρα που συζητούνται εδώ και η παραπάνω εικόνα υπογραμμίζουν την υποκείμενη ανησυχία ότι η εξάρτηση από τον κορεσμό: 1) αγνοεί τον σκοπό και τα μοναδικά χαρακτηριστικά της ποιοτικής έρευνας καθώς και κάθε μελέτης, μαζί με μια ποικιλία θεμάτων ποιότητας κατά τη συλλογή δεδομένων, τα οποία 2 ) παραπλανά τον ερευνητή να δώσει προτεραιότητα στο προφανές περιεχόμενο έναντι της επιδίωξης της κατανόησης των συμφραζομένων που προέρχεται από λανθάνοντα, λιγότερο προφανή δεδομένα, που 3) οδηγεί σε επιφανειακές ερμηνείες και 4) τελικά οδηγεί σε λιγότερο χρήσιμη έρευνα.

1 Η Sally Thorne (2020) συμμερίζεται αυτήν την προοπτική για τη σημασία του νοήματος στη συζήτησή της για την αναγνώριση προτύπων στην ποιοτική ανάλυση - «... η ποιοτική έρευνα έχει ως στόχο να προσθέσει αξία σε ένα πεδίο αντί να αναφέρει απλώς τι μπορούμε να εντοπίσουμε γι 'αυτό που έχει τις ιδιότητες ενός μοτίβου… θα πρέπει σαφώς να προσθέσει στο σώμα μας κατανόησης με κάποιο ουσιαστικό τρόπο». (σελ. 2)

Braun, V., & amp Clarke, V. (2019). Να κορεστώ ή να μην κορεστώ; Η αμφισβήτηση του κορεσμού δεδομένων ως χρήσιμη έννοια για τη θεματική ανάλυση και τη λογική του μεγέθους του δείγματος. Ποιοτική Έρευνα στον Αθλητισμό, την Άσκηση και την Υγεία. https://doi.org/10.1080/2159676X.2019.1704846

Charmaz, K. (2014). Κατασκευή Θεμελιωμένης Θεωρίας (2η έκδ.). Εκδόσεις Sage.


ΠΡΩΤΟΤΥΠΟ άρθρο ΕΡΕΥΝΑΣ

Τα μεγέθη των εφέ είναι το νόμισμα της ψυχολογικής έρευνας. Ποσοτικοποιούν τα αποτελέσματα μιας μελέτης για να απαντήσουν στο ερευνητικό ερώτημα και χρησιμοποιούνται για τον υπολογισμό της στατιστικής ισχύος. Η ερμηνεία των μεγεθών των αποτελεσμάτων & πότε είναι ένα αποτέλεσμα μικρό, μεσαίο ή μεγάλο; συμβατικά σημεία αναφοράς. Η παρούσα ανάλυση δείχνει ότι καμία από αυτές τις συστάσεις δεν ισχύει επί του παρόντος. Από προηγούμενες δημοσιεύσεις χωρίς προεγγραφή, κληρώθηκαν τυχαία 900 εφέ και συγκρίθηκαν με 93 εφέ από δημοσιεύσεις με προεγγραφή, αποκαλύπτοντας μια μεγάλη διαφορά: Εφέ από το πρώτο (διάμεσος ρ = 0,36) ήταν πολύ μεγαλύτερα από τα αποτελέσματα από το τελευταίο (διάμεσος ρ = 0,16). Δηλαδή, ορισμένες προκαταλήψεις, όπως προκατάληψη δημοσίευσης ή αμφισβητήσιμες ερευνητικές πρακτικές, έχουν προκαλέσει δραματικό πληθωρισμό στα δημοσιευμένα αποτελέσματα, καθιστώντας δύσκολη τη σύγκριση μιας πραγματικής επίδρασης με τις πραγματικές επιπτώσεις του πληθυσμού (καθώς αυτές είναι άγνωστες). Επιπλέον, υπήρχαν πολύ μεγάλες διαφορές στις μέσες επιδράσεις μεταξύ ψυχολογικών επιμέρους κλάδων και μεταξύ διαφορετικών σχεδίων μελέτης, καθιστώντας αδύνατη την εφαρμογή οποιωνδήποτε παγκόσμιων σημείων αναφοράς. Χρειάζονται πολλές περισσότερες προκαταχωρημένες μελέτες στο μέλλον για να εξαχθεί μια αξιόπιστη εικόνα των πραγματικών επιπτώσεων του πληθυσμού.


Ρόλος μεγέθους δείγματος και δύναμης σχέσης

Θυμηθείτε ότι ο έλεγχος μηδενικής υπόθεσης περιλαμβάνει την απάντηση στην ερώτηση, "Εάν η μηδενική υπόθεση ήταν αληθινή, ποια είναι η πιθανότητα ενός αποτελέσματος δείγματος τόσο ακραίο όσο αυτό;" Με άλλα λόγια, «Τι είναι το Π αξία?" Μπορεί να είναι χρήσιμο να δούμε ότι η απάντηση σε αυτή την ερώτηση εξαρτάται από δύο μόνο παράγοντες: τη δύναμη της σχέσης και το μέγεθος του δείγματος. Συγκεκριμένα, όσο ισχυρότερη είναι η σχέση του δείγματος και όσο μεγαλύτερο είναι το δείγμα, τόσο λιγότερο πιθανό θα ήταν το αποτέλεσμα εάν η μηδενική υπόθεση ήταν αληθινή. Δηλαδή όσο πιο χαμηλά είναι Π αξία. Αυτό πρέπει να έχει νόημα. Φανταστείτε μια μελέτη στην οποία ένα δείγμα 500 γυναικών συγκρίνεται με ένα δείγμα 500 ανδρών από την άποψη κάποιου ψυχολογικού χαρακτηριστικού και του Cohen ρε είναι ένα ισχυρό 0,50. Αν πραγματικά δεν υπήρχε διαφορά φύλου στον πληθυσμό, τότε ένα τόσο ισχυρό αποτέλεσμα με βάση ένα τόσο μεγάλο δείγμα θα φαινόταν εξαιρετικά απίθανο. Τώρα φανταστείτε μια παρόμοια μελέτη στην οποία ένα δείγμα τριών γυναικών συγκρίνεται με ένα δείγμα τριών ανδρών και του Cohen ρε είναι ένα αδύναμο 0,10. Εάν δεν υπήρχε διαφορά φύλου στον πληθυσμό, τότε μια τόσο αδύναμη σχέση με βάση ένα τόσο μικρό δείγμα θα έπρεπε να φαίνεται πιθανή. Και αυτός ακριβώς είναι ο λόγος που η μηδενική υπόθεση θα απορριφθεί στο πρώτο παράδειγμα και θα διατηρηθεί στο δεύτερο.

Φυσικά, μερικές φορές το αποτέλεσμα μπορεί να είναι αδύναμο και το δείγμα μεγάλο, ή το αποτέλεσμα μπορεί να είναι ισχυρό και το δείγμα μικρό. Σε αυτές τις περιπτώσεις, οι δύο εκτιμήσεις ανταλλάσσονται μεταξύ τους, έτσι ώστε ένα αδύναμο αποτέλεσμα μπορεί να είναι στατιστικά σημαντικό εάν το δείγμα είναι αρκετά μεγάλο και μια ισχυρή σχέση μπορεί να είναι στατιστικά σημαντική ακόμη και αν το δείγμα είναι μικρό. Ο Πίνακας 13.1 “Πώς συνδυάζονται η ισχύς της σχέσης και το μέγεθος του δείγματος για να καθοριστεί εάν ένα αποτέλεσμα είναι στατιστικά σημαντικό” δείχνει χονδρικά πώς συνδυάζονται η ισχύς της σχέσης και το μέγεθος του δείγματος για να καθοριστεί εάν ένα αποτέλεσμα δείγματος είναι στατιστικά σημαντικό. Οι στήλες του πίνακα αντιπροσωπεύουν τα τρία επίπεδα ισχύος της σχέσης: αδύναμο, μεσαίο και ισχυρό. Οι σειρές αντιπροσωπεύουν τέσσερα μεγέθη δείγματος που μπορούν να θεωρηθούν μικρά, μεσαία, μεγάλα και εξαιρετικά μεγάλα στο πλαίσιο της ψυχολογικής έρευνας. Έτσι, κάθε κελί στον πίνακα αντιπροσωπεύει έναν συνδυασμό ισχύος σχέσης και μεγέθους δείγματος. Αν ένα κελί περιέχει τη λέξη Ναί, τότε αυτός ο συνδυασμός θα ήταν στατιστικά σημαντικός και για τους δύο Cohen ρε και του Pearson ρ. Αν περιέχει τη λέξη Οχι, τότε δεν θα ήταν στατιστικά σημαντικό για κανένα από τα δύο. Υπάρχει ένα κελί όπου η απόφαση για ρε και ρ θα ήταν διαφορετικό και ένα άλλο όπου μπορεί να είναι διαφορετικό ανάλογα με ορισμένες πρόσθετες εκτιμήσεις, οι οποίες συζητούνται στην Ενότητα 13.2 “Μερικοί βασικοί έλεγχοι μηδενικών υποθέσεων”

Πίνακας 13.1 Πώς συνδυάζεται η σχέση σχέσης και το μέγεθος δείγματος για να προσδιοριστεί εάν ένα αποτέλεσμα είναι στατιστικά σημαντικό

Παρόλο που ο Πίνακας 13.1 “Πώς η ισχύς της σχέσης και το μέγεθος δείγματος συνδυάζονται για να καθοριστεί εάν ένα αποτέλεσμα είναι στατιστικά σημαντικό” παρέχει μόνο μια πρόχειρη κατευθυντήρια γραμμή, δείχνει πολύ ξεκάθαρα ότι οι αδύναμες σχέσεις που βασίζονται σε μεσαία ή μικρά δείγματα δεν είναι ποτέ στατιστικά σημαντικές και ότι οι ισχυρές σχέσεις βασίζονται σε μεσαία ή μεγαλύτερα δείγματα είναι πάντα στατιστικά σημαντικά. Εάν το έχετε υπόψη σας, θα γνωρίζετε συχνά εάν ένα αποτέλεσμα είναι στατιστικά σημαντικό με βάση μόνο τα περιγραφικά στατιστικά στοιχεία. Είναι εξαιρετικά χρήσιμο να μπορούμε να αναπτύξουμε αυτό το είδος διαισθητικής κρίσης. Ένας λόγος είναι ότι σας επιτρέπει να αναπτύξετε προσδοκίες σχετικά με τον τρόπο με τον οποίο θα προκύψουν οι επίσημες δοκιμές μηδενικών υποθέσεων, οι οποίες με τη σειρά τους σας επιτρέπουν να εντοπίσετε προβλήματα στις αναλύσεις σας. Για παράδειγμα, εάν η σχέση του δείγματός σας είναι ισχυρή και το δείγμα σας είναι μεσαίο, τότε θα περιμένατε να απορρίψετε τη μηδενική υπόθεση. Εάν για κάποιο λόγο ο επίσημος μηδενικός έλεγχος υποθέσεων υποδεικνύει διαφορετικά, τότε πρέπει να ελέγξετε ξανά τους υπολογισμούς και τις ερμηνείες σας. Ένας δεύτερος λόγος είναι ότι η ικανότητα να κάνετε αυτό το είδος διαισθητικής κρίσης είναι μια ένδειξη ότι καταλαβαίνετε τη βασική λογική αυτής της προσέγγισης εκτός από το ότι μπορείτε να κάνετε τους υπολογισμούς.


ΠΡΕΠΕΙ ΝΑ ΥΠΟΛΟΓΙΣΤΟΥΝ ΔΕΙΓΜΑ ΜΕΓΕΘΟΥΣ ΠΡΟΤΕΡΑ ή ΜΕΤΑ ΤΗ ΜΕΛΕΤΗ;

Η απάντηση είναι σίγουρα πριν, περιστασιακά κατά τη διάρκεια και μερικές φορές μετά.

Κατά το σχεδιασμό μιας μελέτης θέλουμε να βεβαιωθούμε ότι η δουλειά που κάνουμε αξίζει τον κόπο ώστε να λάβουμε τη σωστή απάντηση και να την πάρουμε με τον πιο αποτελεσματικό τρόπο. Αυτό γίνεται για να μπορέσουμε να στρατολογήσουμε αρκετούς ασθενείς για να δώσουμε στα αποτελέσματά μας επαρκή ισχύ, αλλά όχι πάρα πολλούς ώστε να χάνουμε χρόνο λαμβάνοντας περισσότερα δεδομένα από όσα χρειαζόμαστε. Δυστυχώς, κατά το σχεδιασμό της μελέτης μπορεί να χρειαστεί να κάνουμε υποθέσεις σχετικά με το επιθυμητό μέγεθος επίδρασης και τη διακύμανση εντός των δεδομένων.

Οι ενδιάμεσοι υπολογισμοί ισχύος χρησιμοποιούνται περιστασιακά όταν τα δεδομένα που χρησιμοποιούνται στον αρχικό υπολογισμό είναι γνωστό ότι είναι ύποπτα. Πρέπει να χρησιμοποιούνται με προσοχή, καθώς η επαναλαμβανόμενη ανάλυση μπορεί να οδηγήσει σε διακοπή μιας μελέτης από έναν ερευνητή μόλις επιτευχθεί στατιστική σημασία (η οποία μπορεί να συμβεί τυχαία πολλές φορές κατά τη διάρκεια της πρόσληψης του υποκειμένου). Μόλις η μελέτη είναι σε εξέλιξη, η ανάλυση των ενδιάμεσων αποτελεσμάτων μπορεί να χρησιμοποιηθεί για να πραγματοποιηθούν περαιτέρω υπολογισμοί ισχύος και προσαρμογές στο μέγεθος του δείγματος ανάλογα. Αυτό μπορεί να γίνει για να αποφευχθεί ο πρόωρος τερματισμός μιας μελέτης ή σε περίπτωση σωτηρίας ή επικίνδυνων θεραπειών, για να αποφευχθεί η παράταση μιας μελέτης. Οι ενδιάμεσοι υπολογισμοί μεγέθους δείγματος θα πρέπει να χρησιμοποιούνται μόνο όταν δηλώνονται στην εκ των προτέρων ερευνητική μέθοδο.

Όταν αξιολογούμε αποτελέσματα από δοκιμές με αρνητικά αποτελέσματα, είναι ιδιαίτερα σημαντικό να αμφισβητήσουμε το μέγεθος του δείγματος της μελέτης. Μπορεί κάλλιστα η μελέτη να ήταν ανεπαρκής και να δεχθήκαμε εσφαλμένα τη μηδενική υπόθεση, ένα σφάλμα τύπου II. Εάν η μελέτη είχε περισσότερα άτομα, τότε μπορεί κάλλιστα να είχε εντοπιστεί μια διαφορά. Σε έναν ιδανικό κόσμο αυτό δεν θα πρέπει ποτέ να συμβεί επειδή ένας υπολογισμός μεγέθους δείγματος θα πρέπει να εμφανίζεται στην ενότητα μεθόδων όλων των εγγράφων, η πραγματικότητα μας δείχνει ότι αυτό δεν συμβαίνει. Ως καταναλωτής της έρευνας θα πρέπει να είμαστε σε θέση να εκτιμήσουμε τη δύναμη μιας μελέτης από τα δεδομένα αποτελέσματα.

Ο αναδρομικός υπολογισμός μεγέθους δείγματος δεν καλύπτεται σε αυτό το άρθρο. Στο διαδίκτυο διατίθενται αρκετοί αριθμομηχανές για αναδρομικό μέγεθος δείγματος (υπολογιστές ισχύος UCLA (http://calculators.stat.ucla.edu/powercalc/), Διαδραστικές στατιστικές σελίδες (http://www.statistics.com/content/javastat. html).


Περίληψη

Ο προσδιορισμός του κατάλληλου σχεδιασμού μιας μελέτης είναι πιο σημαντικός από τη στατιστική ανάλυση, μια κακοσχεδιασμένη μελέτη δεν μπορεί ποτέ να διασωθεί, ενώ μια κακώς αναλυμένη μελέτη μπορεί να αναλυθεί εκ νέου. Ένα κρίσιμο συστατικό στο σχεδιασμό της μελέτης είναι ο προσδιορισμός του κατάλληλου μεγέθους δείγματος. Το μέγεθος του δείγματος πρέπει να είναι αρκετά μεγάλο ώστε να απαντά επαρκώς το ερευνητικό ερώτημα, αλλά όχι πολύ μεγάλο ώστε να περιλαμβάνει πάρα πολλούς ασθενείς ενώ λιγότεροι θα ήταν αρκετοί. Ο προσδιορισμός του κατάλληλου μεγέθους δείγματος περιλαμβάνει στατιστικά κριτήρια καθώς και κλινικές ή πρακτικές εκτιμήσεις. Ο προσδιορισμός του μεγέθους του δείγματος περιλαμβάνει ομαδική εργασία Οι βιοστατιστικοί πρέπει να συνεργαστούν στενά με κλινικούς ερευνητές για να καθορίσουν το μέγεθος του δείγματος που θα αντιμετωπίσει το ερευνητικό ερώτημα που ενδιαφέρει με επαρκή ακρίβεια ή δύναμη για να παράγει αποτελέσματα που έχουν κλινική σημασία.

Ο παρακάτω πίνακας συνοψίζει τους τύπους μεγέθους δείγματος για κάθε σενάριο που περιγράφεται εδώ. Οι τύποι οργανώνονται από την προτεινόμενη ανάλυση, μια εκτίμηση διαστήματος εμπιστοσύνης ή μια δοκιμή υπόθεσης.


5 βήματα για τον υπολογισμό του μεγέθους του δείγματος

Σχεδόν όλοι οι φορείς χορήγησης απαιτούν μια εκτίμηση επαρκούς μεγέθους δείγματος για τον εντοπισμό των επιπτώσεων που υποτίθεται στη μελέτη. Αλλά όλες οι μελέτες εξυπηρετούνται καλά από εκτιμήσεις του μεγέθους του δείγματος, καθώς μπορεί να εξοικονομήσει πολύ σε πόρους.

Γιατί; Οι μικρού μεγέθους μελέτες δεν μπορούν να βρουν πραγματικά αποτελέσματα, και οι υπερμεγέθεις μελέτες βρίσκουν ακόμη και ασήμαντα. Τόσο οι μικρού μεγέθους όσο και οι υπερμεγέθεις μελέτες σπαταλούν χρόνο, ενέργεια και χρήματα οι πρώτες χρησιμοποιώντας πόρους χωρίς να βρίσκουν αποτελέσματα, και οι δεύτεροι χρησιμοποιώντας περισσότερους πόρους από τους απαραίτητους. Και οι δύο εκθέτουν έναν περιττό αριθμό συμμετεχόντων σε πειραματικούς κινδύνους.

Το κόλπο είναι να το μέγεθος μιας μελέτης έτσι ώστε να είναι μόλις αρκετά μεγάλο για να ανιχνεύσει μια επίδραση επιστημονικής σημασίας. Εάν το αποτέλεσμα σας αποδειχθεί μεγαλύτερο, τόσο το καλύτερο. Αλλά πρώτα πρέπει να συγκεντρώσετε κάποιες πληροφορίες για τις οποίες θα βασίσετε τις εκτιμήσεις.

Μόλις συγκεντρώσετε αυτές τις πληροφορίες, μπορείτε να υπολογίσετε με το χέρι χρησιμοποιώντας έναν τύπο που βρίσκεται σε πολλά σχολικά βιβλία, να χρησιμοποιήσετε ένα από τα πολλά εξειδικευμένα πακέτα λογισμικού ή να τα παραδώσετε σε έναν στατιστικολόγο, ανάλογα με την πολυπλοκότητα της ανάλυσης. Αλλά ανεξάρτητα από τον τρόπο με τον οποίο εσείς ή ο στατιστικολόγος σας το υπολογίζετε, πρέπει πρώτα να κάνετε τα ακόλουθα 5 βήματα:

Βήμα 1. Καθορίστε έναν έλεγχο υπόθεσης.

Οι περισσότερες μελέτες έχουν πολλές υποθέσεις, αλλά για υπολογισμούς μεγέθους δείγματος, επιλέξτε μία έως τρεις κύριες υποθέσεις. Κάντε τις σαφείς με όρους μηδενικής και εναλλακτικής υπόθεσης.

Βήμα 2. Καθορίστε το επίπεδο σημαντικότητας της δοκιμής.

Είναι συνήθως άλφα = 0,05, αλλά δεν χρειάζεται να είναι.

Βήμα 3. Καθορίστε το μικρότερο μέγεθος εφέ που παρουσιάζει επιστημονικό ενδιαφέρον.

Αυτό είναι συχνά το πιο δύσκολο βήμα. Το θέμα εδώ είναι δεν για να καθορίσετε το μέγεθος εφέ που θέλετε αναμένω να βρουν ή που άλλοι βρήκαν, αλλά το μικρότερο μέγεθος επίδρασης επιστημονικού ενδιαφέροντος.

Τι σημαίνει αυτό? Οποιοδήποτε μέγεθος επίδρασης μπορεί να είναι στατιστικά σημαντικό με ένα αρκετά μεγάλο δείγμα. Η δουλειά σας είναι να καταλάβετε σε ποιο σημείο θα πουν οι συνάδελφοί σας, “Λοιπόν, αν είναι σημαντικό; Δεν επηρεάζει τίποτα!”

Για ορισμένες μεταβλητές αποτελέσματος, η σωστή τιμή είναι προφανής για άλλες, καθόλου.

  • Εάν η θεραπεία σας μείωνε το άγχος κατά 3%, θα βελτίωνε πραγματικά τη ζωή ενός ασθενούς; Πόσο μεγάλη θα πρέπει να είναι η πτώση;
  • Εάν οι χρόνοι απόκρισης στο ερέθισμα στην πειραματική συνθήκη ήταν 40 ms ταχύτεροι από ό,τι στη συνθήκη ελέγχου, σημαίνει κάτι αυτό; Έχει νόημα μια διαφορά 40 ms; είναι 20; 100;
  • Εάν βρέθηκαν 4 λιγότερα σκαθάρια ανά φυτό με τη θεραπεία από ό, τι με τον έλεγχο, αυτό θα επηρεάσει πραγματικά το φυτό; Μπορούν 4 ακόμη σκαθάρια να καταστρέψουν, ή ακόμα και να κασκοποιήσουν ένα φυτό, ή χρειάζονται 10; 20;

Βήμα 4. Υπολογίστε τις τιμές άλλων παραμέτρων που είναι απαραίτητες για τον υπολογισμό της συνάρτησης ισχύος.

Οι περισσότερες στατιστικές δοκιμές έχουν τη μορφή εφέ/τυπικού σφάλματος. Επιλέξαμε μια τιμή για το εφέ στο βήμα 3. Το τυπικό σφάλμα είναι γενικά η τυπική απόκλιση/n. Για να λύσουμε το n, που είναι το σημείο όλων αυτών, χρειαζόμαστε μια τιμή για την τυπική απόκλιση. Υπάρχουν μόνο δύο τρόποι για να το αποκτήσετε.

1. Ο καλύτερος τρόπος είναι να χρησιμοποιήσετε δεδομένα από μια πιλοτική μελέτη για τον υπολογισμό της τυπικής απόκλισης.

2. Ο άλλος τρόπος είναι η χρήση ιστορικών δεδομένων και άλλης μελέτης που χρησιμοποίησε την ίδια εξαρτώμενη μεταβλητή. Εάν έχετε περισσότερες από μία μελέτες, ακόμα καλύτερα. Μέσος όρος των τυπικών αποκλίσεών τους για πιο αξιόπιστη εκτίμηση.

Μερικές φορές και οι δύο πηγές πληροφοριών μπορεί να είναι δύσκολο να βρεθούν, αλλά αν θέλετε μεγέθη δειγμάτων που να είναι έστω και εξ αποστάσεως ακριβή, χρειάζεστε τη μία ή την άλλη.

Βήμα 5. Καθορίστε την προβλεπόμενη ισχύ της δοκιμής.

Η δύναμη ενός τεστ είναι η πιθανότητα εύρεσης σημασίας εάν η εναλλακτική υπόθεση είναι αληθινή.

Η ισχύς 0,8 είναι η ελάχιστη. Εάν θα είναι δύσκολο να επαναλάβετε τη μελέτη ή να προσθέσετε μερικούς ακόμη συμμετέχοντες, η ισχύς 0,9 είναι καλύτερη. Εάν κάνετε αίτηση για επιχορήγηση, η ισχύς 0,9 είναι πάντα καλύτερη.


Αυτή η ενότητα χρησιμοποιεί την έννοια των μεταβλητών για να σας βοηθήσει να υπολογίσετε τον αριθμό των ζώων που απαιτούνται για ένα πείραμα.

Κατά τη δημιουργία του πειραματικού σας παραδείγματος, περιγράψτε πώς θα διεξαχθεί το πείραμα και τους διάφορους κλάδους ή παραλλαγές που θα παρουσιαστούν στον πληθυσμό των ζώων σας. Αυτές οι παραλλαγές θα προστεθούν σε αυτήν την ενότητα ως μεταβλητές.

Να θυμάστε ότι οι μεταβλητές είναι πάντα πολλαπλασιαστές. Οι εκτιμήσεις για την προσέγγιση αριθμών θα πρέπει να περιλαμβάνουν, αλλά δεν περιορίζονται σε, επαναλήψεις, διαθεσιμότητα ζώων, στελέχη, εξαρτημένες μεταβλητές, αριθμούς/ομάδα, στατιστική σημασία, πειραματικά χρονικά σημεία/τελικά σημεία.

Παράδειγμα: Επαναλήψεις: προκειμένου να προσδιοριστεί και να εκτιμηθεί η μεταβλητότητα, κάθε πείραμα θα επαναληφθεί 3 φορές Φάρμακα: για να αξιολογηθούν οι επιδράσεις των ανοσοσφαιρινών, θα δοκιμαστούν 4 διαφορετικά αντισώματα (βλ. παρακάτω) Τελικά σημεία μελέτης: για να αξιολογηθούν οι επιδράσεις των άλλες μεταβλητές με την πάροδο του χρόνου, τα ποντίκια θα υποβληθούν σε ευθανασία την ημέρα 1, 7, 30 και 90 Ζώα/Ομάδα: βάσει ανάλυσης ισχύος, κάθε ομάδα θα έχει πέντε ποντίκια Αριθμός στελεχών/γονοτύπων: προκειμένου να αξιολογηθούν οι επιπτώσεις του γονότυπου, 4 θα χρησιμοποιηθούν διαφορετικά στελέχη ποντικιών (βλ. παρακάτω).

Σε αυτό το παράδειγμα, το πείραμα έχει 5 βασικές μεταβλητές που επηρεάζουν το πειραματικό παράδειγμα.


Μέγεθος δείγματος για το χρόνο σε ένα συμβάν

Απλές Προσεγγίσεις

Η στατιστική ανάλυση του χρόνου μέχρι ένα συμβάν περιλαμβάνει πολύπλοκα στατιστικά μοντέλα, ωστόσο, υπάρχουν δύο απλές προσεγγίσεις για την εκτίμηση του μεγέθους του δείγματος για αυτόν τον τύπο μεταβλητής. Η πρώτη προσέγγιση είναι να εκτιμηθεί το μέγεθος του δείγματος χρησιμοποιώντας τις αναλογίες στις δύο πειραματικές ομάδες που παρουσιάζουν το συμβάν σε συγκεκριμένο χρόνο. Αυτή η μέθοδος μετατρέπει το χρόνο σε ένα συμβάν σε μια διχοτόμη μεταβλητή και το μέγεθος του δείγματος εκτιμάται από το Παράρτημα Εξίσωση 1. Αυτή η προσέγγιση γενικά δίνει μεγέθη που είναι κάπως μεγαλύτερα από ακριβέστερους υπολογισμούς που βασίζονται σε υποθέσεις σχετικά με την εξίσωση που περιγράφει την καμπύλη του αποτελέσματος έναντι του χρόνου.

Η δεύτερη προσέγγιση είναι να αντιμετωπίζουμε το χρόνο μέχρι την εμφάνιση ως μια συνεχή μεταβλητή. Αυτή η προσέγγιση ισχύει μόνο εάν όλα τα ζώα ακολουθούνται για την εμφάνιση συμβάντος (π.χ. μέχρι το θάνατο ή τον χρόνο εμφάνισης μιας ασθένειας όπως ο καρκίνος), αλλά δεν μπορεί να χρησιμοποιηθεί εάν ορισμένα ζώα δεν φτάσουν στο συμβάν κατά τη διάρκεια της μελέτης. Ο χρόνος μέχρι το συμβάν είναι μια συνεχής μεταβλητή και το μέγεθος του δείγματος μπορεί να υπολογιστεί χρησιμοποιώντας την Εξίσωση του Παραρτήματος 2.

Άνισος αριθμός ζώων σε διαφορετικές ομάδες

Οι μελέτες σε διαγονιδιακά ποντίκια συχνά περιλαμβάνουν τη διασταύρωση ετερόζυγων ποντικών για την παραγωγή ομόζυγων και ετερόζυγων συντρόφων, τα οποία στη συνέχεια συγκρίνονται. Τυπικά, θα υπάρχουν διπλάσιοι ετεροζυγώτες σε μια γέννα από τους ομοζυγώτες, αν και οι αναλογίες μπορεί να είναι διαφορετικές σε πιο περίπλοκες διασταυρώσεις. Σε τέτοια πειράματα, ο ερευνητής επιθυμεί να εκτιμήσει τον αριθμό των ζώων με την αναμενόμενη αναλογία μεταξύ των πειραματικών ομάδων. Οι εξισώσεις που παρέχονται στο Παράρτημα γίνονται πολύ πιο σύνθετες. Ο αναγνώστης κατευθύνεται στον ιστότοπό μας για άνισους υπολογισμούς μεγεθών δείγματος (η αναμενόμενη αναλογία μεγεθών ομάδων εισάγεται στη θέση του 1,0 που παρέχεται στο τεστ chi-squared στην ιστοσελίδα αναλογιών): < http://www.biomath.info > .


Αυτή η πολιτική καλύπτει όλα τα ζώα σε χώρους BU που χρησιμοποιούνται για έρευνα, διδασκαλία, εκπαίδευση, αναπαραγωγή και συναφείς δραστηριότητες, εφεξής συλλογικά «δραστηριότητες» και ισχύει για όλα τα άτομα που είναι υπεύθυνα για τη διεξαγωγή δραστηριοτήτων που αφορούν ζωντανά σπονδυλωτά ζώα υπό ή υπό την αιγίδα του Πανεπιστημίου της Βοστώνης.

Υπολογισμοί μεγέθους δείγματος

Η εκτίμηση του αριθμού των υποκειμένων που απαιτούνται για την απάντηση σε μια πειραματική ερώτηση είναι ένα σημαντικό βήμα στο σχεδιασμό μιας μελέτης. Από τη μια πλευρά, ένα υπερβολικό μέγεθος δείγματος μπορεί να οδηγήσει σε σπατάλη της ζωής των ζώων και άλλων πόρων, συμπεριλαμβανομένου χρόνου και χρημάτων, επειδή εξίσου έγκυρες πληροφορίες θα μπορούσαν να είχαν συλλεχθεί από μικρότερο αριθμό ατόμων. Ωστόσο, οι υποτιμήσεις του μεγέθους του δείγματος είναι επίσης σπάταλες, καθώς ένα ανεπαρκές μέγεθος δείγματος έχει χαμηλή πιθανότητα να ανιχνεύσει μια στατιστικά σημαντική διαφορά μεταξύ των ομάδων, ακόμη και αν υπάρχει πραγματικά διαφορά. Κατά συνέπεια, ένας ερευνητής μπορεί λανθασμένα να συμπεράνει ότι οι ομάδες δεν διαφέρουν, ενώ στην πραγματικότητα διαφέρουν.

Τι εμπλέκεται στους υπολογισμούς μεγέθους δείγματος

Ενώ η ανάγκη να φτάσουμε σε κατάλληλες εκτιμήσεις του μεγέθους του δείγματος είναι σαφής, πολλοί επιστήμονες δεν είναι εξοικειωμένοι με τους παράγοντες που επηρεάζουν τον προσδιορισμό του μεγέθους του δείγματος και με τις τεχνικές για τον υπολογισμό του εκτιμώμενου μεγέθους δείγματος. Μια γρήγορη ματιά στον τρόπο με τον οποίο τα περισσότερα εγχειρίδια στατιστικής αντιμετωπίζουν αυτό το θέμα δείχνει γιατί πολλοί ερευνητές αντιμετωπίζουν τους υπολογισμούς μεγέθους δείγματος με φόβο και σύγχυση.

Ενώ οι υπολογισμοί μεγέθους δείγματος μπορεί να γίνουν εξαιρετικά περίπλοκοι, είναι σημαντικό να τονίσουμε, πρώτον, ότι όλες αυτές οι τεχνικές παράγουν εκτιμήσεις και, δεύτερον, ότι υπάρχουν μόνο μερικοί κύριοι παράγοντες που επηρεάζουν αυτές τις εκτιμήσεις. Ως αποτέλεσμα, είναι δυνατό να ληφθούν πολύ λογικές εκτιμήσεις από ορισμένους σχετικά απλούς τύπους.

Κατά τη σύγκριση δύο ομάδων, οι κύριοι παράγοντες που επηρεάζουν το μέγεθος του δείγματος είναι:

  1. Πόσο μεγάλη διαφορά χρειάζεστε για να μπορέσετε να εντοπίσετε.
  2. Πόση μεταβλητότητα υπάρχει στον παράγοντα ενδιαφέροντος.
  3. Ποια τιμή «p» σκοπεύετε να χρησιμοποιήσετε ως κριτήριο για τη στατιστική «σημαντικότητα».
  4. Πόσο σίγουροι θέλετε να είστε ότι θα εντοπίσετε μια «στατιστικά σημαντική» διαφορά, υποθέτοντας ότι υπάρχει μια διαφορά.

Μια διαισθητική ματιά σε ένα απλό παράδειγμα

Ας υποθέσουμε ότι μελετάτε θέματα με νεφρική υπέρταση και θέλετε να δοκιμάσετε την αποτελεσματικότητα ενός φαρμάκου που λέγεται ότι μειώνει την αρτηριακή πίεση. Σκοπεύετε να συγκρίνετε τη συστολική αρτηριακή πίεση σε δύο ομάδες, μια που αντιμετωπίζεται με ένεση εικονικού φαρμάκου και μια δεύτερη ομάδα που αντιμετωπίζεται με το υπό δοκιμή φάρμακο. Αν και δεν ξέρετε ακόμη ποια θα είναι η αρτηριακή πίεση σε καθεμία από αυτές τις ομάδες, απλώς υποθέστε ότι εάν δοκιμάζατε έναν γελοίο μεγάλο αριθμό ατόμων (ας πούμε 100.000) που έλαβαν θεραπεία είτε με εικονικό φάρμακο είτε με φάρμακο, η συστολική τους πίεση θα ακολουθούσε δύο σαφώς διακριτές κατανομές συχνοτήτων, όπως φαίνεται στο σχήμα 1.

Όπως θα περιμένατε, και οι δύο ομάδες παρουσιάζουν κάποια μεταβλητότητα στην αρτηριακή πίεση και η κατανομή συχνότητας των παρατηρούμενων πιέσεων συμμορφώνεται με καμπύλη σε σχήμα καμπάνας. Όπως φαίνεται εδώ, οι δύο ομάδες επικαλύπτονται, αλλά είναι σαφώς διαφορετικές συστολικές πιέσεις στην ομάδα που υποβλήθηκε σε αγωγή είναι κατά μέσο όρο 20 mm Hg μικρότερες από ό, τι στους μάρτυρες χωρίς θεραπεία.

Δεδομένου ότι υπήρχαν 100.000 σε κάθε ομάδα, μπορούμε να είμαστε σίγουροι ότι οι ομάδες διαφέρουν. Τώρα ας υποθέσουμε ότι αν και επεξεργαστήκαμε 100.000 από το καθένα, λάβαμε μετρήσεις πίεσης μόνο από τρεις σε κάθε ομάδα, επειδή έσπασε η συσκευή μέτρησης πίεσης. Με άλλα λόγια έχουμε ένα τυχαίο δείγμα N=3 από κάθε ομάδα και οι συστολικές πιέσεις τους είναι οι εξής:

Οι πιέσεις είναι χαμηλότερες στην ομάδα που υποβλήθηκε σε θεραπεία, αλλά δεν μπορούμε να είμαστε σίγουροι ότι η θεραπεία ήταν επιτυχής. Υπάρχει μια ευδιάκριτη πιθανότητα η διαφορά που βλέπουμε να οφείλεται απλώς στην τύχη, αφού πήραμε ένα μικρό τυχαίο δείγμα. Το ερώτημα λοιπόν είναι: πόσους θα έπρεπε να μετρήσουμε (δείγμα) σε κάθε ομάδα για να είμαστε σίγουροι ότι τυχόν παρατηρούμενες διαφορές δεν ήταν απλώς αποτέλεσμα τύχης;

Το πόσο μεγάλο δείγμα χρειάζεται εξαρτάται από τους τέσσερις παράγοντες που αναφέρονται παραπάνω. Για να διευκρινιστεί αυτό διαισθητικά, ας υποθέσουμε ότι οι πιέσεις αίματος στα άτομα που υποβλήθηκαν σε αγωγή και χωρίς θεραπεία κατανεμήθηκαν όπως φαίνεται στο σχήμα 2 ή στο σχήμα 3.


Στο Σχήμα 2 το μέγεθος της μεταβλητότητας είναι το ίδιο, αλλά η διαφορά μεταξύ των ομάδων είναι μικρότερη. Είναι λογικό ότι θα χρειαστείτε ένα μεγαλύτερο δείγμα για να είστε σίγουροι ότι οι διαφορές στο δείγμα σας είναι πραγματικές.


Στο Σχήμα 3 η διαφορά στις πιέσεις είναι περίπου η ίδια όπως ήταν στο Σχήμα 1, αλλά υπάρχει μικρότερη μεταβλητότητα στις ενδείξεις πίεσης σε κάθε ομάδα. Εδώ φαίνεται προφανές ότι θα χρειαζόταν ένα μικρότερο δείγμα για να προσδιοριστεί με σιγουριά μια διαφορά.

Το μέγεθος του δείγματος που χρειάζεστε εξαρτάται επίσης από την τιμή "p" που χρησιμοποιείτε. Μια «τιμή p» μικρότερη από 0,05 χρησιμοποιείται συχνά ως κριτήριο για να αποφασιστεί εάν οι παρατηρούμενες διαφορές είναι πιθανό να οφείλονται στην τύχη. Εάν p<0,05, σημαίνει ότι η πιθανότητα η διαφορά που παρατηρήσατε να οφείλεται στην τύχη είναι μικρότερη από 5%. Αν θέλετε να χρησιμοποιήσετε ένα πιο άκαμπτο κριτήριο (ας πούμε, p<0.01) θα χρειαστείτε ένα μεγαλύτερο δείγμα. Τέλος, το μέγεθος του δείγματος που θα χρειαστείτε εξαρτάται επίσης από την «ισχύ», δηλαδή την πιθανότητα να παρατηρήσετε μια στατιστικά σημαντική διαφορά, υποθέτοντας ότι μια διαφορά υπάρχει πραγματικά.

Συνοψίζοντας, για να υπολογίσετε μια εκτίμηση μεγέθους δείγματος, εάν χρειάζεστε κάποια εκτίμηση για το πόσο διαφορετικές μπορεί να είναι οι ομάδες ή πόσο μεγάλη διαφορά πρέπει να μπορείτε να ανιχνεύσετε, και χρειάζεστε επίσης μια εκτίμηση για το πόση μεταβλητότητα θα υπάρχει εντός ομάδων. Επιπλέον, οι υπολογισμοί σας πρέπει επίσης να λαμβάνουν υπόψη τι θέλετε να χρησιμοποιήσετε ως τιμή "p" και πόση "ισχύ" θέλετε.

Οι πληροφορίες που χρειάζεστε για να κάνετε υπολογισμούς μεγέθους δείγματος

Δεδομένου ότι δεν έχετε κάνει ακόμη το πείραμα, δεν θα ξέρετε πόσο διαφορετικές θα είναι οι ομάδες ή ποια θα είναι η μεταβλητότητα (όπως μετρείται με την τυπική απόκλιση). Αλλά συνήθως μπορείτε να κάνετε εύλογες εικασίες. Ίσως από την εμπειρία σας (ή από προηγουμένως δημοσιευμένες πληροφορίες) αναμένετε ότι τα υπερτασικά άτομα χωρίς θεραπεία θα έχουν μέση συστολική αρτηριακή πίεση περίπου 160 mm Hg με τυπική απόκλιση περίπου +10 mm Hg. Αποφασίζετε ότι μια μείωση της συστολικής αρτηριακής πίεσης σε μέσο όρο 150 mm Hg θα αντιπροσώπευε μια κλινικά σημαντική μείωση. Δεδομένου ότι κανείς δεν έχει κάνει ποτέ αυτό το πείραμα στο παρελθόν, δεν γνωρίζετε πόση μεταβλητότητα θα υπάρξει ως απάντηση, οπότε θα πρέπει να υποθέσετε ότι η τυπική απόκλιση για την ομάδα δοκιμής είναι τουλάχιστον τόσο μεγάλη όσο αυτή στους μάρτυρες χωρίς θεραπεία. Από αυτές τις εκτιμήσεις μπορείτε να υπολογίσετε μια εκτίμηση του μεγέθους του δείγματος που χρειάζεστε σε κάθε ομάδα.

Δείγμα υπολογισμών μεγέθους για διαφορά στα μέσα

Οι πραγματικοί υπολογισμοί μπορεί να γίνουν λίγο περίπλοκοι και οι περισσότεροι άνθρωποι δεν θέλουν καν να δουν εξισώσεις. Κατά συνέπεια, έχω δημιουργήσει ένα υπολογιστικό φύλλο (Lamorte’s Power Calculations) που κάνει όλους τους υπολογισμούς αυτόματα. All you have to do is enter the estimated means and standard deviations for each group. In the example shown here, I assumed that my control group (group 1) would have a mean of 160 and a standard deviation of 10. I wanted to know how many subjects I would need in each group to detect a significant difference of 10 mm Hg. So, I plugged in a mean of 150 for group 2 and assumed that the standard deviation for this group would be the same as for group 1.


The spreadsheet actually generates a table which shows estimated sample sizes for different “p values” and different power levels. Many people arbitrarily use p=0.05 and a power level of 80%. With these parameters you would need about 16 subjects in each group. If you want 90% power, you would need about 21 subjects in each group.

The format in this spreadsheet makes it easy to play “what if.” If you want to get a feel for how many subjects you might need if the treatment reduces pressures by 20 mm Hg, just change the mean for group 2 to 140, and all the calculations will automatically be redone for you.

Sample Size Calculations For A Difference In Proportions

The bottom part of the same spreadsheet generates sample-size calculations for comparing differences in frequency of an event. Suppose, for example, that a given treatment was successful 50% of the time and you wanted to test a new treatment with the hope that it would be successful 90% of the time. All you have to do is plug these (as fractions) into the spreadsheet, and the estimated sample sizes will be calculated automatically as shown here:

The illustration from the spreadsheet below shows that to have a 90% probability of showing a statistically significant difference (using p< 0.05) in proportions this great, you would need about 22 subjects in each group.

Spreadsheet

The Statistical Explanation Sample Spreadsheet described above can be found here.

Responsible Parties

Principal Investigators are responsible for: preparing and submitting applications making modifications in applications in order secure IACUC approval ensuring adherence to approved protocols, and ensuring humane care and use of animals. It is the responsibility of the IACUC to assure that the number of animals to be used in an animal use protocol is appropriate. The Animal Welfare Program and the Institutional Animal Care and Use Committee are responsible for overseeing implementation of and ensuring compliance with this policy.


Δες το βίντεο: How to calculate sample size in animal experiments. (Δεκέμβριος 2021).