Πληροφορίες

Πρόβλημα στην κατανόηση του υπολογισμού των κανονικών (Bayesian) βασικών επιτοκίων

Πρόβλημα στην κατανόηση του υπολογισμού των κανονικών (Bayesian) βασικών επιτοκίων

Δυσκολεύομαι να κατανοήσω τον Πίνακα 1 των Gigerenzer, Hell και Blank (1988, PDF, πίνακας στη σελίδα 516):

Εστιάζοντας στη σειρά Jack, αναφέρεται ότι οι μέσες πιθανότητες να είναι μηχανικός ο Jack ήταν 71,4% σε συνθήκες χαμηλού βασικού επιτοκίου και 81,3% σε συνθήκες υψηλού βασικού επιτοκίου. Έτσι, οι συμμετέχοντες έλαβαν εν μέρει υπόψη τις βασικές τιμές. Αν αγνοούσαν εντελώς τα βασικά επιτόκια, αυτές οι τιμές θα ήταν οι ίδιες, αντί να διαχωρίζονται κατά 9,9%. Οπότε πιστεύω ότι καταλαβαίνω τι συμβαίνει στη στήλη Παράλειψη τιμής βάσης.

Ωστόσο, δεν καταλαβαίνω τι συμβαίνει στη στήλη Bayesian. Υπάρχει μια επεξηγηματική υποσημείωση στο p516, αλλά για μένα δεν ήταν διαφωτιστική. Η υποσημείωση παρέχει τις ακόλουθες εξισώσεις:

$$ p_ {70} (E | D)/(1-p_ {70} (E | D)) = L frac {0.7} {0.3} $ $ $ $ p_ {30} (E | D)/( 1-p_ {30} (E | D)) = L frac {0,3} {0,7} $ $

Έτσι, δεδομένου ότι η μέση εικασία για τη συνθήκη 70% ήταν 81,3% παίρνουμε

$$ begin {align} 81.3/18.7 & = L ~ 0.7/0.3 & & = 81.3/18.7 & = L ~ 2.33 & = 4.35 & = L ~ 2.33 & = 1.86 & = L end {align} $$

Ωστόσο, όταν συνδέω αυτήν την τιμή $ L $ στην εξίσωση $ p_ {30} $ παίρνω μια τιμή για $ p_ {30} (E | D) $ που αποκλίνει άγρια ​​τόσο από την τιμή 'Bayesian' και από αυτό που ήταν όντως παρατηρήθηκε. Σύμφωνα με τον πίνακα, η μέση απόκλιση από το Bayesian πρέπει να είναι 16,1%, αλλά σύμφωνα με τους υπολογισμούς μου είναι πολύ μεγαλύτερη. Θα εκτιμούσα πολύ αν κάποιος μπορούσε να μου πει τι κάνω λάθος.

Βιβλιογραφικές αναφορές

  • Gigerenzer, G., Hell, W. & Blank, Η. (1988). Παρουσίαση και περιεχόμενο: Η χρήση των βασικών τιμών ως συνεχή μεταβλητή… Εφημερίδα της Πειραματικής ologyυχολογίας: Αντίληψη και Απόδοση του Ανθρώπου, 14, 513. PDF

Νομίζω ότι κάνετε τον υπολογισμό σωστά, αλλά οι Gigerenzer και Blank δεν μας έδωσαν τα πλήρη αποτελέσματα του πειράματός τους, εμποδίζοντάς μας να επαναλάβουμε τους υπολογισμούς τους ακριβώς: Τα δεδομένα που παρέχονται στις στήλες 1 και 2 του πίνακα είναι μόνο τα μέσους όρουςΤο Τα δεδομένα στη στήλη 4 (Bayesian) δεν είναι μετασχηματισμός της μέσης τιμής χρησιμοποιώντας κάποιο τύπο (βλ. Παρακάτω), αλλά τα αρχικά δεδομένα μετασχηματίστηκαν και στη συνέχεια έγινε ο μέσος όρος:

Για κάθε θέμα στην ομάδα βασικών επιτοκίων 70% προβλέψαμε, χρησιμοποιώντας το θεώρημα του Bayes, πώς θα ανταποκρινόταν αυτό το θέμα στην ομάδα βασικού συντελεστή 30%

Εάν διαιρέσετε την πρώτη εξίσωση της υποσημείωσης με τη δεύτερη και αντλήσετε έναν τύπο για το p30 σε συνάρτηση με το p70, παίρνετε:

$$ p_ {30} (E | D) περίπου frac {p_ {70} (E | D)} {5.44-4.44p_ {70} (E | D)} $$

Παρατηρήστε ότι αυτή η συνάρτηση είναι αυστηρά κυρτή στην περιοχή [0,1], πράγμα που σημαίνει ότι αν την υπολογίσετε με τον μέσο όρο p70, θα λάβετε μια τιμή χαμηλότερη από την τιμή που θα λάβατε κατά μέσο όρο τις τιμές για πολλά δεδομένα- πόντους.

Για παράδειγμα, ας εξετάσουμε τη σειρά Jack: Εάν μετατρέψετε τη μέση τιμή p70 0,813, θα λάβετε p30 0,44, η οποία έχει απόκλιση 0,27 από την παρατηρούμενη μέση τιμή p30 (όπως πιθανότατα διαπιστώσατε). Ας υποθέσουμε ότι τα δεδομένα στη σειρά Jack, στη στήλη p70 ελήφθησαν από δύο άτομα, τα οποία απάντησαν 0,968 και 0,658 (αποδίδοντας το μέσο όρο 0,813 που αναφέρεται στον πίνακα). Μετατρέψτε και τις δύο αυτές τιμές και θα λάβετε 0,848 και 0,261, αντίστοιχα, αποδίδοντας ένα μέσο ρ30 0,553, το οποίο θα δώσει μια απόκλιση του Μπαγιέζης 0,161 ακριβώς όπως αναφέρεται στη στήλη 4.


Ένα έργο του Μπέιζ

Τι γίνεται όμως με το υπόλοιπο 76 % που ακόμη δεν μπορείς να λύσεις τέτοιου είδους προβλήματα; Ο Βέμπερ και οι συνεργάτες του ήθελαν να καταλάβουν το γιατί. Προσέλαβαν 180 φοιτητές από το πανεπιστήμιο και τους παρουσίασαν δύο δείγματα προβλημάτων στο λεγόμενο Bayesian συλλογισμό, πλαισιωμένα είτε σε μορφή πιθανότητας είτε σε φυσική μορφή συχνότητας.

Αυτό περιλαμβάνει την παροχή στατιστικών στα βασικά ποσοστά-ας πούμε, πιθανώς μιας 40χρονης γυναίκας που έχει διαγνωστεί με καρκίνο του μαστού (1 τοις εκατό)-μαζί με ένα στοιχείο ευαισθησίας (μια γυναίκα με καρκίνο του μαστού θα έχει θετικό αποτέλεσμα μαστογραφία 80 τοις εκατό) και ένα ποσοστό ψευδούς συναγερμού (μια γυναίκα χωρίς καρκίνο του μαστού έχει ακόμη 9,6 τοις εκατό πιθανότητες να πάρει θετικό αποτέλεσμα στη μαστογραφία της). Αν λοιπόν μια γυναίκα 40 ετών διαπιστώσει θετικό καρκίνο του μαστού, ποια είναι η πιθανότητα να έχει όντως την ασθένεια (η «εκ των υστέρων» εκτίμηση πιθανότητας);

Το πρόβλημα της μαστογραφίας είναι τόσο γνωστό ότι ο Weber et αϊ. κατέληξαν στα δικά τους προβλήματα. Για παράδειγμα, η πιθανότητα ένα τυχαία επιλεγμένο άτομο από έναν δεδομένο πληθυσμό να είναι εθισμένο στην ηρωίνη είναι 0,01 τοις εκατό (το βασικό ποσοστό). Εάν το άτομο που έχει επιλεγεί είναι εθισμένος στην ηρωίνη, υπάρχει 100 % πιθανότητα ότι το άτομο θα έχει φρέσκα σημάδια βελόνας στο χέρι του (στοιχείο ευαισθησίας). Ωστόσο, υπάρχει επίσης πιθανότητα 0,19 τοις εκατό ότι το τυχαία επιλεγμένο άτομο θα έχει φρέσκα σημάδια βελόνας στο χέρι του, ακόμη και αν δεν είναι εξαρτημένος από την ηρωίνη (ποσοστό ψευδούς συναγερμού). Ποια είναι λοιπόν η πιθανότητα ένα τυχαία επιλεγμένο άτομο με φρέσκα σημάδια βελόνας να είναι εθισμένο στην ηρωίνη (η μετέπειτα πιθανότητα);

Εδώ είναι το ίδιο πρόβλημα στη μορφή φυσικών συχνοτήτων: 10 στους 100.000 ανθρώπους θα εθίζονται στην ηρωίνη. Και 10 στους 10 εθισμένους στην ηρωίνη θα έχουν φρέσκα σημάδια βελόνας στα χέρια τους. Εν τω μεταξύ, 190 από 99.990 άτομα που είναι δεν εθισμένος στην ηρωίνη θα έχει παρόλα αυτά φρέσκα σημάδια βελόνας. Ποιο ποσοστό λοιπόν των ατόμων με φρέσκα σημάδια βελόνας είναι εθισμένο στην ηρωίνη;

Και στις δύο μορφές πιθανότητας και φυσικής συχνότητας για το πρόβλημα της εξάρτησης από την ηρωίνη, η απάντηση είναι πέντε τοις εκατό, αλλά η διαδικασία με την οποία κάποιος φτάνει σε αυτήν την απάντηση είναι πολύ απλούστερη στη μορφή φυσικής συχνότητας. Το σύνολο των ατόμων με βελόνες στο μπράτσο είναι το άθροισμα όλων των εξαρτημένων από την ηρωίνη (10) συν των 190 μη τοξικομανών. Και το 10/200 σας δίνει τη σωστή απάντηση. [διορθώθηκε]


Αποτελέσματα

Τα ακατέργαστα δεδομένα και ο κώδικας R για την αναπαραγωγή των αναλύσεων βρίσκονται στη διεύθυνση https://osf.io/3t2xw/.

Περιγραφικά αποτελέσματα

Κατά μέσο όρο, οι συμμετέχοντες έκριναν ότι τα τρία χρονογραφήματα είχαν 10 % (SD = 15 %), 29 % (SD = 23 %) και 53 % (SD = 27 %) πιθανότητα προ -δοκιμής καρκίνου του παχέος εντέρου. Αυτό παρέχει αρκετά ευρύ φάσμα προηγούμενων πιθανοτήτων από τις οποίες μπορεί να εξεταστεί η ενημέρωση.

Ο Πίνακας 1 παρουσιάζει τις μέσες κρίσεις για το ποσοστό ευαισθησίας και ψευδώς θετικού για τα τέσσερα τεστ μαζί με δημοσιευμένες εκτιμήσεις. Υποσημείωση 3 Συνολικά, οι κρίσεις των συμμετεχόντων ταίριαζαν αρκετά με τις δημοσιευμένες εκτιμήσεις.

Εξαιρούνται παρατηρήσεις

Οι ακόλουθες παρατηρήσεις (μεμονωμένες κρίσεις μετά τον έλεγχο) εξαιρέθηκαν για να βοηθήσουν την ερμηνεία ».τ + "Έναντι"τ - "αντιπροσωπεύει εάν το αποτέλεσμα της δοκιμής είναι θετικό έναντι αρνητικό, και"ντο + "Έναντι"ντο - ”αντιπροσωπεύουν εάν ο καρκίνος του παχέος εντέρου είναι παρών έναντι απουσίας. Πρώτον, οι παρατηρήσεις απορρίφθηκαν εάν η εκτίμηση ευαισθησίας ενός συμμετέχοντα, Π(τ + |ντο +), ήταν μικρότερο από το ψευδώς θετικό ποσοστό, Π(τ + |ντο -), για μια δεδομένη δοκιμή, που σημαίνει ότι η δοκιμή λειτουργεί σε λάθος κατεύθυνση και πιθανώς αντικατοπτρίζει ένα σφάλμα (4,7 % των παρατηρήσεων). Δεύτερον, οι παρατηρήσεις έπεσαν επίσης εάν οι συμμετέχοντες το κρίνουν αυτό Π(τ + |ντο + ) = Π(τ + |ντο -) (5,6 % των παρατηρήσεων), πράγμα που σημαίνει ότι το τεστ δεν μπορεί να διακρίνει καθόλου τον καρκίνο του παχέος εντέρου. Αυτό συνέβη κυρίως για το FOBT, το οποίο είναι ένα τεστ που αντιμετωπίζεται ευρέως με σκεπτικισμό από τους γιατρούς λόγω του υψηλού ψευδώς θετικού ποσοστού του. Επειδή ο σκοπός αυτής της μελέτης είναι να κατανοήσει πώς οι γιατροί ενημερώνουν τις πεποιθήσεις τους όταν η ενημέρωση είναι δικαιολογημένη, αυτές οι παρατηρήσεις απορρίφθηκαν. Τρίτον, υπήρχαν 15 παρατηρήσεις (0,3 %) για τις οποίες οι συμμετέχοντες έδωσαν ευαισθησία ή ψευδώς θετικά ποσοστά ακριβώς ένα ή μηδέν, τα οποία παρήγαγαν άπειρες τιμές σφάλματος καταγραφής και έπρεπε να απορριφθούν για όλες τις αναλύσεις.

Οι αναλύσεις εκτελέστηκαν επίσης αποκλείοντας και περιλαμβάνοντας τους ακόλουθους τύπους παρατηρήσεων για να ελεγχθεί η ευρωστία του αποτελέσματος. Πρώτον, εάν το αποτέλεσμα της δοκιμής είναι θετικό (αρνητικό), η κρίση μετά τον έλεγχο θα πρέπει να είναι υψηλότερη (χαμηλότερη) από την κρίση πριν από το τεστ. 5,2 % των παρατηρήσεων παραβίασαν την κανονιστική κατεύθυνση της ενημέρωσης. Δεύτερον, παρόλο που οι συμμετέχοντες χρησιμοποίησαν μια κλίμακα από 0,01 % έως 99,99 %, ορισμένοι συμμετέχοντες μπορεί να χρησιμοποιούσαν 1 % για 1 % ή λιγότερο και 99 % για 99 % ή περισσότερο 13,7 % των παρατηρήσεων κανονικά θα έπρεπε να ήταν & lt1 % ή & gt99 %, και οι αναλύσεις διεξάγονται με και χωρίς αυτές τις παρατηρήσεις.

Χρήση του λόγου πιθανότητας και της προηγούμενης πιθανότητας στην ενημέρωση

Αναλύοντας αν οι κρίσεις μετά το τεστ των συμμετεχόντων ήταν αρκετά ευαίσθητες στην αναλογία πιθανοτήτων (ευαισθησία διαιρούμενη με το ψευδώς θετικό ποσοστό) και την προηγούμενη πιθανότητα αφορούσαν τη χρήση της μορφής log odds του κανόνα του Bayes (Evans et al., 2002 Keren & amp Thujs, 1996 Lyman & amp Balducci , 1994). Οι εξισώσεις 1α και 1β χρησιμοποιούνται όταν το αποτέλεσμα της δοκιμής είναι θετικό ή αρνητικό, αντίστοιχα. Η μορφή των αποδόσεων καταγραφής του κανόνα του Bayes είναι χρήσιμη επειδή επιτρέπει τη γραμμική παλινδρόμηση στην εξίσωση 2. Κανονικά, τα βάρη παλινδρόμησης για τις προηγούμενες πιθανότητες καταγραφής και ο λόγος πιθανότητας καταγραφής πρέπει να είναι ένα, και το βάρος παλινδρόμησης για το σημείο διακοπής πρέπει να είναι μηδέν. Λόγω των επαναλαμβανόμενων μέτρων, συμπεριλήφθηκαν τυχαίες επιδράσεις κατά την υποκλοπή και τις κλίσεις του λόγου πιθανότητας καταγραφής και τις προηγούμενες πιθανότητες καταγραφής.

Ο Πίνακας 2 δείχνει τα αποτελέσματα των παλινδρόμησης Παρέχονται διαστήματα εμπιστοσύνης 95 % για την ταυτόχρονη σύγκριση των σταθμίσεων παλινδρόμησης έναντι ενός και μηδενικού. Πραγματοποιήθηκαν τρεις παλινδρομήσεις τόσο για τα θετικά όσο και για τα αρνητικά αποτελέσματα του τεστ: μία με όλες τις εξαιρέσεις που αναφέρθηκαν στην προηγούμενη ενότητα, μία με όλες τις εξαιρέσεις, εκτός από τις παρατηρήσεις στις οποίες οι συμμετέχοντες ενημέρωσαν τις κρίσεις τους προς την αντίθετη προς την κανονιστική κατεύθυνση και μία με όλες τις εξαιρέσεις εκτός από την εξαίρεση των παρατηρήσεων για τις οποίες οι κανονιστικές απαντήσεις βρίσκονται στα ακραία μέρη της κλίμακας (& lt.01 ή & gt.99).

Το γεγονός ότι οι συντελεστές παλινδρόμησης για το λόγο πιθανότητας και οι πιθανότητες προ -δοκιμής ήταν και οι δύο σημαντικά άνω του μηδενός και για τις έξι παλινδρόμηση υποδηλώνει ότι χρησιμοποιήθηκαν και οι δύο πεποιθήσεις. Και στις έξι παλινδρομήσεις, το διάστημα εμπιστοσύνης 95 % για τις προηγούμενες πιθανότητες καταγραφής ήταν κάτω από το ένα, υπονοώντας ότι οι συμμετέχοντες δεν χρησιμοποιούσαν επαρκώς τις πεποιθήσεις τους. Επιπλέον, στις περισσότερες παλινδρομήσεις, το ανώτερο όριο του διαστήματος εμπιστοσύνης 95 % για τον λόγο πιθανότητας καταγραφής ήταν μικρότερο από ένα, υπονοώντας ότι οι συμμετέχοντες δεν χρησιμοποιούσαν τις πεποιθήσεις τους κατά πάσα πιθανότητα (ευαισθησία και ψευδώς θετικά ποσοστά του τεστ) αρκετά Το Αυτό ήταν πιο εμφανές για ένα αρνητικό αποτέλεσμα δοκιμής, ωστόσο, μετά από ένα θετικό αποτέλεσμα δοκιμής, τα διαστήματα εμπιστοσύνης 95 % ήταν κοντά στο ένα και μερικές φορές ξεπερνούσαν το ένα, υπονοώντας ότι οι συμμετέχοντες χρησιμοποίησαν σχεδόν κανονικά τις πεποιθήσεις πιθανότητας μετά από ένα θετικό αποτέλεσμα δοκιμής.

Οι παλινδρομήσεις είχαν ως επί το πλείστον θετικές (αρνητικές) παρεμβολές για την περίπτωση θετικού (αρνητικού) αποτελέσματος δοκιμής. Αυτό μπορεί να ερμηνευτεί ότι σημαίνει ότι οι συμμετέχοντες κατάλαβαν ότι πρέπει να αυξήσουν (μειώσουν) τις κρίσεις τους, αλλά δεν κατάλαβαν πάντα ότι η ενημέρωση θα πρέπει να συνδέεται άμεσα με τις πεποιθήσεις τους στην αναλογία πιθανοτήτων.

Πραγματοποιήθηκαν παλινδρομήσεις παρακολούθησης, ελέγχοντας αν υπήρχε σημαντική αλληλεπίδραση μεταξύ του λόγου πιθανότητας καταγραφής και των προηγούμενων αποδόσεων καταγραφής κανονικά δεν θα έπρεπε να υπάρχει αλληλεπίδραση. Αυτές οι παλινδρομήσεις περιλάμβαναν επίσης μια τυχαία κλίση κατά θέμα στην αλληλεπίδραση. Για τη θετική κατεύθυνση, η επίδραση του λόγου πιθανότητας καταγραφής ήταν ασθενέστερη σε υψηλότερα επίπεδα προελέγχου (βλ. Πίνακα 3). Αυτό μπορεί να ερμηνευθεί ότι σημαίνει ότι όταν η προηγούμενη πιθανότητα ήταν αρκετά υψηλή, τα άτομα αρνήθηκαν να αυξήσουν την πιθανότητα όσο ήταν δικαιολογημένο από τις πεποιθήσεις τους στην αναλογία πιθανότητας, αποφεύγοντας το ανώτερο άκρο της κλίμακας πιθανοτήτων.

Για την αρνητική κατεύθυνση, οι παλινδρόμησεις δεν θα συγκλίνουν ωστόσο, μειώνοντας τη συσχέτιση μεταξύ των τυχαίων κλίσεων που επέτρεψαν σύγκλιση σε δύο από τις τρεις παλινδρόμησεις. Υποσημείωση 4 Η επίδραση του λόγου πιθανότητας καταγραφής ήταν ασθενέστερη σε χαμηλότερα επίπεδα προελέγχου (Πίνακας 3). Αυτό μπορεί να ερμηνευθεί ως άτομα που αρνούνται να μειώσουν την πιθανότητα όσο δικαιολογείται από τις πεποιθήσεις τους στην αναλογία πιθανότητας όταν η προηγούμενη πιθανότητα ήταν χαμηλή.

Συνολικά, αν και η χρήση των προηγούμενων αποδόσεων καταγραφής και ο λόγος πιθανότητας καταγραφής δεν ήταν αρκετά κανονιστικές και υπάρχουν ενδείξεις μη κανονικής αλληλεπίδρασης μεταξύ των δύο, υπάρχουν σαφείς ενδείξεις ότι τα άτομα χρησιμοποίησαν τόσο τις προηγούμενες πιθανότητες καταγραφής όσο και τον λόγο πιθανότητας καταγραφής Το

Υπερτίμηση

Οι περισσότερες μελέτες σχετικά με τον συλλογισμό Bayes επικεντρώθηκαν στο αν οι εκ των υστέρων κρίσεις είναι κοντά στην κανονιστική απάντηση ή αν είναι πολύ υψηλές ή πολύ χαμηλές. Η εξίσωση 3 χρησιμοποιήθηκε για τον υπολογισμό του καταγεγραμμένου σφάλματος στην κρίση μετά τον έλεγχο (σε σχέση με τις πεποιθήσεις του ίδιου του συμμετέχοντα για την αναλογία πιθανοτήτων και τις πιθανότητες προ -δοκιμής) και οι αναλύσεις στον όρο σφάλματος καταγραφής πραγματοποιήθηκαν χρησιμοποιώντας τα ίδια τρία σετ εξαιρέσεων που χρησιμοποιήθηκαν προηγουμένως. Κανονικά, το σφάλμα καταγραφής πρέπει να είναι μηδέν.

Συνολικά, το 63 % έως 64 % των συμπερασμάτων προς τη θετική κατεύθυνση και το 66 % έως 69 % των συμπερασμάτων προς την αρνητική κατεύθυνση ήταν πάνω από τον κανονιστικό υπολογισμό, ανάλογα με το συγκεκριμένο σύνολο εξαιρέσεων. Οι παλινδρομήσεις με έναν όρο τυχαίας υποκλοπής ανά θέμα διαπίστωσαν ότι η υπερεκτίμηση ήταν σημαντική τόσο για τα θετικά όσο και για τα αρνητικά αποτελέσματα του τεστ (βλ. Πίνακα 4). Οι παλινδρομήσεις παρακολούθησης, συμπεριλαμβανομένου ενός σταθερού αποτελέσματος για το αν ο γιατρός ήταν ακόμα κάτοικος ή είχε τελειώσει την παραμονή, δεν βρήκαν σημαντικά αποτελέσματα.

Τα σχήματα 3 και 4 δείχνουν τη σχέση μεταξύ των κανονιστικών και των πραγματικών συμπερασμάτων μετά τον έλεγχο όταν το αποτέλεσμα της δοκιμής ήταν θετικό και αρνητικό. (Το Jitter προστέθηκε για να μειώσει την υπερπλήρωση.) Η γραμμή 45 μοιρών αντανακλά την τέλεια βαθμονόμηση. Η παχιά μαύρη γραμμή δείχνει το μέσο συμπέρασμα σε κάθε επίπεδο του Χ-άξονας. Η γραμμή συνδέει 10 σημεία, καθένα από τα οποία αντιπροσωπεύει μια διάμεσο που περιέχει το ένα δέκατο των δεδομένων κατά μήκος της Χ-άξονας. Το γεγονός ότι η μαύρη γραμμή τείνει να είναι πάνω από τη γραμμή 45 μοιρών αντιπροσωπεύει την υπερεκτίμηση.

Σχέση μεταξύ κανονικών υπολογισμών μετά τον έλεγχο και συμπερασμάτων μετά τον έλεγχο μετά από θετικό αποτέλεσμα δοκιμής

Σχέση μεταξύ κανονικών υπολογισμών μετά τον έλεγχο και συμπερασμάτων μετά τον έλεγχο μετά από αρνητικό αποτέλεσμα δοκιμής. ΣημείωσηΤο Αυτό το σχήμα χρησιμοποιεί μια κλίμακα log-log επειδή πολλές από τις κρίσεις είναι παρακάτω .1

Εστιάζοντας στα συμπεράσματα κανονικά μικρότερα από 0,01, μετά τους τρεις βασικούς λόγους αποκλεισμού των παρατηρήσεων, το 81 % των υπόλοιπων 590 συμπερασμάτων κανονικά μικρότερο από 0,01 ήταν πολύ υψηλό. Αυτό πιθανότατα αντανακλά τόσο την τάση στρογγυλοποίησης στο 0,01 όσο και μια προκατάληψη υπερεκτίμησης. Εξήντα ένα τοις εκατό από τα 70 συμπεράσματα κανονικά μεγαλύτερα από 0,99 ήταν επίσης χαμηλός, υποδηλώνοντας ότι η προκατάληψη υπερεκτίμησης δεν επεκτείνεται στην κορυφή της κλίμακας, κάτι που φαίνεται επίσης στο Σχ. 3.

Η υπερεκτίμηση μπορεί να εξηγηθεί με την κακή χρήση των συστατικών του κανόνα του Bayes με τους ακόλουθους τρόπους. Σε θετική κατάσταση, υπήρξε μια σημαντική θετική παρεμπόδιση στις αναλύσεις παλινδρόμησης στην προηγούμενη ενότητα, η οποία συμβάλλει στην υπερεκτίμηση. Επιπρόσθετα, οι πιθανότητες προ -δοκιμής καταγραφής ήταν γενικά αρνητικές (επειδή οι περισσότερες από τις εκτιμήσεις πιθανότητας προ -δοκιμής ήταν μικρότερες από .5) η μη χρήση των αποδόσεων log preestest (βάρος παλινδρόμησης μικρότερη του ενός) θα διογκώσει έτσι τα συμπεράσματα (θα τα φέρει πιο κοντά στο .5).

Η υπερεκτίμηση μετά από αρνητικό αποτέλεσμα δοκιμής μπορεί να εξηγηθεί με τον ακόλουθο τρόπο. Πρώτον, ο λόγος πιθανότητας καταγραφής είναι αρνητικός για αρνητικό αποτέλεσμα δοκιμής. Η κακή χρήση του λόγου πιθανότητας καταγραφής (βάρος παλινδρόμησης μικρότερη του ενός) συνεπάγεται ότι οι συμμετέχοντες δεν μείωσαν τις εκτιμήσεις τους αρκετά, με αποτέλεσμα την υπερεκτίμηση. Δεύτερον, οι πιθανότητες προ -δοκιμής καταγραφής ήταν γενικά αρνητικές, επειδή οι περισσότερες από τις εκτιμήσεις πιθανότητας πριν από το τεστ ήταν μικρότερες από 0,5. Η κακή χρήση των πιθανών προελέγχου θα διόγκωνε επίσης τα συμπεράσματα φέρνοντας τις πιθανότητες μετά τη δοκιμή πιο κοντά στο μηδέν (πιθανότητα μετα -δοκιμής πιο κοντά στο .5). Τρίτον, η υποκλοπή ήταν αρνητική, πράγμα που υποδηλώνει ότι οι συμμετέχοντες τείνουν να μειώνουν τις κρίσεις των εκτιμήσεων μετά το τεστ με τρόπο που δεν σχετίζεται με την πίστη τους στον λόγο πιθανότητας. Από μόνο του, αυτό θα οδηγούσε τα συμπεράσματα να είναι πολύ χαμηλά, αλλά η υποβάρυνση του λόγου πιθανοτήτων και οι προηγούμενες πιθανότητες είχαν μεγαλύτερη θετική επίδραση από την αρνητική επιρροή από τη γενική τάση μείωσης των εκτιμήσεων.


Υπολογισμοί της πιθανότητας ενοχής

Δημιουργήσαμε το πρόβλημα με τον συνήθη τρόπο εξετάζοντας πρώτα δύο υποθέσεις.

Από τεχνική άποψη, αυτές δεν είναι οι δύο μόνο υποθέσεις και υπάρχει το γεγονός ότι ο Λάιτερμαν σκότωσε τον Μίξερ και ήταν θύμα μόλυνσης, αλλά αυτή η πιθανότητα είναι τόσο μακρινή που μπορούμε να την αγνοήσουμε με ασφάλεια. Για τους σκοπούς μας, οι παραπάνω υποθέσεις είναι εξαντλητικές και αλληλοαποκλειόμενες, και οι πιθανότητές τους ανέρχονται σε 1,0.

Ως επιστήμονες, γνωρίζουμε ότι η παρουσία του αίματος του Ruelas στα ρούχα του Mixer συνεπάγεται με εξαιρετικά μεγάλη πιθανότητα να υπήρξε τουλάχιστον ένα περιστατικό μόλυνσης στην ανάλυση των υλικών του σκηνικού εγκλήματος του Mixer. Με τη σειρά του, αυτό το γεγονός υποδηλώνει ότι οι επιστήμονες των εργαστηρίων ήταν λανθασμένοι στον ισχυρισμό τους ότι δεν υπήρχε πιθανότητα μόλυνσης στο εργαστήριο. Δυστυχώς, η κριτική επιτροπή δεν θεώρησε την παρουσία του αίματος του Ruelas ως σημαντική για την αξιολόγηση της αληθοφάνειας ότι το DNA του Leiterman κατατέθηκε στο δείγμα του Mixer στο εργαστήριο. Αν και αυτή η εξέταση από την κριτική επιτροπή αψηφά τη λογική, τη χρησιμοποιούμε ως αφετηρία, καθώς δεν μπορεί να ανακουφιστεί. Υπολογίζουμε τις πιθανότητες εναπόθεσης DNA στον τόπο του εγκλήματος το 1969 έναντι του εργαστηρίου το 2002 χωρίς καμία εξέταση του Ruelas. Αυτοί οι υπολογισμοί είναι, επομένως, ένα ανώτατο όριο στην πιθανότητα ενοχής. Οποιαδήποτε εξέταση του Ruelas θα μείωνε την πιθανότητα επειδή αυξάνει την πιθανότητα μόλυνσης από τη βασική τιμή της βιβλιογραφίας.

Ο κύριος στόχος μας είναι να υπολογίσουμε την πιθανότητα ενοχής που εξαρτάται από τα αποτελέσματα του τεστ DNA. Αυτή η πιθανότητα ονομάζεται επίσης μετέπειτα πιθανότητα ενοχής και συμβολίζεται με Π(Η1|ρε), όπου ρε υποδηλώνει τα αποτελέσματα της δοκιμής. Το βασικό βήμα στον υπολογισμό είναι να χρησιμοποιήσουμε τον κανόνα του Bayes, ο ίδιος μια μορφή του νόμου της υπό όρους πιθανοτήτων. Η μορφή του κανόνα του Bayes που βρίσκουμε πιο χρήσιμη εδώ εκφράζεται ως προς τις πιθανότητες.Σε αυτή την περίπτωση, οι πιθανότητες ενοχής είναι μετέπειτα Π(Η1|ρε) 1−Π(Η1|ρε). Επειδή οι δύο υποθέσεις είναι αμοιβαία αποκλειστικές και εξαντλητικές, σημειώνουμε ότι το συμπλήρωμα της ενοχής είναι η Υπόθεση 2, δηλαδή

Ως εκ τούτου, οι οπίσθιες πιθανότητες ενοχής είναι η μετέπειτα αναλογία, Π(Η1|ρε)/Π(Η2|ρε). Αυτή η αναλογία υπολογίζεται από τον κανόνα Bayes ως εξής:

Οι οπίσθιες πιθανότητες είναι το προϊόν δύο όρων. Αυτό που βρίσκεται στα αριστερά είναι η πιθανότητα λήψης των αποτελεσμάτων του DNA κάτω από ανταγωνιστικές υποθέσεις, εκείνο στα δεξιά είναι οι προηγούμενες πιθανότητες των υποθέσεων πριν από την παρατήρηση των δεδομένων. Στη συνέχεια, ορίζουμε τα γεγονότα που περιλαμβάνουν τα δεδομένα και χρησιμοποιούμε τη βιβλιογραφία για να καθορίσουμε ή να εκτιμήσουμε τις σχετικές πιθανότητες που απαιτούνται για τους υπολογισμούς.

Βασικά ποσοστά και προηγούμενες πιθανότητες

Για να υπολογίσουμε μια μετέπειτα αναλογία ενοχής, πρέπει να ξεκινήσουμε με προηγούμενες πιθανότητες. Χρησιμοποιούμε τα ακόλουθα ορίσματα για να ορίσουμε τις τιμές μας:

Π(Η1). Η υπόθεση 1 είναι ότι ο Λάιτερμαν σκότωσε τον Μίξερ. Χωρίς περαιτέρω πληροφορίες, υποθέτουμε ότι όλα τα αρσενικά στην ευρύτερη περιοχή του Ντιτρόιτ το 1969 μεταξύ 15 και 60 ετών είναι εξίσου εύλογα με τον δολοφόνο. Στην περιοχή ζούσαν 4 εκατομμύρια άνθρωποι, και υποθέσαμε ότι το 1/4 από αυτούς, 1 εκατομμύριο, ήταν άνδρες και ήταν ικανοί για τον φόνο. Δεδομένου αυτού του παρονομαστή, η a priori πιθανότητα ότι ο Leiterman είναι ο δολοφόνος είναι Π(Η1) = 10 − 6 .

Π(Η2). Η υπόθεση 2 είναι ότι ο Leiterman είναι το θύμα μόλυνσης στο εργαστήριο το 2002. Υπάρχουν δύο επιλογές ανάπτυξης εδώ και είναι σε μεγάλο βαθμό σημασιολογικές. Το ένα είναι ότι μπορούμε να πάρουμε την υπόθεση ως συνδυασμό δύο γεγονότων: (i) ότι υπήρχε μόλυνση με δείγματα σκηνών εγκλήματος του Mixer και (ii) ότι η μόλυνση ήταν με το δείγμα του Leiterman παρά με οποιοδήποτε άλλο δείγμα που επεξεργαζόταν ταυτόχρονα με το Mixer Το Η άλλη επιλογή είναι ότι μπορούμε να διασπάσουμε τη σύνδεση σε ξεχωριστά γεγονότα. Κάναμε αυτή τη δεύτερη επιλογή και εξετάσαμε την πιθανότητα μόλυνσης ως χαρακτηριστικό του τεστ DNA και όχι ως βασικό ρυθμό. Λαμβάνουμε ως βασικό συντελεστή την πιθανότητα ότι ο Leiterman ήταν θύμα μόλυνσης δεδομένου ότι συνέβη. Αυτό καθιστά το βασικό επιτόκιο ανάλογο με εκείνο της Υπόθεσης 1 όπου το βασικό ποσοστό ήταν η πιθανότητα ο Λάιτερμαν να διέπραξε τη δολοφονία δεδομένου ότι συνέβη η δολοφονία του Μίξερ. Θα ενσωματώσουμε το ποσοστό μόλυνσης στη συνέχεια ως μέρος των δεδομένων, που συζητούνται παρακάτω. Ως εκ τούτου, με αυτήν τη ρύθμιση, ο υπολογισμός αυτού του βασικού ρυθμού απαιτεί εκτίμηση του πόσα δείγματα υποβλήθηκαν σε επεξεργασία ταυτόχρονα με το Mixer's. Το 2002, το Εργαστήριο Εγκληματικής Αστυνομίας του Κράτους του Μίσιγκαν επεξεργάστηκε περίπου 10.000 δείγματα, με περίπου 5000 να υποβλήθηκαν σε επεξεργασία κατά τη διάρκεια του χρόνου που τα αποδεικτικά στοιχεία του Mixer βρίσκονταν στο εργαστήριο (Jen 2003). Ως εκ τούτου, εκτιμούμε ότι υπήρχαν περίπου 5000 δείγματα που αναλύθηκαν ταυτόχρονα με Μίξερ. Ο βασικός συντελεστής είναι έτσι Π(Η2) = 1/5000 = 2 × 10 − 4 .

Αποτελέσματα τεστ DNA ως δεδομένα

Τα αποτελέσματα του τεστ DNA δεν είναι ένας μόνο αριθμός αλλά μια συλλογή γεγονότων. Λαμβάνουμε τα ακόλουθα τέσσερα συμβάντα για να περιλαμβάνουν τα δεδομένα:

Ένας αγώνας με τον Λάιτερμαν: Υπήρχε μια οριστική αντιστοιχία μεταξύ του γνωστού προφίλ του Leiterman και του DNA που βρέθηκε στο καλσόν του Mixer. Δηλώνουμε αυτό το συμβάν αγώνα ως μιΜ.

Σάλιο: Το αντίστοιχο DNA στο καλσόν του Mixer ήταν σύμφωνο με το σάλιο, δεν ήταν σύμφωνο με το αίμα ή το σπέρμα. Δηλώνουμε αυτό το γεγονός ως μιμικρό.

Αποκλειστικότητα: Το DNA που βρέθηκε στο καλσόν του Mixer ήταν αποκλειστικά από το Leiterman, κανένα από το ίδιο το Mixer δεν βρέθηκε. Δηλώνουμε αυτό το γεγονός ως μιμι.

Σύγχρονη ανάλυση: Το DNA του Mixer και του Leiterman αναλύθηκαν στο ίδιο εργαστήριο ταυτόχρονα. Δηλώνουμε αυτό το γεγονός ως μιντο.

Είμαστε τώρα σε θέση να υπολογίσουμε τις εκ των υστέρων πιθανότητες υπό όρους αυτών των γεγονότων. Αντιμετωπίζουμε αυτά τα γεγονότα ως στατιστικά ανεξάρτητα:

Χρησιμοποιήσαμε τις ακόλουθες τιμές στον υπολογισμό:

Π(μιΜ|Η1): Ποια είναι η πιθανότητα αντιστοίχισης DNA κάτω από Η1; Η αντιστοιχία DNA δεν είναι εγγυημένη ακόμη και αν ο Λάιτερμαν δολοφόνησε τον Μίξερ. Στην πραγματικότητα, στα μισά περίπου εγκλήματα, ένα προφίλ DNA δεν μπορεί να ανακτηθεί επειδή ο δράστης δεν άφησε αρκετό υλικό για ταυτοποίηση (Roman, Reid, Chalfin, & amp; Knight 2009). Επιπλέον, ακόμη και αν ο επιτιθέμενος άφησε υλικό, υπάρχει υποβάθμιση του υλικού για 33 χρόνια μεταξύ της δολοφονίας του 1969 και της ανάλυσης το 2002. Η καλύτερη εκτίμηση που μπορούμε να βρούμε είναι ότι η πιθανότητα υποβάθμισης είναι περίπου στο μισό ( Wiser, 2011), και ο συνδυασμός αυτών των δύο αποδίδει μια τιμή 1/4. Ως εκ τούτου, θέσαμε Π(μιΜ|Η1) = .25.

Π(μιΜ|Η2): Ποια είναι η πιθανότητα αντιστοίχισης DNA κάτω από Η2, η υπόθεση μόλυνσης; Εδώ ρωτάμε ποια είναι η πιθανότητα αντιστοίχισης μέσω μόλυνσης. Η καλύτερη εκτίμηση που μπορούμε να τεκμηριώσουμε είναι 1 στις 1500 (Kloosterman et al. 2014). Περαιτέρω συζήτηση παρέχεται στους Wixted et al. (2018). Ως εκ τούτου, ορίζουμε (P (E_| H_ <2>) = 6,67 φορές 10^<-4> ).

Π(μιμικρό|Η1): Ποια είναι η πιθανότητα το δείγμα DNA να είναι από σάλιο κάτω Η1; Σε περίπου το 1/2 των σκηνών εγκλήματος μπορεί να ανακτηθεί το σάλιο του δράστη (Cross et al., 2014). Ως εκ τούτου, θέσαμε Π(μιμικρό|Η1) = .5.

Π(μιμικρό|Η2): Η πιθανότητα ότι το δείγμα DNA προέρχεται από σάλιο είναι 1,0 κάτω Η2 όπως είναι γνωστό ότι το δείγμα του Λάιτερμαν προήλθε από παρειακή μπατονέτα.

Π(μιμι|Η1): Το DNA του Leiterman βρέθηκε στα υλικά της σκηνής του εγκλήματος του Mixer, αλλά του Mixer όχι. Αυτό δεν είναι συχνό φαινόμενο. Σε μελέτες προσομοίωσης όπου τα ρούχα του θύματος βρίσκονται σε επαφή με έναν δράστη, περίπου το 85% των περιπτώσεων, το DNA του θύματος βρίσκεται σε μεγαλύτερες συγκεντρώσεις σε αυτό το ρούχο από το DNA του δράστη (Breathnach, Williams, McKenna, & amp Moore 2016). Ως εκ τούτου, θέσαμε Π(μιμι|Η1) = .15.

Π(μιμι|Η2): Σύμφωνα με το σενάριο μόλυνσης, είναι λογικό ότι η συγκέντρωση του Leiterman είναι μεγαλύτερη από αυτή του Mixer. Το DNA του Leiterman προέρχεται από ένα σκόπιμο στυλεό που έχει σχεδιαστεί για να μεγιστοποιήσει την πιθανότητα εξαγωγής ενός προφίλ. Με βάση την υπάρχουσα βιβλιογραφία, οι Wixted et al. συμπέρανε ότι ένα χαμηλότερο όριο σε Π(μιμι|Η2) = .575, μια τιμή που χρησιμοποιούμε εδώ.

Π(μιντο|Η1): Υπό Η1, δεν υπάρχει απαίτηση να αναλύονται ταυτόχρονα το DNA του Leiterman και του Mixer. Στην πραγματικότητα, φαίνεται ανησυχητικά συμπτωματικό υπό αυτήν την υπόθεση ότι ο Λάιτερμαν και ο Μίξερ, δύο άγνωστοι, συναντήθηκαν το 1969 και στη συνέχεια έγινε αλληλουχία του DNA τους ταυτόχρονα 33 χρόνια αργότερα. Πόσο πιθανό είναι η αλληλουχία τους ταυτόχρονα; Αυτή η πιθανότητα είναι δύσκολο να υπολογιστεί επειδή υπάρχει αυτό που είναι γνωστό ως πρόβλημα κλάσης αναφοράς (Hájek, 2007). Εκτιμούμε τις πιθανότητες ρωτώντας τη συχνότητα των γεγονότων από μια κλάση αναφοράς. Για παράδειγμα, σε αναστροφή νομισμάτων, μπορεί να εκτιμήσουμε μια πιθανότητα ρωτώντας πόσες επιτυχίες από την κλάση αναφοράς που είναι όλες αναστροφές. Μερικές φορές, ωστόσο, η κλάση αναφοράς δεν είναι προφανής και δεν είναι προφανής εδώ. Γνωρίζουμε πόσα δείγματα αλληλουχήθηκαν ταυτόχρονα με το Mixer's και αυτός ο αριθμός είναι 5000 αλλά από τι εξέρχεται, δηλαδή ποια είναι η κατάλληλη κατηγορία αναφοράς; Μια λογική κατηγορία αναφοράς είναι όλα τα άτομα που αναλύθηκαν στο ίδιο εργαστήριο πριν από το Mixer's άλλο είναι όλοι οι άνθρωποι αναλύθηκαν σε όλα τα εργαστήρια των ΗΠΑ πριν από το Mixer's και ένα τρίτο είναι όλοι οι άνθρωποι που αναλύθηκαν μέχρι σήμερα στο εργαστήριο του Μίσιγκαν ή σε όλα τα εργαστήρια των ΗΠΑΤο Η προσέγγισή μας είναι να χρησιμοποιήσουμε τη μικρότερη λογική κατηγορία αναφοράς για να μεγιστοποιήσουμε την πιθανότητα. Μια τέτοια μεγιστοποίηση είναι υπέρ της δίωξης καθώς αυξάνει την υπολογιζόμενη αξία της πιθανότητας ενοχής. Για το σκοπό αυτό, θεωρούμε την κατηγορία αναφοράς όλα τα άτομα των οποίων το DNA αναλύθηκε στο εργαστήριο του Michigan State πριν ή ταυτόχρονα με την ανάλυση του Mixer. Ο αριθμός των ατόμων σε αυτή τη μικρότερη λογική κατηγορία αναφοράς είναι 42.000 (Wixted et al., 2018) και, κατά συνέπεια, Π(μιντο|Η1) = 5000/42000 = .12

Π(μιντο|Η2): Σε περίπτωση μόλυνσης, η πιθανότητα σύγχρονης ανάλυσης πρέπει να είναι 1.0.

Υπολογισμοί

Συνδυάζοντας τις παραπάνω εξισώσεις αποδίδουμε:

Η αντικατάσταση των παραπάνω τιμών αποφέρει πιθανότητες ενοχής:

Και πάλι, οι πιθανότητες είναι περίπου 34 προς 1 υπέρ της αθωότητας.

Αυτές οι πιθανότητες ενοχής μπορεί να μετατραπούν σε πιθανότητα από την ισότητα Π = ο/(ο + 1), όπου Π είναι η πιθανότητα και ο είναι οι πιθανότητες. Σε αυτή την περίπτωση, η πιθανότητα ενοχής είναι περίπου 0,0283, ή λίγο λιγότερο από 3%.


Στατιστική Μοντελοποίηση, Αιτιολογική Συμπέρασμα και Κοινωνική Επιστήμη

Υποσχέθηκα ότι δεν θα κάνω κανένα νέο blogging μέχρι τον Ιανουάριο, αλλά ήμουν εδώ σε αυτό το συνέδριο και κάποιος μου έκανε μια ερώτηση σχετικά με την παραπάνω διαφάνεια από την ομιλία μου.

Το νόημα της ιστορίας σε εκείνη τη διαφάνεια είναι ότι οι επίπεδες προτεραιότητες δίνουν σταθερά κακά συμπεράσματα. Or, για να το θέσω αλλιώς, η συνηθισμένη χρήση επίπεδων προτεραιών οδηγεί σε κακές ιδιότητες συχνότητας σε ρεαλιστικές ρυθμίσεις όπου οι μελέτες είναι θορυβώδεις και τα μεγέθη των επιπτώσεων είναι μικρά. (Περισσότερα εδώ.)

Λέγοντάς τον έτσι, είναι προφανές: Οι μέθοδοι Bayes βαθμονομούνται αν έχετε μέσο όρο σε σχέση με το προηγούμενο. Εάν η κατανομή των μεγεθών των αποτελεσμάτων που υπολογίζετε κατά μέσο όρο δεν είναι η ίδια με την προηγούμενη κατανομή που χρησιμοποιούσατε στην ανάλυση, τα συμπεράσματά σας Bayes γενικά θα έχουν προβλήματα.

Όμως, όσο απλή και αν είναι αυτή η δήλωση, οι πρακτικές συνέπειες είναι τεράστιες, επειδή είναι τυπικό να χρησιμοποιείτε επίπεδες προτεραιότητες στην ανάλυση Bayesian (δείτε τα περισσότερα από τα παραδείγματα στα βιβλία μας!) ή τετραγωνίζει τουλάχιστον συμπεράσματα και τα ερμηνεύει Bayesianly, για παράδειγμα ερμηνεύοντας ένα διάστημα 95% που αποκλείει το μηδέν ως ισχυρή απόδειξη για το πρόσημο της υποκείμενης παραμέτρου.

Στο έγγραφό μας του 2000, “Type S ποσοστά σφαλμάτων για κλασικές και Bayesian διαδικασίες μονής και πολλαπλής σύγκρισης, ” ο Francis Tuerlinckx και εγώ το διατυπώσαμε από την άποψη των ερευνητών που κάνουν αξιώσεις “ με εμπιστοσύνη. ” Στις κλασικές στατιστικές, κάνετε αξίωση με εμπιστοσύνη στο πρόσημο εφέ εάν το διάστημα εμπιστοσύνης 95% εξαιρεί το μηδέν. Στα στατιστικά του Bayes, κάποιος μπορεί να κάνει συγκρίσιμο ισχυρισμό με σιγουριά αν το 95% οπίσθιο διάστημα δεν αποκλείει το μηδέν. Με μια επίπεδη προηγούμενη, αυτά τα δύο είναι τα ίδια. Αλλά με έναν προγενέστερο Bayes, είναι διαφορετικοί. Συγκεκριμένα, με τα κανονικά δεδομένα και ένα φυσιολογικό προηγούμενο κέντρο 0, το διάστημα Bayesian είναι πάντα πιο πιθανό να περιλαμβάνει μηδέν, σε σύγκριση με το κλασικό διάστημα, επομένως μπορούμε να πούμε ότι το συμπέρασμα Bayes είναι πιο συντηρητικό, καθώς είναι λιγότερο πιθανό να οδηγήσει σε αξιώσεις με αυτοπεποίθηση.

Ακολουθεί το σχετικό γράφημα από το χαρτί του 2000:

Αυτό το διάγραμμα δείχνει την πιθανότητα υποβολής αξίωσης με εμπιστοσύνη, ως συνάρτηση του λόγου διακύμανσης, με βάση το απλό μοντέλο:

Το πραγματικό εφέ theta προσομοιώνεται από το κανονικό (0, tau).
Τα δεδομένα y προσομοιώνονται από το κανονικό (θήτα, σίγμα).
Το κλασικό διάστημα 95% είναι y +/- 2*σίγμα
Bayesian 95% διάστημα είναι theta.hat.bayes +/- 2*theta.se.bayes,
όπου theta.hat.bayes = y * (1/sigma^2)/(1/sigma^2 + 1/tau^2)
και theta.se.bayes = sqrt (1/(1/sigma^2 + 1/tau^2))

Αυτό που είναι πραγματικά δροσερό εδώ είναι αυτό που συμβαίνει όταν το tau/sigma είναι κοντά στο 0, το οποίο θα μπορούσαμε να ονομάσουμε τομέα “ sychυχολογικής Επιστήμης ” ή “PPNAS ”. Σε αυτό το όριο, το κλασικό διάστημα έχει 5% πιθανότητες να εξαιρέσει το 0. Φυσικά, αυτό σημαίνει το διάστημα 95%: αν δεν υπάρχει αποτέλεσμα, έχετε 5% πιθανότητα να δείτε κάτι.

Αλλά . Το Το κοιτάξτε τη διαδικασία Bayesian. Εκεί, η πιθανότητα μιας αξίωσης με εμπιστοσύνη είναι ουσιαστικά 0 όταν το tau/sigma είναι χαμηλό. Αυτό είναι σωστό: σε αυτήν τη ρύθμιση, τα δεδομένα πολύ σπάνια παρέχουν αρκετές πληροφορίες για να καθορίσουν το σημάδι οποιουδήποτε αποτελέσματος. Αλλά αυτό μπορεί να είναι αντίθετο αν έχετε κλασική στατιστική εκπαίδευση: έχουμε συνηθίσει να ακούμε ποσοστό σφάλματος περίπου 5% που μπορεί να εκπλήξει να συνειδητοποιήσουμε ότι, αν κάνετε τα πράγματα σωστά, το ποσοστό υποβολής αξιώσεων με σιγουριά μπορεί να είναι πολύ λιγότερο.

Εμείς είναι υποθέτοντας εδώ ότι η προηγούμενη διανομή και το μοντέλο δεδομένων είναι σωστά —, δηλαδή, υπολογίζουμε τις πιθανότητες υπολογίζοντας κατά μέσο όρο τη διαδικασία δημιουργίας δεδομένων στο μοντέλο μας.

Πολλαπλές συγκρίσεις

Εντάξει, τι σχέση έχει αυτό με πολλές συγκρίσεις; Η συνήθης ανησυχία είναι ότι εάν κάνουμε πολλούς ισχυρισμούς με σιγουριά, μπορούμε να απομακρυνθούμε αν δεν κάνουμε κάποια διόρθωση. Και, πράγματι, με την κλασική προσέγγιση, εάν το tau/sigma είναι μικρό, θα εξακολουθείτε να διεκδικείτε αξιώσεις με εμπιστοσύνη στο 5% των περιπτώσεων και ένα μεγάλο μέρος αυτών των ισχυρισμών θα είναι σε λάθος κατεύθυνση (a “type S , ” ή σημάδι, σφάλμα) ή πολύ μεγάλο (α “τύπος Μ, ” ή μέγεθος, σφάλμα), σε σύγκριση με την υποκείμενη αλήθεια.

Με συμπεράσματα Bayes (και το σωστό προηγούμενο), όμως, αυτό το πρόβλημα εξαφανίζεται. Αρκετά εκπληκτικά, εσύ μην ’t πρέπει να διορθώσουν συμπεράσματα Bayes για πολλαπλές συγκρίσεις.

Έκανα μια επίδειξη στο R για να το δείξω, προσομοιώνοντας ένα εκατομμύριο συγκρίσεις και βλέποντας τι κάνει η μέθοδος Bayes.

Ακολουθεί το πρώτο μισό των αποτελεσμάτων:

Έτσι, όταν το tau είναι το μισό του σίγμα, η κλασική διαδικασία αποδίδει αξιώσεις με σιγουριά 7% του χρόνου. Οι εκτιμήσεις είναι τεράστιες (άλλωστε, πρέπει να είναι τουλάχιστον δύο τυπικά σφάλματα από το 0), πολύ υψηλότερες από τις υποκείμενες παραμέτρους. Και το 14% αυτών των ισχυρισμών με εμπιστοσύνη είναι σε λάθος κατεύθυνση.

Το επόμενο μισό της εξόδου δείχνει τα αποτελέσματα από τα διαστήματα Bayes:

Όταν το tau είναι το μισό του σίγμα, οι ισχυρισμοί Bayes με σιγουριά είναι εξαιρετικά σπάνιοι. Όταν εκεί είναι ένας Bayesian ισχυρισμός με εμπιστοσύνη, θα είναι μεγάλος --- αυτό έχει νόημα το οπίσθιο τυπικό σφάλμα είναι sqrt (1/(1/1 + 1/.5^2)) = 0,45, και έτσι κάθε οπίσθιο μέσο που αντιστοιχεί σε ένα Bayesian αξίωση με εμπιστοσύνη εδώ θα πρέπει να είναι τουλάχιστον 0,9. Ο μέσος όρος για αυτές τις εκατομμύρια συγκρίσεις αποδεικνύεται ότι είναι 0,94.

Λοιπόν, προσέξτε τα εφέ επιλογής! Αλλά όχι, καθόλου. Αν δούμε το υποκείμενο αληθινά αποτελέσματα που αντιστοιχούν σε αυτούς τους ισχυρισμούς με σιγουριά, αυτοί έχουν μέσο όρο 0,97 (σε αυτήν την προσομοίωση σε άλλες προσομοιώσεις ενός εκατομμυρίου συγκρίσεων, παίρνουμε μέσα όπως 0,89 ή 1,06). Και πολύ λίγα από αυτά είναι πράγματι σε λάθος κατεύθυνση, με αρκετές προσομοιώσεις θα βρείτε ένα ποσοστό σφάλματος τύπου S λίγο μικρότερο από 2,5% που είναι αυτό που θα περίμενε κανείς, δεδομένου ότι αυτά τα 95% οπίσθια διαστήματα εξαιρούν το 0, οπότε κάτι λιγότερο από το 2,5% του διαστήματος θα είναι λάθος πρόσημο.

Έτσι, η διαδικασία Bayesian πολύ σπάνια κάνει αξίωση με σιγουριά. Αλλά, όταν συμβαίνει, συνήθως μαζεύει κάτι πραγματικό, μεγάλο και προς τη σωστή κατεύθυνση.

Στη συνέχεια τρέξαμε ξανά με το tau = 1, έναν κόσμο στον οποίο η τυπική απόκλιση των πραγματικών αποτελεσμάτων είναι ίση με το τυπικό σφάλμα των εκτιμήσεων:

Οι κλασικές εκτιμήσεις παραμένουν πολύ υψηλές, κατά μέσο όρο περίπου διπλάσιες από τα πραγματικά μεγέθη εφέ, η διαδικασία Bayesian είναι πιο συντηρητική, με λιγότερους ισχυρισμούς με σιγουριά και όχι υπερεκτίμηση μεγεθών επίδρασης.

Ο Bayes τα καταφέρνει καλύτερα επειδή χρησιμοποιεί περισσότερες πληροφορίες

Δεν πρέπει να εκπλαγούμε από αυτά τα αποτελέσματα. Η διαδικασία Bayesian χρησιμοποιεί περισσότερες πληροφορίες και έτσι μπορεί να εκτιμήσει καλύτερα τα μεγέθη των αποτελεσμάτων.

Αλλά αυτό μπορεί να φαίνεται σαν πρόβλημα: τι γίνεται αν αυτές οι προηγούμενες πληροφορίες για το θήτα δεν είναι διαθέσιμες; Έχω δύο απαντήσεις. Πρώτον, σε πολλές περιπτώσεις, κάποιες προηγούμενες πληροφορίες είναι διαθέσιμος. Δεύτερον, εάν έχετε πολλές συγκρίσεις, μπορείτε να χωρέσετε ένα πολυεπίπεδο μοντέλο και να εκτιμήσετε το tau. Έτσι, αυτό που μπορεί να μοιάζει με τα χειρότερα προβλήματα πολλαπλών συγκρίσεων δεν είναι τόσο άσχημο.

Κάποιος θα πρέπει επίσης να είναι σε θέση να λάβει συγκρίσιμα αποτελέσματα μη-Bayesianly καθορίζοντας ένα κατώφλι έτσι ώστε να ελέγχεται το ποσοστό σφάλματος τύπου S. Το κλειδί είναι να προχωρήσουμε πέρα ​​από το ψευδώς θετικό, ψευδώς αρνητικό πλαίσιο, να θέσουμε τους στόχους της εκτίμησης του σημείου και των μεγεθών των θετών και όχι να πλαισιώσουμε τα πράγματα με βάση την μη ρεαλιστική και μη ενδιαφέρουσα υπόθεση theta = 0.


Περιορισμοί και βελτιστοποιήσεις

Η βελτιστοποίηση του συμπεράσματος Bayes εξαρτάται από το υποτιθέμενο μοντέλο. Οι πιθανολογίες του Bayesian βαθμονομούνται ως μακροπρόθεσμοι μέσοι όροι εάν οι παράμετροι αντλούνται από την προηγούμενη κατανομή και τα δεδομένα αντλούνται από το μοντέλο των δεδομένων με αυτές τις παραμέτρους. Γεγονότα με δηλωμένη πιθανότητα συμβαίνουν σε αυτήν τη συχνότητα μακροπρόθεσμα, όταν ο μέσος όρος είναι πάνω στο γεννητικό μοντέλο. Στην πράξη, τα μοντέλα μας δεν είναι ποτέ σωστά. Υπάρχουν δύο τρόποι με τους οποίους θα θέλαμε να ξεπεράσουμε αυτόν τον περιορισμό: εντοπίζοντας και διορθώνοντας προβλήματα με το μοντέλο και αποδεικνύοντας ότι ορισμένα συμπεράσματα είναι ισχυρά για λογικές αποκλίσεις από το μοντέλο.

Ακόμα και οι απλούστερες και πιο αποδεκτές συμπεράσματα του Bayes μπορούν να έχουν σοβαρούς περιορισμούς. Για παράδειγμα, ας υποθέσουμε ότι διεξάγεται ένα πείραμα που δίνει μια αμερόληπτη εκτίμηση z μιας παραμέτρου θ που αντιπροσωπεύει το αποτέλεσμα κάποιας θεραπείας. Αν αυτή η εκτίμηση z κανονικά κατανέμεται με τυπικό σφάλμα μικρό, μπορούμε να γράψουμε z

Ν(θ, μικρό 2), μια κανονική κατανομή που παραμετροποιείται από την παράμετρο θέσης και κλίμακας. Υποθετω πως θ έχει μια επίπεδη ομοιόμορφη προηγούμενη κατανομή, τότε η οπίσθια κατανομή είναι θ

Ν(z, μικρό 2). Τώρα ας υποθέσουμε ότι παρατηρούμε z = μικρό δηλαδή, η εκτίμηση του θ είναι ένα τυπικό σφάλμα από το μηδέν. Αυτό θα θεωρηθεί στατιστικά αδιάκριτο από το θόρυβο, με την έννοια ότι μια τέτοια εκτίμηση θα μπορούσε να συμβεί τυχαία, ακόμη και αν η πραγματική τιμή παραμέτρου ήταν μηδέν. Αλλά ο υπολογισμός Bayes δίνει μια μετέπειτα πιθανότητα Pr (θ & gt 0 |z) = 0,84. Αυτό καθιστά αμφισβητήσιμη τη βαθμονόμηση της πιθανότητας (βαθμονομημένα συμπεράσματα ή προβλέψεις είναι σωστά κατά μέσο όρο, υπό όρους από την πρόβλεψη).

Σε αυτό το παράδειγμα, η πιθανότητα βαθμονομείται εάν έχετε μέσο όρο έναντι του προηγούμενου. Είναι μαθηματικά αδύνατο να γίνει ο μέσος όρος για μια ομοιόμορφη κατανομή σε ένα άπειρο εύρος, αλλά θα μπορούσαμε να εξετάσουμε μια πολύ διάχυτη προηγούμενη, για παράδειγμα θ

Ν(0, 1.000 2), όπου υποθέτουμε ότι μικρό είναι κατά προσέγγιση σε κλίμακα μονάδας, είναι δηλαδή μια παράμετρος χωρίς διάσταση που αναμένεται να λάβει μια τιμή όχι πολύ μακριά από μία σε απόλυτη τιμή. Με αυτό το μοντέλο, όταν z παρατηρείται ίσο μικρό, η παράμετρος θ θα είναι θετική περίπου στο 84% των περιπτώσεων. Ο λόγος για τον οποίο η πιθανότητα 84% δεν φαίνεται σωστή είναι ότι η στολή, ή πολύ διάχυτη, προηγουμένως δεν φαίνεται γενικά κατάλληλη. Στην πράξη, οι μελέτες έχουν σχεδιαστεί για να εκτιμούν τα αποτελέσματα της θεραπείας με ένα λογικό επίπεδο ακρίβειας. Τα πραγματικά εφέ μπορεί να είναι 1 ή 2 τυπικά σφάλματα από το 0, αλλά σπάνια απέχουν 5, 10 ή 100 τυπικά σφάλματα. Σε αυτό το παράδειγμα, το συμπέρασμα Bayes, αν ληφθεί κυριολεκτικά, θα οδηγούσε σε υπερβολική βεβαιότητα: μια 84% πίσω πιθανότητα.Ωστόσο, ένας θετικός τρόπος για να το δούμε αυτό είναι ότι το προφανές πρόβλημα με το πίσω μέρος μας επέτρεψε να αναγνωρίσουμε ότι υπήρχαν διαθέσιμες προηγούμενες πληροφορίες που δεν είχαμε συμπεριλάβει στο μοντέλο μας, σε αυτήν την περίπτωση, προηγούμενες πληροφορίες που είναι απίθανο να δούμε πολύ μεγάλες αξίες του θΤο Επιπλέον, ένα ασθενώς ενημερωτικό προηγούμενο όπως π.χ. θ

Ν(0, μικρό 2) δεν έχει μεγάλη επίπτωση στο οπίσθιο, καθώς τότε το οπίσθιο γίνεται φυσιολογικό:

έτσι Pr (θ & gt 0 |z) = 0,76, σε σύγκριση με 0,84 από το προηγούμενο παράδειγμα μας. Τελικά, μόνο μια ισχυρή προτεραιότητα θα κάνει τη μεγάλη διαφορά. Οι πιθανότητες Bayes βαθμονομούνται μόνο όταν υπολογίζονται οι μέσοι όροι επί της πραγματικής προηγούμενης ή πληθυσμιακής κατανομής των παραμέτρων. Το σημαντικό σε αυτό το παράδειγμα δεν είναι οι συγκεκριμένοι αριθμοί, οι οποίοι θα εξαρτηθούν από το πλαίσιο, αλλά η ιδέα ότι κάθε στατιστική μέθοδος θα πρέπει να αξιολογηθεί στο εύρος των προβλημάτων στα οποία θα εφαρμοστεί.

Γενικότερα, τα μοντέλα Bayes μπορούν να ελεγχθούν συγκρίνοντας τις προηγούμενες προσομοιώσεις πρόβλεψης με τα δεδομένα 135 και με την εκτίμηση του προγνωστικού σφάλματος εκτός δείγματος 202. Υπάρχει ένα όφελος από τις ισχυρές προηγούμενες διανομές που περιορίζουν τις παραμέτρους σε λογικές τιμές ώστε να επιτρέπεται η συμπερίληψη περισσότερων δεδομένων, ενώ αποφεύγεται η υπερπροσαρμογή. Περισσότερα δεδομένα μπορούν να προέλθουν από διάφορες πηγές, συμπεριλαμβανομένων πρόσθετων σημείων δεδομένων, πρόσθετων μετρήσεων στα υπάρχοντα δεδομένα και προηγούμενων πληροφοριών που συνοψίζουν άλλα δεδομένα ή θεωρίες. Όλες οι μέθοδοι, Bayesian και άλλες, απαιτούν υποκειμενική ερμηνεία για να πούμε μια αληθοφανή ιστορία και όλα τα μοντέλα προέρχονται από αποφάσεις ερευνητών. Οποιαδήποτε επιλογή μοντέλου έχει συνέπειες ότι το επίπεδο προηγούμενο είναι ασθενές, δεν παρέχει συρρίκνωση της εκτίμησης, αλλά μπορεί να οδηγήσει σε ένα ισχυρό, πιθανώς ακατάλληλο, επίπεδο βεβαιότητας για θ.


Κάνοντας ανάλυση δεδομένων Bayesian

Ένα νέο άρθρο στο Psychological Science † επισημαίνει σωστά τα ελαττώματα Π αξιών και διαδικασιών που προκαλούν προκατάληψη στην επιλογή και ανάλυση δεδομένων. Το άρθρο βγάζει αρκετά λογικά συμπεράσματα. Δυστυχώς, βγάζει επίσης δύο λανθασμένα συμπεράσματα για θέματα θεμελιώδους σημασίας με σημαντικές επιπτώσεις.

Ένα συμπέρασμα είναι ότι Π οι τιμές είναι εντάξει, αλλά πρέπει να διορθωθούν για να σταματήσει η πρόθεση του ερευνητή. Διαψεύδω αυτόν τον ισχυρισμό με αναγωγικό και παράλογο. Ένα δεύτερο συμπέρασμα είναι ότι η ανάλυση Bayes είναι μια «μη λύση» στο πρόβλημα των ερευνητών που έχουν πάρα πολύ χώρο. Αμφισβητώ αυτόν τον ισχυρισμό διευκρινίζοντας ποια προβλήματα μπορεί ή δεν μπορεί να αντιμετωπίσει οποιαδήποτε μέθοδος ανάλυσης, αρνούμενη την ευελιξία που αποδίδεται στην ανάλυση Bayes και η οποία δεν είναι πραγματικά διαθέσιμη, και διεκδικώντας την πραγματική ευελιξία στην ανάλυση Bayes ως σημαντικό πλεονέκτημα για την επιστημονική έρευνα.

Το πρώτο θέμα πηγάζει από το γεγονός, που σωστά επισημάνθηκε στο άρθρο, ότι Π οι τιμές εξαρτώνται από την πρόθεση διακοπής του συλλέκτη δεδομένων. Ιδού η ιδέα. Ας υποθέσουμε ότι ένας ερευνητής συλλέγει κάποια δεδομένα και υπολογίζει μια συνοπτική στατιστική, όπως π.χ. τ ή φά ή χ 2. ο Π τιμή είναι η πιθανότητα του παρατηρηθέντος στατιστικού, ή μια τιμή πιο ακραία, στο χώρο των πιθανών δεδομένων που θα μπορούσαν να είχαν ληφθεί εάν η μηδενική υπόθεση ήταν αληθινή και το επιδιωκόμενο πείραμα επαναλαμβανόταν άπειρα. Ο χώρος των πιθανών δεδομένων που μπορεί να έχουν ληφθεί εξαρτάται από την πρόθεση διακοπής. Έτσι, εάν ο συλλέκτης δεδομένων σκόπευε να σταματήσει όταν το μέγεθος δείγματος Ν έφτασε σε έναν συγκεκριμένο αριθμό, όπως 23, τότε ο χώρος των πιθανών δεδομένων περιλαμβάνει όλα τα σύνολα δεδομένων για τα οποία N = 23. Αλλά αν ο συλλέκτης δεδομένων σκόπευε να σταματήσει στο τέλος της εβδομάδας (και μόλις έτυχε να πάρει N = 23), τότε ο χώρος των πιθανών δεδομένων περιλαμβάνει όλα τα σύνολα δεδομένων που θα μπορούσαν να είχαν συλλεχθεί μέχρι το τέλος της εβδομάδας, μερικά από τα οποία έχουν Ν = 23, και μερικά από τα οποία έχουν μικρότερο Ν ή μεγαλύτερο Ν. Επειδή οι δύο χώροι των πιθανών συνόλων δεδομένων δεν είναι οι ίδιοι, το Π οι τιμές δεν είναι ίδιες. ο Π η αξία μπορεί να εξαρτηθεί δραματικά από την πρόθεση διακοπής. Για παράδειγμα, εάν ο ερευνητής σκόπευε να σταματήσει όταν N = 100 αλλά διακόπηκε απροσδόκητα όταν N = 23, το Π η τιμή είναι πολύ μικρότερη από ό, τι αν η πρόθεση ήταν να σταματήσει όταν N = 23. Or, εάν ο ερευνητής σκόπευε να σταματήσει όταν Ν = 23 αλλά έλαβε μια απροσδόκητη απροσδόκητη πληροφορία ώστε Ν = 100, ίσως επειδή εμφανίστηκε ένας νέος εθελοντής βοηθός, τότε το Π η τιμή είναι πολύ μεγαλύτερη από ό, τι αν ο ερευνητής σκόπευε να σταματήσει στο Ν = 100. Επομένως, για τον σωστό προσδιορισμό του Π αξία για ένα σύνολο δεδομένων, πρέπει να γνωρίζουμε τον λόγο που σταμάτησε η συλλογή δεδομένων.

Ακολουθεί ένα παράδειγμα σωστής χρήσης του Π αξίες. Ένας διευθυντής εργαστηρίου έχει κάποια έρευνα στο μυαλό και αποφασίζει ότι το N = 30 είναι επαρκές. Ο διευθυντής λέει στον διαχειριστή του εργαστηρίου να συλλέξει δεδομένα από 30 άτομα. Ο διαχειριστής γνωρίζει ότι το εργαστήριο συνήθως στρατολογεί περίπου 30 άτομα σε μια εβδομάδα και επομένως λέει στον βοηθό συλλογής δεδομένων να εκτελεί θέματα για μια εβδομάδα. Ο βοηθός συλλέγει τακτικά τα δεδομένα και στο τέλος της εβδομάδας ο διευθυντής του εργαστηρίου τυχαίνει να είναι παρών καθώς συλλέγεται το τελευταίο στοιχείο, το οποίο τυχαίνει να είναι N = 30. Όσο μπορεί να πει ο διευθυντής του εργαστηρίου, η συλλογή δεδομένων σταμάτησε σκόπιμα όταν Ν = 30. Όταν ο διευθυντής του εργαστηρίου αναλύει τα δεδομένα, με την πρόθεση να σταματήσει όταν N = 30, ένα συγκεκριμένο Π υπολογίζεται η τιμή. Αλλά όταν ο βοηθός αναλύσει τα δεδομένα, με την πρόθεση να σταματήσει στο τέλος της εβδομάδας, α διαφορετικός Π υπολογίζεται η τιμή. Στην πραγματικότητα, για τον διευθυντή του εργαστηρίου Π& lt.05, αλλά για τον βοηθό Π& gt.05. Οι οποίες Π η τιμή είναι σωστή; Είναι τα αποτελέσματα «σημαντικά»;

Εδώ είναι ένα άλλο παράδειγμα της σωστής χρήσης του Π αξίες. Δύο ανταγωνιστικά εργαστήρια ακολουθούν τον ίδιο τύπο έρευνας σε ένα καλά εδραιωμένο πειραματικό παράδειγμα. Τα δύο εργαστήρια έχουν ανεξάρτητα την ίδια ιδέα για πανομοιότυπο σχέδιο πειράματος και οι ερευνητές συλλέγουν δεδομένα. Σε ένα εργαστήριο, σκοπεύουν να συλλέξουν δεδομένα για μια εβδομάδα και τυχαίνει να πάρουν N = 30. Στο άλλο εργαστήριο, σκοπεύουν να σταματήσουν τη συλλογή δεδομένων όταν Ν = 30. Επιπλέον, τυχαία, τα δεδομένα στα δύο εργαστήρια τυγχάνουν πανομοιότυπα. (Αυτό δεν είναι τόσο αποδεκτό π.χ. Π τιμές για τα πανομοιότυπα σύνολα δεδομένων τους. Τα δύο Π οι τιμές είναι διαφορετικές επειδή τα δεδομένα συλλέχθηκαν με διαφορετικές προθέσεις διακοπής στην πραγματικότητα Π& lt.05 για ένα εργαστήριο αλλά Π& gt.05 για το άλλο εργαστήριο. Ποιο εργαστήριο έλαβε "σημαντικά" δεδομένα;

Το πρόβλημα είναι ότι τα δεδομένα δεν φέρουν καμία υπογραφή της πρόθεσης διακοπής του ερευνητή. Πράγματι, οι ερευνητές βάζουν τα πάντα για να βεβαιωθούν ότι τα δεδομένα δεν επηρεάζονται από την πρόθεσή τους να σταματήσουν. Κάθε δεδομένο που συλλέγεται υποτίθεται ότι είναι πλήρως απομονωμένο από τυχόν δεδομένα που συλλέγονται πριν ή μετά. Το τελευταίο δεδομένο που συλλέχθηκε δεν έχει ίχνος ότι ήταν το τελευταίο ή το πρώτο ή οποιαδήποτε ενδιάμεση θέση.

Όχι μόνο η πρόθεση είναι αδιαφανής για τα δεδομένα, είναι συχνά αδιαφανής για τον ερευνητή. Οι συνεργάτες σε ένα έργο μπορεί να έχουν διαφορετικές προθέσεις δειγματοληψίας (όπως στο παράδειγμα του σκηνοθέτη και του βοηθού, παραπάνω). Or η πρόθεση δειγματοληψίας μπορεί να αλλάξει στα μέσα της συλλογής δεδομένων. ("Ας συλλέξουμε N = 100." Στη συνέχεια, το απόγευμα της Παρασκευής, "Λοιπόν, έχουμε N = 94, αυτό είναι αρκετά καλό.") Or, όπως συμβαίνει συχνά, ορισμένα θέματα πρέπει να διαγραφούν από το σύνολο δεδομένων λόγω διαδικαστικών σφάλματα ή αδυναμία απάντησης, παρά την πρόθεση του συλλέκτη δεδομένων σχετικά με το μέγεθος του δείγματος ή τον χρόνο διακοπής. Όλες αυτές είναι πολύ ρεαλιστικές διαδικασίες δειγματοληψίας και τις ανεχόμαστε επειδή γνωρίζουμε ότι τα δεδομένα δεν επηρεάζονται εντελώς από την πρόθεση του ερευνητή.

Επομένως, είναι περίεργο ότι η ερμηνεία των δεδομένων ως προς Π οι τιμές θα πρέπει να εξαρτώνται καθοριστικά από κάτι που δεν έχει αντίκτυπο στα δεδομένα, δηλαδή την πρόθεση διακοπής. Όμως, ο σωστός υπολογισμός του Π οι τιμές εξαρτώνται από την πρόθεση διακοπής.

Λοιπόν, τι πρέπει να γίνει για αυτό το πρόβλημα; Λαμβάνοντας υπόψη τα παραπάνω παραδείγματα, φαίνεται σαφές ότι πρέπει να αντιμετωπίσουμε Π τιμές ως εγγενώς κακώς καθορισμένες επειδή εξαρτώνται από προθέσεις που δεν έχουν σημασία για τα δεδομένα.

Αλλά εδώ είναι η #1 σύσταση από το νέο άρθρο στην ologicalυχολογική Επιστήμη:

Πιθανώς αυτή η απαίτηση δηλώνεται έτσι ώστε οι ερευνητές να μπορούν να χρησιμοποιήσουν τον κανόνα διακοπής για να υπολογίσουν το αληθινό και σωστό Π αξία, καθορισμένη κατάλληλα για τις ιδιόρρυθμες προθέσεις των ερευνητών. Εδώ είναι ένα εύλογο παράδειγμα. "Αποφασίσαμε να συλλέξουμε 100 παρατηρήσεις, αλλά μέχρι την Παρασκευή είχαμε 94 και καταλήξαμε ότι ήταν αρκετά κοντά, οπότε σταματήσαμε και στη συνέχεια έπρεπε να διαγράψουμε 5 άτομα λόγω μεταγενέστερων ανακαλυφθέντων σφαλμάτων μεταγραφής. Μια μετα-πειραματική έρευνα της ομάδας του εργαστηρίου αποκάλυψε ότι ένας από τους βοηθούς μας σκόπευε να εγκαταλείψει τη δουλειά τη Δευτέρα, γεγονός που θα περιόριζε τη συλλογή δεδομένων μας αν δεν είχαμε αποφασίσει να σταματήσουμε την Παρασκευή. Επομένως, εκτελώντας μια μεγάλη προσομοίωση του Μόντε Κάρλο που ενσωμάτωσε το εκτιμώμενο ποσοστό πρόσληψης ατόμων κατά τη διάρκεια της εβδομάδα, και την εκτιμώμενη πιθανότητα να αποφασίσουμε να σταματήσουμε την Παρασκευή για διαφορετικές τιμές Ν που επιτεύχθηκε την Παρασκευή, και την εκτιμώμενη πιθανότητα σφάλματος μεταγραφής και την πιθανότητα να αποχωρήσει ένας βοηθός τη Δευτέρα, προσδιορίσαμε ότι Π=. "

Για να διευκολύνει την αναφορά αληθινών και σωστών Π θα ήταν εξαιρετικά χρήσιμο να υπάρχουν κρίσιμες τιμές για στατιστικά που χρησιμοποιούνται συνήθως (τ, φάκ.λπ.) υπό διάφορες τυπικές προθέσεις διακοπής που υιοθετούν οι ερευνητές. Όλες οι κρίσιμες αξίες στα σύγχρονα βιβλία και προγράμματα υπολογιστών υποθέτουν την μη ρεαλιστική σύμβαση ότι το Ν είχε καθοριστεί εκ των προτέρων. Αντ 'αυτού, θα πρέπει να έχουμε πίνακες κρίσιμων τιμών για διακοπή μετά από μια ορισμένη διάρκεια, με ποικιλία ποσοστών δειγματοληψίας κατά τη διάρκεια αυτού του διαστήματος. (Στην πραγματικότητα, έχω ήδη σπείρει αυτήν τη διαδικασία με ένα παράδειγμα σε αυτό το άρθρο.) Ως εκ τούτου, οι ερευνητές θα μπορούσαν να αποκτήσουν το αληθινό Π τιμές για τα δεδομένα τους, εάν σκόπευαν να σταματήσουν μετά από μια συγκεκριμένη διάρκεια.

Θα ήταν επίσης χρήσιμο να υπάρχουν συντελεστές διόρθωσης για απροσδόκητες διακοπές στη συλλογή δεδομένων ή απρόσμενες εκπτώσεις της συλλογής δεδομένων. Ο ερευνητής θα έπρεπε απλώς να εισαγάγει το προβλεπόμενο μέγεθος δείγματος και την πιθανότητα διακοπής ή αύξησης (και την πιθανότητα κάθε μεγέθους αύξησης) οποιαδήποτε στιγμή κατά τη συλλογή δεδομένων και ο συντελεστής διόρθωσης θα παρήγαγε το αληθινό και σωστό Π αξία για τα δεδομένα.

Οι ομοσπονδιακοί οργανισμοί χρηματοδότησης ήταν ιδιαίτερα πρόθυμοι το τελευταίο διάστημα να υποστηρίξουν τις συνεργατικές προσπάθειες ομάδων ερευνητών. Είναι πιθανό ότι διαφορετικά μέλη της ομάδας μπορεί να έχουν διαφορετικές προθέσεις σχετικά με τη συλλογή δεδομένων (ίσως κρυφά ή υποσυνείδητα, αλλά πάντως φυλάσσονται). Επομένως, θα ήταν εξαιρετικά χρήσιμο να δημιουργηθούν πίνακες με πραγματικές και σωστές κρίσιμες τιμές για περιπτώσεις παράλληλων μικτών προθέσεων, όταν ο ένας συνεργάτης σκοπεύει να σταματήσει σε ένα σταθερό μέγεθος δείγματος και ο άλλος συνεργάτης σκοπεύει να σταματήσει στο τέλος της εβδομάδας. Σαφώς, η κατασκευή αυτών των πινάκων θα πρέπει να αποτελεί σημαντική χρηματοδοτική προτεραιότητα για τους οργανισμούς χορηγίας.

Ανυπομονώ για μια νέα βιομηχανία εκδόσεων που θα αποκαλύψει κατάλληλες διορθώσεις για διαφορετικές προθέσεις δειγματοληψίας. Ευτυχώς, έχουμε ήδη ένα μοντέλο αυτής της βιομηχανίας στην εκτενή βιβλιογραφία σχετικά με τη διόρθωση ψευδών συναγερμών σε πολλές συγκρίσεις. Ανάλογα με τους τύπους των προβλεπόμενων συγκρίσεων, και εάν οι προθέσεις είναι προγραμματισμένες ή εκ των υστέρων, έχουμε μια σωρεία διορθώσεων για κάθε πιθανό σύνολο προβλεπόμενων συγκρίσεων. Δυστυχώς, όλες αυτές οι διορθώσεις για πολλαπλές συγκρίσεις βασίστηκαν στην υπόθεση δειγματοληψίας ότι η συλλογή δεδομένων σταμάτησε σε σταθερό μέγεθος δείγματος! Επομένως, κάθε μία από τις διορθώσεις για πολλαπλές συγκρίσεις θα πρέπει να επαναληφθεί για διαφορετικές προθέσεις διακοπής. Θα είναι μια μεγάλη μέρα για την επιστήμη όταν έχουμε ένα πλήρες σύνολο διορθώσεων για όλες τις διάφορες προθέσεις σχετικά με πολλαπλές συγκρίσεις και προθέσεις σχετικά με τη διακοπή της συλλογής δεδομένων, γιατί τότε θα γνωρίζουμε την αλήθεια και τη σωστή Π τιμές για τα δεδομένα μας, τα οποία ήταν εντελώς απομονωμένα από αυτές τις προθέσεις.

Ωχ! Συγγνώμη, έπεσα στον σαρκασμό. Αλλά γεια, είναι δικό μου blogΤο Πρέπει να επαναλάβω ότι συμφωνώ με πολλά από τα σημεία που έκαναν οι συντάκτες του άρθρου της ologicalυχολογικής Επιστήμης. Απλά δεν είναι το θέμα Π αξίες και διακοπή προθέσεων. Και ένα ακόμη σημείο, σχετικά με μια διαφορετική μέθοδο ανάλυσης που οι συγγραφείς απέρριψαν ως "μη λύση". Ακολουθεί το σχετικό απόσπασμα:

Είναι σημαντικό να είναι σαφές ότι η στατιστική ανάλυση οποιουδήποτε είδους μπορεί να ασχοληθεί μόνο με τα δεδομένα που παρέχει. Εάν ο σχεδιασμός και η διαδικασία συγκεντρώσουν προκατειλημμένα δεδομένα, καμία ανάλυση δεν μπορεί να αναιρέσει πλήρως αυτήν την προκατάληψη. Σκουπίδια μέσα, σκουπίδια έξω. Εάν το πρόβλημα "πάρα πολλών ελευθεριών ερευνητών" πηγάζει από προβλήματα σχεδιασμού και διαδικασίας, τότε χρειάζεται λύσεις σχεδιασμού και διαδικασίας. Το να πούμε ότι η ανάλυση Bayes είναι μια μη λύση σε ένα πρόβλημα σχεδιασμού και διαδικασίας είναι σαν να λέμε ότι ένας μύλος κρέατος είναι μια μη λύση για το κατεστραμμένο κρέας (και ότι επομένως ο μύλος κρέατος είναι άχρηστος) (και αφήνοντας τον αναγνώστη να κάνει το άλμα ότι επομένως ο μύλος κρέατος είναι άχρηστος). 1

Οι συγγραφείς υποστηρίζουν ότι η ανάλυση Bayes "αυξάνει τους βαθμούς ελευθερίας των ερευνητών" (και ως εκ τούτου είναι κακή) με δύο τρόπους. Πρώτον, "προσφέρει ένα νέο σύνολο αναλύσεων (επιπλέον όλων των συχνών)". Η σιωπηρή υπόθεση αυτής της δήλωσης φαίνεται να είναι ότι οι ερευνητές θα δοκίμαζαν συχνές και Bayesian προσεγγίσεις και θα αναφέρουν απλώς αυτήν που έδωσε το πιο κολακευτικό συμπέρασμα. Όχι, αυτό δεν θα πετάξει. Οι αναλύσεις Bayes παρέχουν τις πληρέστερες συμπερασματικές πληροφορίες με δεδομένα τα δεδομένα (με την κανονιστική μαθηματική έννοια) και οι αναλυτές δεν μπορούν απλώς να μπουν σε συχνότητα επειδή είναι κολακευτικό. Στην πραγματικότητα, η αναφορά α Π η αξία είναι ντροπιαστική, όχι κολακευτική, γιατί Π οι τιμές δεν έχουν καθοριστεί σωστά.

Δεύτερον, λένε οι συγγραφείς, "οι στατιστικές Bayes απαιτούν πρόσθετες κρίσεις (π.χ. η προηγούμενη διανομή)." Α, ο ασταμάτητος άντρας των προγόνων είναι τρομαγμένος για να τρομάξει τα παιδιά, λες και οι πρόγονοι μπορούν να προσαρμοστούν ιδιότροπα σε οτιδήποτε θέλει ο αναλυτής (εισάγετε εδώ ήχους από τρελό, πονηρό γέλιο) και έτσι προκαθορίζουν το συμπέρασμα. Στην πραγματικότητα, οι προτεραιότητες είναι εμφανείς και ρητά αποδεκτές σε ένα σκεπτικό επιστημονικό κοινό. Συνήθως, είναι μη δεσμευτικοί έτσι ώστε να έχουν ελάχιστη επιρροή στην μετέπειτα κατανομή. Όταν υπάρχει σημαντική προηγούμενη έρευνα για την ενημέρωση ενός προηγούμενου, τότε ένα ισχυρό προηγούμενο μπορεί να δώσει μεγάλη συμπερασματική μόχλευση σε μικρά δείγματα. Και δεν η χρήση ισχυρών προηγούμενων πληροφοριών όταν είναι διαθέσιμες μπορεί να είναι σοβαρή γκάφα, εξετάστε τυχαίες δοκιμές φαρμάκων και διάγνωση ασθενειών, οι οποίες πρέπει να λαμβάνουν υπόψη τα βασικά ποσοστά, δηλαδή τα προγενέστερα.

Στην πραγματικότητα, η Bayesian ανάλυση δίνει στους αναλυτές περισσότερη ευελιξία από την παραδοσιακή συχνή ανάλυση. Δίνει στον αναλυτή την ευελιξία να χρησιμοποιήσει ένα μοντέλο που περιγράφει πραγματικά τις τάσεις και τις κατανομές που παρουσιάζονται στα δεδομένα, αντί να είναι κορνίζες σε γραμμικά μοντέλα και κανονικές κατανομές που μπορεί να έχουν μικρή ομοιότητα με τα δεδομένα. (Φυσικά, αν ο αναλυτής θέλει γραμμικά μοντέλα με κανονικές κατανομές, η Bayesian ανάλυση παρέχει το πιο πλούσιο δυνατό συμπέρασμα σχετικά με τις παραμέτρους τους χωρίς να υπολογίσει ποτέ Π ). Με την ανάλυση Bayes, οι ερευνητές μπορούν πραγματικά να λάβουν χρήσιμες παραμετρικές περιγραφές πολύπλοκων δεδομένων, που περιλαμβάνουν μη γραμμικά μοντέλα πολλαπλών επιπέδων με μη φυσιολογικές κατανομές σε διάφορα επίπεδα σε όλο το μοντέλο. Αυτή είναι η ευελιξία που χρειάζεται η επιστημονική θεωρητικοποίηση.


† Simmons, J. P., Nelson, L. D., & amp Simonsohn, U. (2011). Falευδώς θετική ψυχολογία: Η αδιευκρίνιστη ευελιξία στη συλλογή και ανάλυση δεδομένων επιτρέπει την παρουσίαση οτιδήποτε ως σημαντικό. Psychυχολογική Επιστήμη, πρωτοδημοσιεύτηκε online 17 Οκτωβρίου 2011. DOI: 10.1177/0956797611417632

1 Αναθεώρηση στην παραθετική παρατήρηση που έγινε στις 23 Οκτωβρίου 2011, ως απάντηση στην προσωπική επικοινωνία του Uri Simonsohn. Η έκδοση Struck-out ήταν στην αρχική δημοσίευση, η οποία θα μπορούσε κατά λάθος να ερμηνευτεί ως δήλωση ότι οι ίδιοι οι συγγραφείς έκαναν ρητά το επιχείρημα του μύλου κρέατος-είναι-άχρηστο. Αυτοί δεν.


Εισαγωγή

Οι μέθοδοι Bayes από μόνες τους δεν είναι ούτε σκοτεινές ούτε, πιστεύουμε, ιδιαίτερα δύσκολες. Με κάποιους τρόπους, ωστόσο, διαφέρουν ριζικά από τις κλασικές στατιστικές μεθόδους και ως εκ τούτου, βασίζονται σε έναν ελαφρώς διαφορετικό τρόπο σκέψης που μπορεί να φαίνεται ασυνήθιστος στην αρχή. Η Bayesian εκτίμηση των παραμέτρων συνήθως δεν θα καταλήξει σε μία μόνο εκτίμηση, αλλά θα αποφέρει μια σειρά εκτιμήσεων με ποικίλες αληθοφάνειες που σχετίζονται με αυτές και ο έλεγχος υπόθεσης Bayes σπάνια θα οδηγήσει σε παραποίηση μιας θεωρίας αλλά μάλλον σε αναδιανομή πιθανότητας μεταξύ ανταγωνιστικών λογαριασμών. Οι μέθοδοι Bayes δεν είναι επίσης νέες, με την πρώτη τους χρήση να χρονολογείται από τον 18ο αιώνα. Ούτε είναι καινούργιοι στην ψυχολογία: Εισήχθησαν στον χώρο πριν από 50 χρόνια, σε αυτό που σήμερα παραμένει μια εντυπωσιακά διορατική έκθεση των Ward Edwards, Harold Lindman και Savage (1963).

Παρ 'όλα αυτά, μέχρι πρόσφατα οι μέθοδοι Bayes δεν ήταν ιδιαίτερα συνηθισμένες στις κοινωνικές επιστήμες, οπότε η πρόσφατη αύξηση της υιοθέτησής τους σημαίνει ότι είναι νέες για τους περισσότερους επαγγελματίες - και για πολλούς ψυχολόγους, η εκμάθηση νέων στατιστικών τεχνικών μπορεί να προκαλέσει κατανοητά συναισθήματα άγχους ή τρόμου. Ταυτόχρονα, πρόσφατες αποκαλύψεις σχετικά με την αναπαραγωγιμότητα της ψυχολογικής επιστήμης (π.χ., Open Science Cooperation, 2015 Etz & amp Vandekerckhove, 2016) έχουν κεντρίσει το ενδιαφέρον για τις στατιστικές μεθόδους που βρίσκουν χρήση στον τομέα.

Στο παρόν άρθρο, παρέχουμε μια απαλή τεχνική εισαγωγή στο συμπέρασμα Bayesian (και θέτουμε το υπόλοιπο αυτού του ειδικού τεύχους Psychonomic Bulletin & amp Review), ξεκινώντας από τις πρώτες αρχές. Θα δώσουμε πρώτα μια σύντομη επισκόπηση που περιλαμβάνει τον ορισμό της πιθανότητας, τους βασικούς νόμους της θεωρίας πιθανοτήτων (το προϊόν και άθροισμα κανόνες πιθανότητας) και πώς ο κανόνας του Bayes και οι εφαρμογές του προκύπτουν από αυτούς τους δύο απλούς νόμους. Στη συνέχεια θα επεξηγήσουμε πώς μπορούν και πρέπει να χρησιμοποιηθούν οι νόμοι της πιθανότητας συμπέρασμα: για την εξαγωγή συμπερασμάτων από παρατηρούμενα δεδομένα. Δεν διστάζουμε να δείξουμε τύπους και μαθηματική έκθεση, αλλά όπου είναι δυνατόν τα συνδέουμε με ένα οπτικό βοήθημα, είτε σε σχήμα είτε σε πίνακα, για να κάνουμε τις έννοιες που αντιπροσωπεύουν πιο απτές.Παρέχουμε επίσης παραδείγματα μετά από κάθε κύρια ενότητα για να εξηγήσουμε πώς αυτές οι ιδέες μπορούν να εφαρμοστούν στην πράξη. Οι περισσότερες από τις βασικές ιδέες που περιγράφονται σε αυτό το έγγραφο απαιτούν μόνο μαθηματική ικανότητα στο επίπεδο της άλγεβρας του κολεγίου, όπως θα φανεί, πολλοί από τους τύπους λαμβάνονται με αναδιάταξη των εξισώσεων με δημιουργικούς τρόπους, έτσι ώστε η ποσότητα ενδιαφέροντος να βρίσκεται στην αριστερή πλευρά του μια ισότητα.

Σε οποιοδήποτε σημείο, οι αναγνώστες που ενδιαφέρονται περισσότερο για τη μεγαλύτερη εικόνα από τις τεχνικές λεπτομέρειες μπορούν να παραλείψουν με ασφάλεια τις εξισώσεις και να επικεντρωθούν στα παραδείγματα και τη συζήτηση. Ωστόσο, η χρήση λεκτικών εξηγήσεων αρκεί μόνο για να αποκτήσουμε μια επιφανειακή κατανόηση των υποκείμενων ιδεών και συνεπειών, οπότε παρέχουμε μαθηματικούς τύπους για τους αναγνώστες που ενδιαφέρονται για μια βαθύτερη εκτίμηση. Σε όλο το κείμενο, χρησιμοποιούμε περιστασιακά υποσημειώσεις για να παρέχουμε επιπλέον σημειωτικές διευκρινίσεις για τους αναγνώστες που ενδέχεται να μην είναι τόσο καλά γνώστες της μαθηματικής έκθεσης.

Ενώ υποστηρίζουμε ότι οι μαθηματικές βάσεις εξυπηρετούν την κατανόηση αυτών των μεθόδων με σημαντικούς τρόπους, θα πρέπει επίσης να επισημάνουμε ότι οι πρόσφατες εξελίξεις σχετικά με τα πακέτα στατιστικών λογισμικού Bayesian (π.χ., Wagenmakers, Love, et al., This issue Matzke, Boehm, & amp Vandekerckhove, this τεύχος van Ravenzwaaij, Cassey, & amp Brown, αυτό το ζήτημα Wagenmakers, Marsman, et al., this issue) έχουν καταστήσει δυνατή την εκτέλεση πολλών ειδών αναλύσεων Bayesian χωρίς την ανάγκη πραγματοποίησης οποιασδήποτε τεχνικής μαθηματικής προέλευσης. Η μαθηματική βάση που παρουσιάζουμε εδώ παραμένει, φυσικά, γενικότερη.

Πρώτον, ωστόσο, θα αφιερώσουμε λίγο χρόνο για να συζητήσουμε μια λεπτή σημασιολογική σύγχυση μεταξύ δύο ερμηνειών της βασικής έννοιας «πιθανότητα». Ο βιαστικός αναγνώστης μπορεί να παραλείψει με ασφάλεια το τμήμα που ακολουθεί (και να προχωρήσει στο "The Product and Sum Rules of Probability"), γνωρίζοντας μόνο ότι χρησιμοποιούμε τη λέξη "πιθανότητα" για να σημαίνει "ένα βαθμό πίστης": μια ποσότητα που δείχνει πόσο έντονα πιστεύουμε ότι κάτι είναι αληθινό.

Τι είναι πιθανότητα;

Σε όλο αυτό το κείμενο, θα ασχοληθούμε με την έννοια του πιθανότηταΤο Αυτό παρουσιάζει ένα άμεσο φιλοσοφικό πρόβλημα, επειδή η λέξη «πιθανότητα» είναι κατά κάποιον τρόπο διφορούμενη: περιστασιακά θα αλλάξει από το ένα νόημα στο άλλο και αυτή η διαφορά στο νόημα είναι μερικές φορές επιρροή.

Με μία έννοια - μερικές φορές ονομάζεται επιστημονική Ερμηνεία υποσημείωσης 1 - η πιθανότητα είναι α βαθμός πεποίθησης: είναι ένας αριθμός μεταξύ μηδέν και ενός που ποσοτικοποιεί πόσο έντονα πρέπει να πιστεύουμε ότι κάτι είναι αληθινό με βάση τις σχετικές πληροφορίες που έχουμε. Με άλλα λόγια, η πιθανότητα είναι μια μαθηματική γλώσσα για την έκφραση της αβεβαιότητάς μας. Αυτό το είδος πιθανότητας είναι εγγενώς υποκειμενικό - επειδή εξαρτάται από τις πληροφορίες που εσείς διαθέτουν —και λογικά άτομα μπορεί να διαφέρουν εύλογα στις πιθανότητες που αντιστοιχούν σε γεγονότα (ή προτάσεις). Σύμφωνα με την επιστημική ερμηνεία, δεν υπάρχει επομένως κάτι τέτοιο όπως ο πιθανότητα - υπάρχει μόνο τα δικα σου πιθανότητα (Lindley 2000). Η πιθανότητά σας μπορεί να θεωρηθεί ότι χαρακτηρίζει την κατάσταση της ελλιπούς γνώσης σας, και υπό αυτή την έννοια η πιθανότητα δεν υπάρχει πέρα ​​από το μυαλό σας.

Μπορούμε για παράδειγμα να πούμε "Υπάρχει 60% πιθανότητα ότι το Ηνωμένο Βασίλειο θα είναι εκτός Ευρωπαϊκής Ένωσης στις 31 Δεκεμβρίου 2018". Κάποιος που πιστεύει ότι υπάρχει 60% πιθανότητα να συμβεί αυτό το γεγονός θα πρέπει να είναι πρόθυμος να στοιχηματίσει μέχρι και $ 6 έναντι $ 4 στην εκδήλωση, επειδή το αναμενόμενο κέρδος τους θα ήταν τουλάχιστον 60% × (+4$ ) + 40% × (−6$), το οποίο είναι μηδέν. Με άλλα λόγια, το στοίχημα άνω των 6 δολαρίων θα ήταν αβέβαιο επειδή θα περίμεναν να χάσουν χρήματα και ότι η ανάληψη μιας τέτοιας ενέργειας δεν θα συνέρχομαι με αυτό που πιστεύουν. Φυσικά, στην επιστημονική πράξη κάποιος σπάνια αναγκάζεται να κάνει πραγματικά τέτοια στοιχήματα, αλλά θα ήταν ατυχές αν οι πιθανότητες μας (και ως εκ τούτου τα συμπεράσματά μας) δεν μπορούσαν να αξιοποιηθούν με σιγουριά εάν προκύψει μια τέτοια ευκαιρία (Hill 1974).

Το γεγονός ότι οι επιστημικές πιθανότητες γεγονότων είναι υποκειμενικές δεν σημαίνει ότι είναι αυθαίρετοςΤο Οι πιθανότητες δεν είναι πράξεις θέλησης, είναι υποκειμενικές απλώς με την έννοια ότι μπορεί να διαφέρουν από το ένα άτομο στο άλλο. Αυτό σημαίνει απλώς ότι διαφορετικοί άνθρωποι φέρνουν διαφορετικές πληροφορίες σε ένα δεδομένο πρόβλημα. Επιπλέον, εάν διαφορετικοί άνθρωποι ενημερώνουν τις πεποιθήσεις τους με ορθολογικό τρόπο, τότε καθώς συσσωρεύονται δεδομένα θα προσεγγίσουν σταδιακά τη συμφωνία (εκτός εάν έχουν αποκλείσει εκ των προτέρων το σημείο συμφωνίας εντελώς, για παράδειγμα, Jern, Chang, & amp, Kemp, 2014). Στην πραγματικότητα, μπορεί να αποδειχθεί ότι ο μόνος τρόπος με τον οποίο οι πεποιθήσεις μας πριν από τα δεδομένα (όποιες κι αν είναι αυτές) θα συμβαδίζουν με τις πεποιθήσεις μας μετά τα δεδομένα είναι να χρησιμοποιήσουμε την πιθανότητα για να αντιπροσωπεύσουμε την αβεβαιότητά μας και να ενημερώσουμε τις πεποιθήσεις μας σύμφωνα με τους νόμους της πιθανότητας ( Lindley 2000).

Με άλλη έννοια - το φυσικός ή κυβευτικός Ερμηνεία υποσημείωσης 2 - η πιθανότητα είναι μια δήλωση ενός αναμενόμενη συχνότητα σε πολλές επαναλήψεις μιας διαδικασίαςΤο Μια δήλωση πιθανής πιθανότητας μπορεί να είναι «Αν αναποδογυρίσω ένα νόμισμα πολλές φορές, η αναλογία των ανατροπών στις οποίες θα ανέβει το κέρμα είναι 50%. Επομένως, η πιθανότητα να εμφανιστεί ένα νόμισμα είναι 50%». Αυτές οι δηλώσεις εκφράζουν ιδιότητες του μακροχρόνια συμπεριφορά των καλά καθορισμένων διαδικασιών, αλλά δεν μπορούν να μιλήσουν σε μοναδικά γεγονότα απαιτούν υποθέσεις σχετικά με τη φυσική επαναληψιμότητα και την ανεξαρτησία μεταξύ των επαναλήψεων. Είναι σημαντικό να κατανοήσουμε ότι αυτές οι συχνότητες θεωρούνται ως ένα πραγματικό μέρος του φυσικού κόσμου, καθώς «οι σχετικές συχνότητες μιας μήτρας που πέφτει με αυτόν ή με αυτόν τον τρόπο είναι« επίμονες »και αποτελούν τις μετρήσιμες ιδιότητες αυτής της μήτρας, συγκρίσιμες με το μέγεθός της. και βάρος »(Neyman 1977, σελ. 99). Το απόσπασμα του Neyman παρέχει μια ενδιαφέρουσα αντίθεση με την επιστημική ερμηνεία. Ο Ιταλός πιθανολόγος και επιδραστικός στατιστικός του Μπαγιέζ Μπρούνο ντε Φινέτι ξεκίνησε περίφημα την πραγματεία του Θεωρία των πιθανοτήτων δηλώνοντας «Πιθανότητα δεν υπάρχει» και ότι «η εγκατάλειψη των δεισιδαιμονικών πεποιθήσεων σχετικά με την ύπαρξη του Φλογίστου, του Κοσμικού Αιθέρα, του Απόλυτου Χώρου και του Χρόνου,… ή των Νεράιδων και των Μαγισσών ήταν ένα ουσιαστικό βήμα στο δρόμο προς την επιστημονική σκέψη. Η πιθανότητα, επίσης, αν θεωρηθεί ως κάτι προικισμένο με κάποιο είδος αντικειμενικής ύπαρξης, δεν είναι λιγότερο μια παραπλανητική εσφαλμένη αντίληψη, μια απατηλή προσπάθεια εξωτερίκευσης ή υλοποίησης των πραγματικών πιθανοτήτων μας »(De Finetti 1974, σ. X). Αυτό δεν σημαίνει ότι δεν μπορούμε να κατασκευάσουμε μοντέλα που αποδίδουν πιθανότητες στα αποτελέσματα των φυσικών διεργασιών, μόνο ότι είναι απαραίτητα αφαιρέσεις.

Είναι σαφές ότι αυτές οι δύο ερμηνείες πιθανότητας δεν είναι οι ίδιες. Υπάρχουν πολλές καταστάσεις στις οποίες δεν ισχύει ο επιλεκτικός ορισμός και έτσι δεν θα μπορούσαν να προσδιοριστούν οι πιθανότητες: δεν θα δούμε επαναλαμβανόμενες περιπτώσεις της 31ης Δεκεμβρίου 2018, στις οποίες το Ηνωμένο Βασίλειο θα μπορούσε να βρίσκεται εντός ή εκτός ΕΕ, θα δούμε μόνο μία τέτοια Εκδήλωση. Ομοίως, «ποια είναι η πιθανότητα να Αυτό κέρμα, στο αμέσως επόμενο γύρισμα, θα ανέβουν κεφάλια; » δεν είναι κάτι για το οποίο ισχύει μια απλή πιθανότητα: δεν υπάρχουν μακροχρόνιες συχνότητες που πρέπει να ληφθούν υπόψη αν υπάρχει μόνο ένα χτύπημα που έχει σημασία.

Η πιθανότητα προειδοποίησης μπορεί - σε ορισμένες περιπτώσεις - να είναι έγκυρη σχετικός με την σύλληψη ή αντίληψη ερμηνεία της πιθανότητας, αλλά σπάνια είναι ποτέ επιχειρήσεων ερμηνεία (βλ. Jaynes, 1984 Winkler, 1972 Wrinch & amp Jeffreys, 1919): δεν μπορεί να ισχύει για μοναδικά γεγονότα όπως η αλήθεια ή το ψεύδος μιας επιστημονικής θεωρίας, οπότε απλά δεν μπορούμε να μιλήσουμε για πιθανές πιθανότητες όταν παλεύουμε με την αβεβαιότητα που αντιμετωπίζουμε στην επιστημονική πρακτική. Δηλαδή, μπορούμε να χρησιμοποιήσουμε έγκυρα την πιθανότητα παραίτησης σκέφτομαι για πιθανότητα με αφηρημένο τρόπο, αλλά όχι για να κάνετε δηλώσεις σχετικά με γεγονότα που παρατηρούνται στον πραγματικό κόσμο, όπως πειραματικά αποτελέσματα.

Αντίθετα, η επιστημική πιθανότητα ισχύει για οποιοδήποτε γεγονός που φροντίζουμε να εξετάσουμε-είτε είναι μοναδικό είτε επαναλαμβανόμενο-και αν έχουμε σχετικές πληροφορίες σχετικά με τις συχνότητες του πραγματικού κόσμου, τότε μπορούμε να επιλέξουμε να χρησιμοποιήσουμε αυτές τις πληροφορίες για να ενημερώσουμε τις πεποιθήσεις μας. Εάν η επανάληψη είναι δυνατή και θεωρούμε λογικό να υποθέσουμε ότι η πιθανότητα να εμφανιστεί ένα κέρμα σε μια δεδομένη ρίψη δεν αλλάζει με βάση το αποτέλεσμα των προηγούμενων ρίψεων, τότε ένας Μπαγιέζος θα μπορούσε εύλογα να πιστέψει και τα δύο (α) ότι στην επόμενη ρίψη εκεί είναι 50% πιθανότητα να ανέβει και β) Το 50% των εκτοξεύσεων θα οδηγήσει σε κεφαλές σε μια πολύ μεγάλη σειρά αναστροφών. Ως εκ τούτου, η επιστημική πιθανότητα είναι και τα δύο α σχετικός με την σύλληψη ή αντίληψη ερμηνεία της πιθανότητας και an επιχειρήσεων ερμηνεία. Η επιστημική πιθανότητα μπορεί να θεωρηθεί ως μια επέκταση της πιθανότητας παραίτησης που ισχύει για όλες τις περιπτώσεις όπου θα εφαρμοζόταν η τελευταία και για αμέτρητες περιπτώσεις όπου δεν μπορούσε.

Γιατί αυτό έχει σημασία

Υποστηρίζουμε ότι η παραπάνω διάκριση είναι άμεσα σχετική με την εμπειρική ψυχολογία. Στη συντριπτική πλειοψηφία των περιπτώσεων, οι ψυχολόγοι ενδιαφέρονται να κάνουν πιθανές δηλώσεις σχετικά με μοναδικά γεγονότα: Αυτό η θεωρία είναι είτε αληθινή είτε όχι Αυτό το αποτέλεσμα είναι είτε θετικό είτε αρνητικό Αυτό το μέγεθος του εφέ είναι πιθανώς μεταξύ Χ και y και είτε Αυτό μοντέλο ή το άλλο είναι πιο πιθανό με βάση τα δεδομένα. Σπάνια μας ενδιαφέρει απλώς η συχνότητα με την οποία μια καλά καθορισμένη διαδικασία θα επιτύχει ένα συγκεκριμένο αποτέλεσμα. Ακόμη και αυθαίρετα μεγάλες ακολουθίες πιστών επαναλήψεων εμπειρικών μελετών χρησιμεύουν για την αντιμετώπιση του α ενικός ερώτηση: «είναι Αυτό σωστή η θεωρία; » Μπορούμε λογικά να ορίσουμε ένα συγκεκριμένο μοντέλο συμπεριφοράς και να του εκχωρήσουμε παραμέτρους (ακόμη και παραμέτρους που είναι πιθανότητες) και στη συνέχεια να εξετάσουμε τη μακροπρόθεσμη συμπεριφορά του. Αυτή είναι μια έγκυρη επιτακτική ερώτηση. Ωστόσο, δεν είναι μια συμπερασματική διαδικασία: περιγράφει τη συμπεριφορά ενός εξιδανικευμένου μοντέλου, αλλά δεν μας παρέχει συμπεράσματα σχετικά με αυτό το μοντέλο. Θα μπορούσαμε επίσης να αναρωτηθούμε πόσο συχνά ένας ερευνητής θα κάνει λάθη στο συμπέρασμα (όπως ορίζονται) υπό ορισμένες συνθήκες, αλλά αυτό είναι καθαρά ακαδημαϊκή άσκηση, εκτός εάν το ποσοστό των λαθών είναι 0 ή 1, μια τέτοια μακροπρόθεσμη συχνότητα από μόνη της δεν μας επιτρέπει να προσδιορίστε την πιθανότητα ο ερευνητής να έκανε πραγματικά λάθος σχετικά με οποιοδήποτε ενικός εύρημα - σχετικά Αυτό κέρμα, Αυτό αποτέλεσμα, ή Αυτό υπόθεση. Αντίθετα, η επιστημική πιθανότητα εκφράζει βαθμούς πεποίθησης σχετικά με συγκεκριμένα, ατομικά, ενικός γεγονότα, και για τον λόγο αυτό θα πρέπει να είναι η προεπιλογή για επιστημονικό συμπέρασμα.

Στην επόμενη ενότητα, θα εισαγάγουμε τους βασικούς κανόνες της θεωρίας πιθανοτήτων. Αυτοί οι κανόνες είναι αγνωστικοί για την αντίληψή μας για την πιθανότητα - ισχύουν εξίσου για την επιστημική και την επιλεκτική πιθανότητα - αλλά σε όλη την υπόλοιπη εργασία και ιδιαίτερα στα παραδείγματα, θα χρησιμοποιήσουμε, εκτός εάν σημειωθεί διαφορετικά, μια επιστημική ερμηνεία της λέξης «πιθανότητα».

Το γινόμενο και το άθροισμα των πιθανοτήτων

Εδώ θα εισαγάγουμε τους δύο βασικούς κανόνες της θεωρίας πιθανοτήτων από τους οποίους προέρχεται ουσιαστικά όλο το συμπέρασμα του Bayes. Ωστόσο, πριν επιχειρήσουμε να εφαρμόσουμε τους νόμους της πιθανότητας, υπάρχουν συμβολικές συμβάσεις για να σχεδιάσουμε. Πρώτον, θα χρησιμοποιήσουμε Π(ΕΝΑ) για να δηλώσει την πιθανότητα κάποιου γεγονότος ΕΝΑ, όπου ΕΝΑ είναι μια δήλωση που μπορεί να είναι αληθινή ή ψευδής (π. ΕΝΑ θα μπορούσε να είναι "θα βρέξει σήμερα", "το Ηνωμένο Βασίλειο θα είναι εκτός ΕΕ στις 31 Δεκεμβρίου 2018" ή "το 20ο ψηφίο του π είναι 3 "). Στη συνέχεια, θα χρησιμοποιήσουμε (σι|ΕΝΑ) για να δηλώσει το υποθετικός συμβάν: η πιθανότητα να σι είναι αλήθεια δεδομένου ότι το Α είναι αλήθεια (π.χ., σι θα μπορούσε να είναι "θα βρέξει αύριο") είναι Π(σι|ΕΝΑ): η πιθανότητα να βρέξει αύριο δεδομένου ότι έβρεξε σήμερα. Τρίτον, θα χρησιμοποιήσουμε (ΕΝΑ,σι) να συμβολίσω α άρθρωση συμβάν: η πιθανότητα να ΕΝΑ και σι είναι και τα δύο αληθινά είναι Π(ΕΝΑ,σι). Η κοινή πιθανότητα Π(ΕΝΑ,σι) είναι φυσικά ίσο με αυτό της κοινής πιθανότητας Π(σι,ΕΝΑ): το γεγονός «βρέχει αύριο και σήμερα» είναι λογικά το ίδιο με «βρέχει σήμερα και αύριο». Τέλος, θα χρησιμοποιήσουμε (ΕΝΑ) να αναφερθεί στην άρνηση του ΕΝΑ: η πιθανότητα ΕΝΑ είναι ψεύτικο είναι ΠΕΝΑ). Αυτές οι σημειώσεις μπορούν να συνδυαστούν: αν ντο και ρε αντιπροσωπεύουν τα γεγονότα "είναι εποχή τυφώνων" και "έβρεξε χθες", αντίστοιχα, τότε Π(ΕΝΑ,σιντορε) είναι η πιθανότητα να βρέξει σήμερα και αύριο, δεδομένου ότι (¬ντο) δεν είναι εποχή τυφώνων και αυτό (¬ρε) δεν έβρεξε χθες (δηλαδή και τα δύο ντο και ρε δεν είναι αλήθεια).

Έχοντας αυτό το συμβολισμό υπόψη, εισάγουμε τον Κανόνα Πιθανοτήτων Προϊόντος:

Με λόγια: η πιθανότητα να ΕΝΑ και σι είναι και τα δύο αληθινά ίσα με την πιθανότητα σι πολλαπλασιάζεται με την υπό όρους πιθανότητα ΕΝΑ υποθέτοντας σι είναι αλήθειαΤο Λόγω συμμετρίας, αυτό είναι επίσης ίσο με την πιθανότητα ΕΝΑ πολλαπλασιάζεται με την υπό όρους πιθανότητα του σι υποθέτοντας ΕΝΑ είναι αλήθειαΤο Η πιθανότητα να βρέξει σήμερα και αύριο είναι η πιθανότητα να βρέξει σήμερα σήμερα πολλαπλασιασμένη με την πιθανότητα να βρέξει αύριο δεδομένου ότι γνωρίζουμε ότι βρέχει σήμερα.

Αν υποθέσουμε ΕΝΑ και σι είναι στατιστικά ανεξάρτητες τότε Π(σι) ισούται Π(σι|ΕΝΑ), αφού γνωρίζω ΕΝΑ συμβαίνει δεν μας λέει τίποτα για την ευκαιρία σι συμβαίνει. Σε τέτοιες περιπτώσεις, ο κανόνας προϊόντος απλοποιείται ως εξής:

Συνεχίζοντας με το παράδειγμά μας, αυτό θα σήμαινε τον υπολογισμό της πιθανότητας να βρέξει τόσο σήμερα όσο και αύριο με τέτοιο τρόπο ώστε η γνώση του εάν έβρεξε ή όχι σήμερα δεν έχει καμία σχέση με το πόσο ισχυρά πρέπει να πιστεύουμε ότι θα βρέξει αύριο.

Η κατανόηση του συνολικού κανόνα πιθανοτήτων απαιτεί μια ακόμη έννοια: το ασύνδετο σετΤο Ένα ασύνδετο σετ δεν είναι άλλο από μια συλλογή αμοιβαίως αποκλειστικών γεγονότων. Για να απλοποιήσουμε την έκθεση, θα υποθέσουμε επίσης ότι ακριβώς ένα από αυτά τα γεγονότα πρέπει να είναι αληθινό, αν και αυτό δεν αποτελεί μέρος του κοινού ορισμού ενός τέτοιου συνόλου. Το πιο απλό παράδειγμα ενός ασύνδετου συνόλου είναι κάποιο γεγονός και η άρνησή του: Υποσημείωση 3 <σισι>>. Αν σι αντιπροσωπεύει την εκδήλωση "Θα βρέξει αύριο", τότε ¬σι αντιπροσωπεύει την εκδήλωση «Δεν θα βρέξει αύριο». Ένα και μόνο ένα από αυτά τα γεγονότα πρέπει να συμβεί, οπότε μαζί σχηματίζουν ένα ασύνδετο σύνολο. Αν ΕΝΑ αντιπροσωπεύει την εκδήλωση "Θα βρέξει σήμερα" και ¬ΕΝΑ αντιπροσωπεύει το "Δεν θα βρέξει σήμερα" (ένα άλλο ασύνδετο σετ), τότε υπάρχουν τέσσερα πιθανά ζεύγη αυτών των γεγονότων, ένα από τα οποία πρέπει να είναι αληθινό: (ΕΝΑ,σι), (ΕΝΑσι), (¬ΕΝΑ,σι), και (¬ΕΝΑσι). Η πιθανότητα ενός μόνο από τα μοναδικά γεγονότα, ας πούμε σι, μπορεί να βρεθεί προσθέτοντας τις πιθανότητες όλων των κοινών γεγονότων που περιέχουν σι ως εξής:

Με λίγα λόγια, η πιθανότητα να βρέξει αύριο είναι το άθροισμα δύο κοινών πιθανοτήτων: (1) η πιθανότητα να βρέξει σήμερα και αύριο και (2) η πιθανότητα να μην βρέξει σήμερα αλλά να βρέξει αύριο.

Γενικά, αν <ΕΝΑ 1,ΕΝΑ 2,…,ΕΝΑ κ> είναι ένα ασύνδετο σύνολο, ο αθροιστικός κανόνας πιθανότητας δηλώνει:

Δηλαδή να βρούμε την πιθανότητα συμβάντος σι μόνος σου αθροίζεις όλες τις κοινές πιθανότητες που περιλαμβάνουν και τα δύο σι και ένα στοιχείο ενός ασύνδετου συνόλου. Διαισθητικά, είναι σαφές ότι εάν ένα από τα <ΕΝΑ 1,ΕΝΑ 2,…,ΕΝΑ κ>πρέπει είναι αλήθεια, τότε η πιθανότητα ότι ένα από αυτά και Β είναι αληθές είναι ίσο με τη βασική πιθανότητα ότι σι είναι αλήθεια.

Στο πλαίσιο της εμπειρικής συλλογής δεδομένων, το ασύνδετο σύνολο πιθανών αποτελεσμάτων ονομάζεται συχνά το δείγμα χώρου.

Μια απεικόνιση του Κανόνα Πιθανοτήτων Προϊόντος

φαίνεται από το διάγραμμα διαδρομής στο Σχ. 1. Κάθε πιρούνι υποδηλώνει την έναρξη ενός ασύρματου συνόλου, με καθένα από τα στοιχεία αυτού του συνόλου να αντιπροσωπεύεται από τους κλάδους να εκτείνονται προς τα έξω. Οι γραμμές υποδεικνύουν την πιθανότητα επιλογής κάθε στοιχείου μέσα στο σύνολο. Ξεκινώντας από τα αριστερά, μπορεί κανείς να εντοπίσει αυτό το διάγραμμα για να βρει την κοινή πιθανότητα, ας πούμε, ΕΝΑ και σιΤο Στο Αρχή πιρούνι υπάρχει πιθανότητα 0,6 να πάει κατά μήκος του επάνω βέλους στο συμβάν ΕΝΑ (θα μπορούσε φυσικά να σχεδιαστεί ένα παρόμοιο διάγραμμα που ξεκινά με σι): Η πιθανότητα να βρέξει σήμερα είναι 0,6. Στη συνέχεια, υπάρχει πιθανότητα .667 να περάσετε από το επόμενο πιρούνι στο συμβάν (ΕΝΑ,σι): Η πιθανότητα να βρέξει αύριο δεδομένου ότι βρέχει σήμερα είναι 0,667. Ως εκ τούτου, της αρχικής πιθανότητας 0,6 που αντιστοιχεί σε ΕΝΑ, τα δύο τρίτα του διχαλώνει σε (ΕΝΑ,σι), άρα η πιθανότητα (ΕΝΑ,σι) είναι .6 × .667 = .40: Δεδομένου ότι έβρεξε σήμερα, η πιθανότητα να βρέξει αύριο είναι .667, οπότε η πιθανότητα να βρέξει και σήμερα και αύριο είναι .4. Η πιθανότητα οποιουδήποτε κοινού συμβάντος στο τέλος μιας διαδρομής μπορεί να βρεθεί πολλαπλασιάζοντας τις πιθανότητες όλων των πιρουνιών που χρειάζονται για να φτάσουμε εκεί.

Μια απεικόνιση του κανόνα πιθανότητας προϊόντος: Η πιθανότητα των κοινών γεγονότων στο δεξί άκρο του διαγράμματος επιτυγχάνεται πολλαπλασιάζοντας τις πιθανότητες κατά μήκος της διαδρομής που οδηγεί σε αυτό. Οι διαδρομές δείχνουν πού και πώς χωρίζουμε σταδιακά την αρχική πιθανότητα σε μικρότερα υποσύνολα. Μια προτεινόμενη άσκηση για τον έλεγχο της κατανόησης και την εξοικείωση με τους κανόνες είναι η κατασκευή του ισοδύναμου διαγράμματος διαδρομής (δηλαδή, εκείνο στο οποίο οι πιθανότητες άρθρωσης είναι πανομοιότυπες) ξεκινώντας από τα αριστερά με ένα πιρούνι που εξαρτάται από το γεγονός σι αντί ΕΝΑ

Μια απεικόνιση του αθροιστικού κανόνα της πιθανότητας

φαίνεται στον Πίνακα 1, ο οποίος παρουσιάζει τις πιθανότητες όλων των συμβάντων άρθρωσης που βρέθηκαν μέσω του Σχ. 1 στα κύρια κελιά. Για παράδειγμα, αθροίζοντας όλες τις πιθανότητες από κοινού σε όλη τη σειρά που υποδηλώνεται ΕΝΑ δίνει Π(ΕΝΑ). Προσθέτοντας όλες τις πιθανότητες από κοινού στη στήλη που δηλώνεται σι δίνει Π(σι). Αυτό μπορεί επίσης να φανεί σημειώνοντας ότι στο Σχ. 1, οι πιθανότητες των δύο παιδικών πιρουνιών να φύγουν από ΕΝΑ, και συγκεκριμένα (ΕΝΑ,σι) και (ΕΝΑσι), αθροίστε την πιθανότητα που αναφέρεται στο αρχικό πιρούνι που οδηγεί σε ΕΝΑΤο Αυτό ισχύει για οποιαδήποτε τιμή του Π(σι|ΕΝΑ) (και Πσι|ΕΝΑ) = 1 − Π(σι|ΕΝΑ)).


ΕΥΧΑΡΙΣΤΙΕΣ

Το έργο που παρουσιάστηκε σε αυτό το έγγραφο υποστηρίχθηκε από χρηματοδότηση που δόθηκε στον πρώτο συγγραφέα από την HM Government και στον τρίτο συγγραφέα από το Υπουργείο Εθνικής Άμυνας του Καναδά (αρ. Έργου 05da) και το Καναδικό Πρόγραμμα Ασφάλειας και Ασφάλειας (αρ. Έργου CSSP-2016-TI -2224). Το έργο συμβάλλει επίσης στην Τεχνική Ομάδα Έρευνας της ομάδας ανάλυσης και μελετών συστημάτων του ΝΑΤΟ 114 για την αξιολόγηση και την επικοινωνία της αβεβαιότητας στη νοημοσύνη για την υποστήριξη της λήψης αποφάσεων. Ευχαριστούμε τον Jonathan Nelson για τις συμβουλές του σε θέματα της εργασίας και τους Jeremy Brown και Shoshannah Harper για την ερευνητική τους βοήθεια.


Μια διαισθητική (και σύντομη) εξήγηση του θεώματος Bayes ’

Το θεώρημα του Bayes ήταν το αντικείμενο ενός λεπτομερούς άρθρου.Το δοκίμιο είναι καλό, αλλά πάνω από 15.000 λέξεις - εδώ είναι η συμπυκνωμένη έκδοση για νεοφερμένους Μπαγιέζους όπως εγώ:

Οι δοκιμές δεν είναι το γεγονός. Έχουμε καρκίνο δοκιμή, χωριστά από το γεγονός της πραγματικής εμφάνισης καρκίνου. Εχουμε ένα δοκιμή για ανεπιθύμητα μηνύματα, χωριστά από το γεγονός της πραγματικής αποστολής μηνύματος ανεπιθύμητης αλληλογραφίας.

Οι δοκιμές είναι ελαττωματικές. Οι δοκιμές ανιχνεύουν πράγματα που δεν υπάρχουν (ψευδώς θετικά) και χάνουν πράγματα που υπάρχουν (ψευδώς αρνητικά). Οι άνθρωποι χρησιμοποιούν συχνά αποτελέσματα δοκιμών χωρίς να προσαρμόζονται για σφάλματα δοκιμής.

Τα ψευδώς θετικά ανατρέπουν τα αποτελέσματα. Ας υποθέσουμε ότι ψάχνετε για κάτι πραγματικά σπάνιο (1 στο εκατομμύριο). Ακόμη και με μια καλή δοκιμή, είναι πιθανό ότι ένα θετικό αποτέλεσμα είναι πραγματικά ένα ψευδώς θετικό σε κάποιον στο 999.999.

Οι άνθρωποι προτιμούν τους φυσικούς αριθμούς. Το να πούμε «100 στα 10.000» αντί «1%» βοηθά τους ανθρώπους να αντιμετωπίζουν τους αριθμούς με λιγότερα λάθη, ειδικά με πολλαπλάσια ποσοστά («Από αυτούς τους 100, οι 80 θα είναι θετικοί» και όχι «το 80% του 1% θα είναι θετικοί» ).

Ακόμα και η επιστήμη είναι μια δοκιμασίαΤο Σε φιλοσοφικό επίπεδο, τα επιστημονικά πειράματα είναι «δυνητικά ελαττωματικά τεστ» και πρέπει να αντιμετωπιστούν αναλόγως. Υπάρχει ένα δοκιμή για ένα χημικό, ή ένα φαινόμενο, και υπάρχει το Εκδήλωση του ίδιου του φαινομένου. Οι δοκιμές και ο εξοπλισμός μέτρησης έχουν ένα ποσοστό σφάλματος που πρέπει να ληφθεί υπόψη.

Το θεώρημα του Bayes μετατρέπει τα αποτελέσματα από τη δοκιμή σας στην πραγματική πιθανότητα του γεγονότος. Για παράδειγμα, μπορείτε:

Διορθώθηκε για σφάλματα μέτρησηςΤο Εάν γνωρίζετε τις πραγματικές πιθανότητες και την πιθανότητα ψευδώς θετικού και ψευδώς αρνητικού, μπορείτε να διορθώσετε σφάλματα μέτρησης.

Συνδέστε την πραγματική πιθανότητα με τη μετρούμενη πιθανότητα δοκιμής. Λαμβάνοντας υπόψη τα αποτελέσματα της εξέτασης μαστογραφίας και τα γνωστά ποσοστά σφάλματος, μπορείτε να προβλέψετε την πραγματική πιθανότητα εμφάνισης καρκίνου σε θετικό τεστ. Με τεχνικούς όρους, μπορείτε να βρείτε Pr (H | E), την πιθανότητα ότι μια υπόθεση H είναι αληθινή δεδομένης της απόδειξης E, ξεκινώντας από την Pr (E | H), την πιθανότητα ότι τα στοιχεία εμφανίζονται όταν η υπόθεση είναι αληθινή.


Αποτελέσματα

Τα ακατέργαστα δεδομένα και ο κώδικας R για την αναπαραγωγή των αναλύσεων βρίσκονται στη διεύθυνση https://osf.io/3t2xw/.

Περιγραφικά αποτελέσματα

Κατά μέσο όρο, οι συμμετέχοντες έκριναν ότι τα τρία χρονογραφήματα είχαν 10 % (SD = 15 %), 29 % (SD = 23 %) και 53 % (SD = 27 %) πιθανότητα προ -δοκιμής καρκίνου του παχέος εντέρου. Αυτό παρέχει αρκετά ευρύ φάσμα προηγούμενων πιθανοτήτων από τις οποίες μπορεί να εξεταστεί η ενημέρωση.

Ο Πίνακας 1 παρουσιάζει τις μέσες κρίσεις για το ποσοστό ευαισθησίας και ψευδώς θετικού για τα τέσσερα τεστ μαζί με δημοσιευμένες εκτιμήσεις. Υποσημείωση 3 Συνολικά, οι κρίσεις των συμμετεχόντων ταίριαζαν αρκετά με τις δημοσιευμένες εκτιμήσεις.

Εξαιρούνται παρατηρήσεις

Οι ακόλουθες παρατηρήσεις (μεμονωμένες κρίσεις μετά τον έλεγχο) εξαιρέθηκαν για να βοηθήσουν την ερμηνεία ».τ + "Έναντι"τ - "αντιπροσωπεύει εάν το αποτέλεσμα της δοκιμής είναι θετικό έναντι αρνητικό, και"ντο + "Έναντι"ντο - ”αντιπροσωπεύουν εάν ο καρκίνος του παχέος εντέρου είναι παρών έναντι απουσίας. Πρώτον, οι παρατηρήσεις απορρίφθηκαν εάν η εκτίμηση ευαισθησίας ενός συμμετέχοντα, Π(τ + |ντο +), ήταν μικρότερο από το ψευδώς θετικό ποσοστό, Π(τ + |ντο -), για μια δεδομένη δοκιμή, που σημαίνει ότι η δοκιμή λειτουργεί σε λάθος κατεύθυνση και πιθανώς αντικατοπτρίζει ένα σφάλμα (4,7 % των παρατηρήσεων). Δεύτερον, οι παρατηρήσεις έπεσαν επίσης εάν οι συμμετέχοντες το κρίνουν αυτό Π(τ + |ντο + ) = Π(τ + |ντο -) (5,6 % των παρατηρήσεων), πράγμα που σημαίνει ότι το τεστ δεν μπορεί να διακρίνει καθόλου τον καρκίνο του παχέος εντέρου. Αυτό συνέβη κυρίως για το FOBT, το οποίο είναι ένα τεστ που αντιμετωπίζεται ευρέως με σκεπτικισμό από τους γιατρούς λόγω του υψηλού ψευδώς θετικού ποσοστού του. Επειδή ο σκοπός αυτής της μελέτης είναι να κατανοήσει πώς οι γιατροί ενημερώνουν τις πεποιθήσεις τους όταν η ενημέρωση είναι δικαιολογημένη, αυτές οι παρατηρήσεις απορρίφθηκαν. Τρίτον, υπήρχαν 15 παρατηρήσεις (0,3 %) για τις οποίες οι συμμετέχοντες έδωσαν ευαισθησία ή ψευδώς θετικά ποσοστά ακριβώς ένα ή μηδέν, τα οποία παρήγαγαν άπειρες τιμές σφάλματος καταγραφής και έπρεπε να απορριφθούν για όλες τις αναλύσεις.

Οι αναλύσεις εκτελέστηκαν επίσης αποκλείοντας και περιλαμβάνοντας τους ακόλουθους τύπους παρατηρήσεων για να ελεγχθεί η ευρωστία του αποτελέσματος. Πρώτον, εάν το αποτέλεσμα της δοκιμής είναι θετικό (αρνητικό), η κρίση μετά τον έλεγχο θα πρέπει να είναι υψηλότερη (χαμηλότερη) από την κρίση πριν από το τεστ. 5,2 % των παρατηρήσεων παραβίασαν την κανονιστική κατεύθυνση της ενημέρωσης. Δεύτερον, παρόλο που οι συμμετέχοντες χρησιμοποίησαν μια κλίμακα από 0,01 % έως 99,99 %, ορισμένοι συμμετέχοντες μπορεί να χρησιμοποιούσαν 1 % για 1 % ή λιγότερο και 99 % για 99 % ή περισσότερο 13,7 % των παρατηρήσεων κανονικά θα έπρεπε να ήταν & lt1 % ή & gt99 %, και οι αναλύσεις διεξάγονται με και χωρίς αυτές τις παρατηρήσεις.

Χρήση του λόγου πιθανότητας και της προηγούμενης πιθανότητας στην ενημέρωση

Αναλύοντας αν οι κρίσεις μετά το τεστ των συμμετεχόντων ήταν αρκετά ευαίσθητες στην αναλογία πιθανοτήτων (ευαισθησία διαιρούμενη με το ψευδώς θετικό ποσοστό) και την προηγούμενη πιθανότητα αφορούσαν τη χρήση της μορφής log odds του κανόνα του Bayes (Evans et al., 2002 Keren & amp Thujs, 1996 Lyman & amp Balducci , 1994). Οι εξισώσεις 1α και 1β χρησιμοποιούνται όταν το αποτέλεσμα της δοκιμής είναι θετικό ή αρνητικό, αντίστοιχα. Η μορφή των αποδόσεων καταγραφής του κανόνα του Bayes είναι χρήσιμη επειδή επιτρέπει τη γραμμική παλινδρόμηση στην εξίσωση 2. Κανονικά, τα βάρη παλινδρόμησης για τις προηγούμενες πιθανότητες καταγραφής και ο λόγος πιθανότητας καταγραφής πρέπει να είναι ένα, και το βάρος παλινδρόμησης για το σημείο διακοπής πρέπει να είναι μηδέν. Λόγω των επαναλαμβανόμενων μέτρων, συμπεριλήφθηκαν τυχαίες επιδράσεις κατά την υποκλοπή και τις κλίσεις του λόγου πιθανότητας καταγραφής και τις προηγούμενες πιθανότητες καταγραφής.

Ο Πίνακας 2 δείχνει τα αποτελέσματα των παλινδρόμησης Παρέχονται διαστήματα εμπιστοσύνης 95 % για την ταυτόχρονη σύγκριση των σταθμίσεων παλινδρόμησης έναντι ενός και μηδενικού. Πραγματοποιήθηκαν τρεις παλινδρομήσεις τόσο για τα θετικά όσο και για τα αρνητικά αποτελέσματα του τεστ: μία με όλες τις εξαιρέσεις που αναφέρθηκαν στην προηγούμενη ενότητα, μία με όλες τις εξαιρέσεις, εκτός από τις παρατηρήσεις στις οποίες οι συμμετέχοντες ενημέρωσαν τις κρίσεις τους προς την αντίθετη προς την κανονιστική κατεύθυνση και μία με όλες τις εξαιρέσεις εκτός από την εξαίρεση των παρατηρήσεων για τις οποίες οι κανονιστικές απαντήσεις βρίσκονται στα ακραία μέρη της κλίμακας (& lt.01 ή & gt.99).

Το γεγονός ότι οι συντελεστές παλινδρόμησης για το λόγο πιθανότητας και οι πιθανότητες προ -δοκιμής ήταν και οι δύο σημαντικά άνω του μηδενός και για τις έξι παλινδρόμηση υποδηλώνει ότι χρησιμοποιήθηκαν και οι δύο πεποιθήσεις. Και στις έξι παλινδρομήσεις, το διάστημα εμπιστοσύνης 95 % για τις προηγούμενες πιθανότητες καταγραφής ήταν κάτω από το ένα, υπονοώντας ότι οι συμμετέχοντες δεν χρησιμοποιούσαν επαρκώς τις πεποιθήσεις τους. Επιπλέον, στις περισσότερες παλινδρομήσεις, το ανώτερο όριο του διαστήματος εμπιστοσύνης 95 % για τον λόγο πιθανότητας καταγραφής ήταν μικρότερο από ένα, υπονοώντας ότι οι συμμετέχοντες δεν χρησιμοποιούσαν τις πεποιθήσεις τους κατά πάσα πιθανότητα (ευαισθησία και ψευδώς θετικά ποσοστά του τεστ) αρκετά Το Αυτό ήταν πιο εμφανές για ένα αρνητικό αποτέλεσμα δοκιμής, ωστόσο, μετά από ένα θετικό αποτέλεσμα δοκιμής, τα διαστήματα εμπιστοσύνης 95 % ήταν κοντά στο ένα και μερικές φορές ξεπερνούσαν το ένα, υπονοώντας ότι οι συμμετέχοντες χρησιμοποίησαν σχεδόν κανονικά τις πεποιθήσεις πιθανότητας μετά από ένα θετικό αποτέλεσμα δοκιμής.

Οι παλινδρομήσεις είχαν ως επί το πλείστον θετικές (αρνητικές) παρεμβολές για την περίπτωση θετικού (αρνητικού) αποτελέσματος δοκιμής. Αυτό μπορεί να ερμηνευτεί ότι σημαίνει ότι οι συμμετέχοντες κατάλαβαν ότι πρέπει να αυξήσουν (μειώσουν) τις κρίσεις τους, αλλά δεν κατάλαβαν πάντα ότι η ενημέρωση θα πρέπει να συνδέεται άμεσα με τις πεποιθήσεις τους στην αναλογία πιθανοτήτων.

Πραγματοποιήθηκαν παλινδρομήσεις παρακολούθησης, ελέγχοντας αν υπήρχε σημαντική αλληλεπίδραση μεταξύ του λόγου πιθανότητας καταγραφής και των προηγούμενων αποδόσεων καταγραφής κανονικά δεν θα έπρεπε να υπάρχει αλληλεπίδραση. Αυτές οι παλινδρομήσεις περιλάμβαναν επίσης μια τυχαία κλίση κατά θέμα στην αλληλεπίδραση. Για τη θετική κατεύθυνση, η επίδραση του λόγου πιθανότητας καταγραφής ήταν ασθενέστερη σε υψηλότερα επίπεδα προελέγχου (βλ. Πίνακα 3). Αυτό μπορεί να ερμηνευθεί ότι σημαίνει ότι όταν η προηγούμενη πιθανότητα ήταν αρκετά υψηλή, τα άτομα αρνήθηκαν να αυξήσουν την πιθανότητα όσο ήταν δικαιολογημένο από τις πεποιθήσεις τους στην αναλογία πιθανότητας, αποφεύγοντας το ανώτερο άκρο της κλίμακας πιθανοτήτων.

Για την αρνητική κατεύθυνση, οι παλινδρόμησεις δεν θα συγκλίνουν ωστόσο, μειώνοντας τη συσχέτιση μεταξύ των τυχαίων κλίσεων που επέτρεψαν σύγκλιση σε δύο από τις τρεις παλινδρόμησεις. Υποσημείωση 4 Η επίδραση του λόγου πιθανότητας καταγραφής ήταν ασθενέστερη σε χαμηλότερα επίπεδα προελέγχου (Πίνακας 3). Αυτό μπορεί να ερμηνευθεί ως άτομα που αρνούνται να μειώσουν την πιθανότητα όσο δικαιολογείται από τις πεποιθήσεις τους στην αναλογία πιθανότητας όταν η προηγούμενη πιθανότητα ήταν χαμηλή.

Συνολικά, αν και η χρήση των προηγούμενων αποδόσεων καταγραφής και ο λόγος πιθανότητας καταγραφής δεν ήταν αρκετά κανονιστικές και υπάρχουν ενδείξεις μη κανονικής αλληλεπίδρασης μεταξύ των δύο, υπάρχουν σαφείς ενδείξεις ότι τα άτομα χρησιμοποίησαν τόσο τις προηγούμενες πιθανότητες καταγραφής όσο και τον λόγο πιθανότητας καταγραφής Το

Υπερτίμηση

Οι περισσότερες μελέτες σχετικά με τον συλλογισμό Bayes επικεντρώθηκαν στο αν οι εκ των υστέρων κρίσεις είναι κοντά στην κανονιστική απάντηση ή αν είναι πολύ υψηλές ή πολύ χαμηλές. Η εξίσωση 3 χρησιμοποιήθηκε για τον υπολογισμό του καταγεγραμμένου σφάλματος στην κρίση μετά τον έλεγχο (σε σχέση με τις πεποιθήσεις του ίδιου του συμμετέχοντα για την αναλογία πιθανοτήτων και τις πιθανότητες προ -δοκιμής) και οι αναλύσεις στον όρο σφάλματος καταγραφής πραγματοποιήθηκαν χρησιμοποιώντας τα ίδια τρία σετ εξαιρέσεων που χρησιμοποιήθηκαν προηγουμένως. Κανονικά, το σφάλμα καταγραφής πρέπει να είναι μηδέν.

Συνολικά, το 63 % έως 64 % των συμπερασμάτων προς τη θετική κατεύθυνση και το 66 % έως 69 % των συμπερασμάτων προς την αρνητική κατεύθυνση ήταν πάνω από τον κανονιστικό υπολογισμό, ανάλογα με το συγκεκριμένο σύνολο εξαιρέσεων. Οι παλινδρομήσεις με έναν όρο τυχαίας υποκλοπής ανά θέμα διαπίστωσαν ότι η υπερεκτίμηση ήταν σημαντική τόσο για τα θετικά όσο και για τα αρνητικά αποτελέσματα του τεστ (βλ. Πίνακα 4). Οι παλινδρομήσεις παρακολούθησης, συμπεριλαμβανομένου ενός σταθερού αποτελέσματος για το αν ο γιατρός ήταν ακόμα κάτοικος ή είχε τελειώσει την παραμονή, δεν βρήκαν σημαντικά αποτελέσματα.

Τα σχήματα 3 και 4 δείχνουν τη σχέση μεταξύ των κανονιστικών και των πραγματικών συμπερασμάτων μετά τον έλεγχο όταν το αποτέλεσμα της δοκιμής ήταν θετικό και αρνητικό. (Το Jitter προστέθηκε για να μειώσει την υπερπλήρωση.) Η γραμμή 45 μοιρών αντανακλά την τέλεια βαθμονόμηση. Η παχιά μαύρη γραμμή δείχνει το μέσο συμπέρασμα σε κάθε επίπεδο του Χ-άξονας. Η γραμμή συνδέει 10 σημεία, καθένα από τα οποία αντιπροσωπεύει μια διάμεσο που περιέχει το ένα δέκατο των δεδομένων κατά μήκος της Χ-άξονας. Το γεγονός ότι η μαύρη γραμμή τείνει να είναι πάνω από τη γραμμή 45 μοιρών αντιπροσωπεύει την υπερεκτίμηση.

Σχέση μεταξύ κανονικών υπολογισμών μετά τον έλεγχο και συμπερασμάτων μετά τον έλεγχο μετά από θετικό αποτέλεσμα δοκιμής

Σχέση μεταξύ κανονικών υπολογισμών μετά τον έλεγχο και συμπερασμάτων μετά τον έλεγχο μετά από αρνητικό αποτέλεσμα δοκιμής. ΣημείωσηΤο Αυτό το σχήμα χρησιμοποιεί μια κλίμακα log-log επειδή πολλές από τις κρίσεις είναι παρακάτω .1

Εστιάζοντας στα συμπεράσματα κανονικά μικρότερα από 0,01, μετά τους τρεις βασικούς λόγους αποκλεισμού των παρατηρήσεων, το 81 % των υπόλοιπων 590 συμπερασμάτων κανονικά μικρότερο από 0,01 ήταν πολύ υψηλό. Αυτό πιθανότατα αντανακλά τόσο την τάση στρογγυλοποίησης στο 0,01 όσο και μια προκατάληψη υπερεκτίμησης. Εξήντα ένα τοις εκατό από τα 70 συμπεράσματα κανονικά μεγαλύτερα από 0,99 ήταν επίσης χαμηλός, υποδηλώνοντας ότι η προκατάληψη υπερεκτίμησης δεν επεκτείνεται στην κορυφή της κλίμακας, κάτι που φαίνεται επίσης στο Σχ. 3.

Η υπερεκτίμηση μπορεί να εξηγηθεί με την κακή χρήση των συστατικών του κανόνα του Bayes με τους ακόλουθους τρόπους. Σε θετική κατάσταση, υπήρξε μια σημαντική θετική παρεμπόδιση στις αναλύσεις παλινδρόμησης στην προηγούμενη ενότητα, η οποία συμβάλλει στην υπερεκτίμηση. Επιπρόσθετα, οι πιθανότητες προ -δοκιμής καταγραφής ήταν γενικά αρνητικές (επειδή οι περισσότερες από τις εκτιμήσεις πιθανότητας προ -δοκιμής ήταν μικρότερες από .5) η μη χρήση των αποδόσεων log preestest (βάρος παλινδρόμησης μικρότερη του ενός) θα διογκώσει έτσι τα συμπεράσματα (θα τα φέρει πιο κοντά στο .5).

Η υπερεκτίμηση μετά από αρνητικό αποτέλεσμα δοκιμής μπορεί να εξηγηθεί με τον ακόλουθο τρόπο. Πρώτον, ο λόγος πιθανότητας καταγραφής είναι αρνητικός για αρνητικό αποτέλεσμα δοκιμής. Η κακή χρήση του λόγου πιθανότητας καταγραφής (βάρος παλινδρόμησης μικρότερη του ενός) συνεπάγεται ότι οι συμμετέχοντες δεν μείωσαν τις εκτιμήσεις τους αρκετά, με αποτέλεσμα την υπερεκτίμηση. Δεύτερον, οι πιθανότητες προ -δοκιμής καταγραφής ήταν γενικά αρνητικές, επειδή οι περισσότερες από τις εκτιμήσεις πιθανότητας πριν από το τεστ ήταν μικρότερες από 0,5. Η κακή χρήση των πιθανών προελέγχου θα διόγκωνε επίσης τα συμπεράσματα φέρνοντας τις πιθανότητες μετά τη δοκιμή πιο κοντά στο μηδέν (πιθανότητα μετα -δοκιμής πιο κοντά στο .5). Τρίτον, η υποκλοπή ήταν αρνητική, πράγμα που υποδηλώνει ότι οι συμμετέχοντες τείνουν να μειώνουν τις κρίσεις των εκτιμήσεων μετά το τεστ με τρόπο που δεν σχετίζεται με την πίστη τους στον λόγο πιθανότητας. Από μόνο του, αυτό θα οδηγούσε τα συμπεράσματα να είναι πολύ χαμηλά, αλλά η υποβάρυνση του λόγου πιθανοτήτων και οι προηγούμενες πιθανότητες είχαν μεγαλύτερη θετική επίδραση από την αρνητική επιρροή από τη γενική τάση μείωσης των εκτιμήσεων.


ΕΥΧΑΡΙΣΤΙΕΣ

Το έργο που παρουσιάστηκε σε αυτό το έγγραφο υποστηρίχθηκε από χρηματοδότηση που δόθηκε στον πρώτο συγγραφέα από την HM Government και στον τρίτο συγγραφέα από το Υπουργείο Εθνικής Άμυνας του Καναδά (αρ. Έργου 05da) και το Καναδικό Πρόγραμμα Ασφάλειας και Ασφάλειας (αρ. Έργου CSSP-2016-TI -2224). Το έργο συμβάλλει επίσης στην Τεχνική Ομάδα Έρευνας της ομάδας ανάλυσης και μελετών συστημάτων του ΝΑΤΟ 114 για την αξιολόγηση και την επικοινωνία της αβεβαιότητας στη νοημοσύνη για την υποστήριξη της λήψης αποφάσεων. Ευχαριστούμε τον Jonathan Nelson για τις συμβουλές του σε θέματα της εργασίας και τους Jeremy Brown και Shoshannah Harper για την ερευνητική τους βοήθεια.


Υπολογισμοί της πιθανότητας ενοχής

Δημιουργήσαμε το πρόβλημα με τον συνήθη τρόπο εξετάζοντας πρώτα δύο υποθέσεις.

Από τεχνική άποψη, αυτές δεν είναι οι δύο μόνο υποθέσεις και υπάρχει το γεγονός ότι ο Λάιτερμαν σκότωσε τον Μίξερ και ήταν θύμα μόλυνσης, αλλά αυτή η πιθανότητα είναι τόσο μακρινή που μπορούμε να την αγνοήσουμε με ασφάλεια. Για τους σκοπούς μας, οι παραπάνω υποθέσεις είναι εξαντλητικές και αλληλοαποκλειόμενες, και οι πιθανότητές τους ανέρχονται σε 1,0.

Ως επιστήμονες, γνωρίζουμε ότι η παρουσία του αίματος του Ruelas στα ρούχα του Mixer συνεπάγεται με εξαιρετικά μεγάλη πιθανότητα να υπήρξε τουλάχιστον ένα περιστατικό μόλυνσης στην ανάλυση των υλικών του σκηνικού εγκλήματος του Mixer. Με τη σειρά του, αυτό το γεγονός υποδηλώνει ότι οι επιστήμονες των εργαστηρίων ήταν λανθασμένοι στον ισχυρισμό τους ότι δεν υπήρχε πιθανότητα μόλυνσης στο εργαστήριο. Δυστυχώς, η κριτική επιτροπή δεν θεώρησε την παρουσία του αίματος του Ruelas ως σημαντική για την αξιολόγηση της αληθοφάνειας ότι το DNA του Leiterman κατατέθηκε στο δείγμα του Mixer στο εργαστήριο. Αν και αυτή η εξέταση από την κριτική επιτροπή αψηφά τη λογική, τη χρησιμοποιούμε ως αφετηρία, καθώς δεν μπορεί να ανακουφιστεί. Υπολογίζουμε τις πιθανότητες εναπόθεσης DNA στον τόπο του εγκλήματος το 1969 έναντι του εργαστηρίου το 2002 χωρίς καμία εξέταση του Ruelas. Αυτοί οι υπολογισμοί είναι, επομένως, ένα ανώτατο όριο στην πιθανότητα ενοχής. Οποιαδήποτε εξέταση του Ruelas θα μείωνε την πιθανότητα επειδή αυξάνει την πιθανότητα μόλυνσης από τη βασική τιμή της βιβλιογραφίας.

Ο κύριος στόχος μας είναι να υπολογίσουμε την πιθανότητα ενοχής που εξαρτάται από τα αποτελέσματα του τεστ DNA. Αυτή η πιθανότητα ονομάζεται επίσης μετέπειτα πιθανότητα ενοχής και συμβολίζεται με Π(Η1|ρε), όπου ρε υποδηλώνει τα αποτελέσματα της δοκιμής. Το βασικό βήμα στον υπολογισμό είναι να χρησιμοποιήσουμε τον κανόνα του Bayes, ο ίδιος μια μορφή του νόμου της υπό όρους πιθανοτήτων. Η μορφή του κανόνα του Bayes που βρίσκουμε πιο χρήσιμη εδώ εκφράζεται ως προς τις πιθανότητες. Σε αυτή την περίπτωση, οι πιθανότητες ενοχής είναι μετέπειτα Π(Η1|ρε) 1−Π(Η1|ρε). Επειδή οι δύο υποθέσεις είναι αμοιβαία αποκλειστικές και εξαντλητικές, σημειώνουμε ότι το συμπλήρωμα της ενοχής είναι η Υπόθεση 2, δηλαδή

Ως εκ τούτου, οι οπίσθιες πιθανότητες ενοχής είναι η μετέπειτα αναλογία, Π(Η1|ρε)/Π(Η2|ρε). Αυτή η αναλογία υπολογίζεται από τον κανόνα Bayes ως εξής:

Οι οπίσθιες πιθανότητες είναι το προϊόν δύο όρων. Αυτό που βρίσκεται στα αριστερά είναι η πιθανότητα λήψης των αποτελεσμάτων του DNA κάτω από ανταγωνιστικές υποθέσεις, εκείνο στα δεξιά είναι οι προηγούμενες πιθανότητες των υποθέσεων πριν από την παρατήρηση των δεδομένων. Στη συνέχεια, ορίζουμε τα γεγονότα που περιλαμβάνουν τα δεδομένα και χρησιμοποιούμε τη βιβλιογραφία για να καθορίσουμε ή να εκτιμήσουμε τις σχετικές πιθανότητες που απαιτούνται για τους υπολογισμούς.

Βασικά ποσοστά και προηγούμενες πιθανότητες

Για να υπολογίσουμε μια μετέπειτα αναλογία ενοχής, πρέπει να ξεκινήσουμε με προηγούμενες πιθανότητες. Χρησιμοποιούμε τα ακόλουθα ορίσματα για να ορίσουμε τις τιμές μας:

Π(Η1). Η υπόθεση 1 είναι ότι ο Λάιτερμαν σκότωσε τον Μίξερ. Χωρίς περαιτέρω πληροφορίες, υποθέτουμε ότι όλα τα αρσενικά στην ευρύτερη περιοχή του Ντιτρόιτ το 1969 μεταξύ 15 και 60 ετών είναι εξίσου εύλογα με τον δολοφόνο. Στην περιοχή ζούσαν 4 εκατομμύρια άνθρωποι, και υποθέσαμε ότι το 1/4 από αυτούς, 1 εκατομμύριο, ήταν άνδρες και ήταν ικανοί για τον φόνο. Δεδομένου αυτού του παρονομαστή, η a priori πιθανότητα ότι ο Leiterman είναι ο δολοφόνος είναι Π(Η1) = 10 − 6 .

Π(Η2). Η υπόθεση 2 είναι ότι ο Leiterman είναι το θύμα μόλυνσης στο εργαστήριο το 2002. Υπάρχουν δύο επιλογές ανάπτυξης εδώ και είναι σε μεγάλο βαθμό σημασιολογικές. Το ένα είναι ότι μπορούμε να πάρουμε την υπόθεση ως συνδυασμό δύο γεγονότων: (i) ότι υπήρχε μόλυνση με δείγματα σκηνών εγκλήματος του Mixer και (ii) ότι η μόλυνση ήταν με το δείγμα του Leiterman παρά με οποιοδήποτε άλλο δείγμα που επεξεργαζόταν ταυτόχρονα με το Mixer Το Η άλλη επιλογή είναι ότι μπορούμε να διασπάσουμε τη σύνδεση σε ξεχωριστά γεγονότα. Κάναμε αυτή τη δεύτερη επιλογή και εξετάσαμε την πιθανότητα μόλυνσης ως χαρακτηριστικό του τεστ DNA και όχι ως βασικό ρυθμό. Λαμβάνουμε ως βασικό συντελεστή την πιθανότητα ότι ο Leiterman ήταν θύμα μόλυνσης δεδομένου ότι συνέβη. Αυτό καθιστά το βασικό επιτόκιο ανάλογο με εκείνο της Υπόθεσης 1 όπου το βασικό ποσοστό ήταν η πιθανότητα ο Λάιτερμαν να διέπραξε τη δολοφονία δεδομένου ότι συνέβη η δολοφονία του Μίξερ. Θα ενσωματώσουμε το ποσοστό μόλυνσης στη συνέχεια ως μέρος των δεδομένων, που συζητούνται παρακάτω. Ως εκ τούτου, με αυτήν τη ρύθμιση, ο υπολογισμός αυτού του βασικού ρυθμού απαιτεί εκτίμηση του πόσα δείγματα υποβλήθηκαν σε επεξεργασία ταυτόχρονα με το Mixer's. Το 2002, το Εργαστήριο Εγκληματικής Αστυνομίας του Κράτους του Μίσιγκαν επεξεργάστηκε περίπου 10.000 δείγματα, με περίπου 5000 να υποβλήθηκαν σε επεξεργασία κατά τη διάρκεια του χρόνου που τα αποδεικτικά στοιχεία του Mixer βρίσκονταν στο εργαστήριο (Jen 2003). Ως εκ τούτου, εκτιμούμε ότι υπήρχαν περίπου 5000 δείγματα που αναλύθηκαν ταυτόχρονα με Μίξερ. Ο βασικός συντελεστής είναι έτσι Π(Η2) = 1/5000 = 2 × 10 − 4 .

Αποτελέσματα τεστ DNA ως δεδομένα

Τα αποτελέσματα του τεστ DNA δεν είναι ένας μόνο αριθμός αλλά μια συλλογή γεγονότων. Λαμβάνουμε τα ακόλουθα τέσσερα συμβάντα για να περιλαμβάνουν τα δεδομένα:

Ένας αγώνας με τον Λάιτερμαν: Υπήρχε μια οριστική αντιστοιχία μεταξύ του γνωστού προφίλ του Leiterman και του DNA που βρέθηκε στο καλσόν του Mixer. Δηλώνουμε αυτό το συμβάν αγώνα ως μιΜ.

Σάλιο: Το αντίστοιχο DNA στο καλσόν του Mixer ήταν σύμφωνο με το σάλιο, δεν ήταν σύμφωνο με το αίμα ή το σπέρμα. Δηλώνουμε αυτό το γεγονός ως μιμικρό.

Αποκλειστικότητα: Το DNA που βρέθηκε στο καλσόν του Mixer ήταν αποκλειστικά από το Leiterman, κανένα από το ίδιο το Mixer δεν βρέθηκε. Δηλώνουμε αυτό το γεγονός ως μιμι.

Σύγχρονη ανάλυση: Το DNA του Mixer και του Leiterman αναλύθηκαν στο ίδιο εργαστήριο ταυτόχρονα. Δηλώνουμε αυτό το γεγονός ως μιντο.

Είμαστε τώρα σε θέση να υπολογίσουμε τις εκ των υστέρων πιθανότητες υπό όρους αυτών των γεγονότων. Αντιμετωπίζουμε αυτά τα γεγονότα ως στατιστικά ανεξάρτητα:

Χρησιμοποιήσαμε τις ακόλουθες τιμές στον υπολογισμό:

Π(μιΜ|Η1): Ποια είναι η πιθανότητα αντιστοίχισης DNA κάτω από Η1; Η αντιστοιχία DNA δεν είναι εγγυημένη ακόμη και αν ο Λάιτερμαν δολοφόνησε τον Μίξερ. Στην πραγματικότητα, στα μισά περίπου εγκλήματα, ένα προφίλ DNA δεν μπορεί να ανακτηθεί επειδή ο δράστης δεν άφησε αρκετό υλικό για ταυτοποίηση (Roman, Reid, Chalfin, & amp; Knight 2009). Επιπλέον, ακόμη και αν ο επιτιθέμενος άφησε υλικό, υπάρχει υποβάθμιση του υλικού για 33 χρόνια μεταξύ της δολοφονίας του 1969 και της ανάλυσης το 2002. Η καλύτερη εκτίμηση που μπορούμε να βρούμε είναι ότι η πιθανότητα υποβάθμισης είναι περίπου στο μισό ( Wiser, 2011), και ο συνδυασμός αυτών των δύο αποδίδει μια τιμή 1/4. Ως εκ τούτου, θέσαμε Π(μιΜ|Η1) = .25.

Π(μιΜ|Η2): Ποια είναι η πιθανότητα αντιστοίχισης DNA κάτω από Η2, η υπόθεση μόλυνσης; Εδώ ρωτάμε ποια είναι η πιθανότητα αντιστοίχισης μέσω μόλυνσης. Η καλύτερη εκτίμηση που μπορούμε να τεκμηριώσουμε είναι 1 στις 1500 (Kloosterman et al. 2014). Περαιτέρω συζήτηση παρέχεται στους Wixted et al. (2018). Ως εκ τούτου, ορίζουμε (P (E_| H_ <2>) = 6,67 φορές 10^<-4> ).

Π(μιμικρό|Η1): Ποια είναι η πιθανότητα το δείγμα DNA να είναι από σάλιο κάτω Η1; Σε περίπου το 1/2 των σκηνών εγκλήματος μπορεί να ανακτηθεί το σάλιο του δράστη (Cross et al., 2014). Ως εκ τούτου, θέσαμε Π(μιμικρό|Η1) = .5.

Π(μιμικρό|Η2): Η πιθανότητα ότι το δείγμα DNA προέρχεται από σάλιο είναι 1,0 κάτω Η2 όπως είναι γνωστό ότι το δείγμα του Λάιτερμαν προήλθε από παρειακή μπατονέτα.

Π(μιμι|Η1): Το DNA του Leiterman βρέθηκε στα υλικά της σκηνής του εγκλήματος του Mixer, αλλά του Mixer όχι. Αυτό δεν είναι συχνό φαινόμενο. Σε μελέτες προσομοίωσης όπου τα ρούχα του θύματος βρίσκονται σε επαφή με έναν δράστη, περίπου το 85% των περιπτώσεων, το DNA του θύματος βρίσκεται σε μεγαλύτερες συγκεντρώσεις σε αυτό το ρούχο από το DNA του δράστη (Breathnach, Williams, McKenna, & amp Moore 2016). Ως εκ τούτου, θέσαμε Π(μιμι|Η1) = .15.

Π(μιμι|Η2): Σύμφωνα με το σενάριο μόλυνσης, είναι λογικό ότι η συγκέντρωση του Leiterman είναι μεγαλύτερη από αυτή του Mixer. Το DNA του Leiterman προέρχεται από ένα σκόπιμο στυλεό που έχει σχεδιαστεί για να μεγιστοποιήσει την πιθανότητα εξαγωγής ενός προφίλ. Με βάση την υπάρχουσα βιβλιογραφία, οι Wixted et al. συμπέρανε ότι ένα χαμηλότερο όριο σε Π(μιμι|Η2) = .575, μια τιμή που χρησιμοποιούμε εδώ.

Π(μιντο|Η1): Υπό Η1, δεν υπάρχει απαίτηση να αναλύονται ταυτόχρονα το DNA του Leiterman και του Mixer. Στην πραγματικότητα, φαίνεται ανησυχητικά συμπτωματικό υπό αυτήν την υπόθεση ότι ο Λάιτερμαν και ο Μίξερ, δύο άγνωστοι, συναντήθηκαν το 1969 και στη συνέχεια έγινε αλληλουχία του DNA τους ταυτόχρονα 33 χρόνια αργότερα. Πόσο πιθανό είναι η αλληλουχία τους ταυτόχρονα; Αυτή η πιθανότητα είναι δύσκολο να υπολογιστεί επειδή υπάρχει αυτό που είναι γνωστό ως πρόβλημα κλάσης αναφοράς (Hájek, 2007). Εκτιμούμε τις πιθανότητες ρωτώντας τη συχνότητα των γεγονότων από μια κλάση αναφοράς. Για παράδειγμα, σε αναστροφή νομισμάτων, μπορεί να εκτιμήσουμε μια πιθανότητα ρωτώντας πόσες επιτυχίες από την κλάση αναφοράς που είναι όλες αναστροφές. Μερικές φορές, ωστόσο, η κλάση αναφοράς δεν είναι προφανής και δεν είναι προφανής εδώ. Γνωρίζουμε πόσα δείγματα αλληλουχήθηκαν ταυτόχρονα με το Mixer's και αυτός ο αριθμός είναι 5000 αλλά από τι εξέρχεται, δηλαδή ποια είναι η κατάλληλη κατηγορία αναφοράς; Μια λογική κατηγορία αναφοράς είναι όλα τα άτομα που αναλύθηκαν στο ίδιο εργαστήριο πριν από το Mixer's άλλο είναι όλοι οι άνθρωποι αναλύθηκαν σε όλα τα εργαστήρια των ΗΠΑ πριν από το Mixer's και ένα τρίτο είναι όλοι οι άνθρωποι που αναλύθηκαν μέχρι σήμερα στο εργαστήριο του Μίσιγκαν ή σε όλα τα εργαστήρια των ΗΠΑΤο Η προσέγγισή μας είναι να χρησιμοποιήσουμε τη μικρότερη λογική κατηγορία αναφοράς για να μεγιστοποιήσουμε την πιθανότητα. Μια τέτοια μεγιστοποίηση είναι υπέρ της δίωξης καθώς αυξάνει την υπολογιζόμενη αξία της πιθανότητας ενοχής. Για το σκοπό αυτό, θεωρούμε την κατηγορία αναφοράς όλα τα άτομα των οποίων το DNA αναλύθηκε στο εργαστήριο του Michigan State πριν ή ταυτόχρονα με την ανάλυση του Mixer. Ο αριθμός των ατόμων σε αυτή τη μικρότερη λογική κατηγορία αναφοράς είναι 42.000 (Wixted et al., 2018) και, κατά συνέπεια, Π(μιντο|Η1) = 5000/42000 = .12

Π(μιντο|Η2): Σε περίπτωση μόλυνσης, η πιθανότητα σύγχρονης ανάλυσης πρέπει να είναι 1.0.

Υπολογισμοί

Συνδυάζοντας τις παραπάνω εξισώσεις αποδίδουμε:

Η αντικατάσταση των παραπάνω τιμών αποφέρει πιθανότητες ενοχής:

Και πάλι, οι πιθανότητες είναι περίπου 34 προς 1 υπέρ της αθωότητας.

Αυτές οι πιθανότητες ενοχής μπορεί να μετατραπούν σε πιθανότητα από την ισότητα Π = ο/(ο + 1), όπου Π είναι η πιθανότητα και ο είναι οι πιθανότητες. Σε αυτή την περίπτωση, η πιθανότητα ενοχής είναι περίπου 0,0283, ή λίγο λιγότερο από 3%.


Κάνοντας ανάλυση δεδομένων Bayesian

Ένα νέο άρθρο στο Psychological Science † επισημαίνει σωστά τα ελαττώματα Π αξιών και διαδικασιών που προκαλούν προκατάληψη στην επιλογή και ανάλυση δεδομένων. Το άρθρο βγάζει αρκετά λογικά συμπεράσματα. Δυστυχώς, βγάζει επίσης δύο λανθασμένα συμπεράσματα για θέματα θεμελιώδους σημασίας με σημαντικές επιπτώσεις.

Ένα συμπέρασμα είναι ότι Π οι τιμές είναι εντάξει, αλλά πρέπει να διορθωθούν για να σταματήσει η πρόθεση του ερευνητή. Διαψεύδω αυτόν τον ισχυρισμό με αναγωγικό και παράλογο. Ένα δεύτερο συμπέρασμα είναι ότι η ανάλυση Bayes είναι μια «μη λύση» στο πρόβλημα των ερευνητών που έχουν πάρα πολύ χώρο. Αμφισβητώ αυτόν τον ισχυρισμό διευκρινίζοντας ποια προβλήματα μπορεί ή δεν μπορεί να αντιμετωπίσει οποιαδήποτε μέθοδος ανάλυσης, αρνούμενη την ευελιξία που αποδίδεται στην ανάλυση Bayes και η οποία δεν είναι πραγματικά διαθέσιμη, και διεκδικώντας την πραγματική ευελιξία στην ανάλυση Bayes ως σημαντικό πλεονέκτημα για την επιστημονική έρευνα.

Το πρώτο θέμα πηγάζει από το γεγονός, που σωστά επισημάνθηκε στο άρθρο, ότι Π οι τιμές εξαρτώνται από την πρόθεση διακοπής του συλλέκτη δεδομένων. Ιδού η ιδέα. Ας υποθέσουμε ότι ένας ερευνητής συλλέγει κάποια δεδομένα και υπολογίζει μια συνοπτική στατιστική, όπως π.χ. τ ή φά ή χ 2. ο Π τιμή είναι η πιθανότητα του παρατηρηθέντος στατιστικού, ή μια τιμή πιο ακραία, στο χώρο των πιθανών δεδομένων που θα μπορούσαν να είχαν ληφθεί εάν η μηδενική υπόθεση ήταν αληθινή και το επιδιωκόμενο πείραμα επαναλαμβανόταν άπειρα. Ο χώρος των πιθανών δεδομένων που μπορεί να έχουν ληφθεί εξαρτάται από την πρόθεση διακοπής. Έτσι, εάν ο συλλέκτης δεδομένων σκόπευε να σταματήσει όταν το μέγεθος δείγματος Ν έφτασε σε έναν συγκεκριμένο αριθμό, όπως 23, τότε ο χώρος των πιθανών δεδομένων περιλαμβάνει όλα τα σύνολα δεδομένων για τα οποία N = 23. Αλλά αν ο συλλέκτης δεδομένων σκόπευε να σταματήσει στο τέλος της εβδομάδας (και μόλις έτυχε να πάρει N = 23), τότε ο χώρος των πιθανών δεδομένων περιλαμβάνει όλα τα σύνολα δεδομένων που θα μπορούσαν να είχαν συλλεχθεί μέχρι το τέλος της εβδομάδας, μερικά από τα οποία έχουν Ν = 23, και μερικά από τα οποία έχουν μικρότερο Ν ή μεγαλύτερο Ν. Επειδή οι δύο χώροι των πιθανών συνόλων δεδομένων δεν είναι οι ίδιοι, το Π οι τιμές δεν είναι ίδιες. ο Π η αξία μπορεί να εξαρτηθεί δραματικά από την πρόθεση διακοπής. Για παράδειγμα, εάν ο ερευνητής σκόπευε να σταματήσει όταν N = 100 αλλά διακόπηκε απροσδόκητα όταν N = 23, το Π η τιμή είναι πολύ μικρότερη από ό, τι αν η πρόθεση ήταν να σταματήσει όταν N = 23. Or, εάν ο ερευνητής σκόπευε να σταματήσει όταν Ν = 23 αλλά έλαβε μια απροσδόκητη απροσδόκητη πληροφορία ώστε Ν = 100, ίσως επειδή εμφανίστηκε ένας νέος εθελοντής βοηθός, τότε το Π η τιμή είναι πολύ μεγαλύτερη από ό, τι αν ο ερευνητής σκόπευε να σταματήσει στο Ν = 100. Επομένως, για τον σωστό προσδιορισμό του Π αξία για ένα σύνολο δεδομένων, πρέπει να γνωρίζουμε τον λόγο που σταμάτησε η συλλογή δεδομένων.

Ακολουθεί ένα παράδειγμα σωστής χρήσης του Π αξίες. Ένας διευθυντής εργαστηρίου έχει κάποια έρευνα στο μυαλό και αποφασίζει ότι το N = 30 είναι επαρκές. Ο διευθυντής λέει στον διαχειριστή του εργαστηρίου να συλλέξει δεδομένα από 30 άτομα. Ο διαχειριστής γνωρίζει ότι το εργαστήριο συνήθως στρατολογεί περίπου 30 άτομα σε μια εβδομάδα και επομένως λέει στον βοηθό συλλογής δεδομένων να εκτελεί θέματα για μια εβδομάδα. Ο βοηθός συλλέγει τακτικά τα δεδομένα και στο τέλος της εβδομάδας ο διευθυντής του εργαστηρίου τυχαίνει να είναι παρών καθώς συλλέγεται το τελευταίο στοιχείο, το οποίο τυχαίνει να είναι N = 30. Όσο μπορεί να πει ο διευθυντής του εργαστηρίου, η συλλογή δεδομένων σταμάτησε σκόπιμα όταν Ν = 30. Όταν ο διευθυντής του εργαστηρίου αναλύει τα δεδομένα, με την πρόθεση να σταματήσει όταν N = 30, ένα συγκεκριμένο Π υπολογίζεται η τιμή. Αλλά όταν ο βοηθός αναλύσει τα δεδομένα, με την πρόθεση να σταματήσει στο τέλος της εβδομάδας, α διαφορετικός Π υπολογίζεται η τιμή. Στην πραγματικότητα, για τον διευθυντή του εργαστηρίου Π& lt.05, αλλά για τον βοηθό Π& gt.05. Οι οποίες Π η τιμή είναι σωστή; Είναι τα αποτελέσματα «σημαντικά»;

Εδώ είναι ένα άλλο παράδειγμα της σωστής χρήσης του Π αξίες. Δύο ανταγωνιστικά εργαστήρια ακολουθούν τον ίδιο τύπο έρευνας σε ένα καλά εδραιωμένο πειραματικό παράδειγμα. Τα δύο εργαστήρια έχουν ανεξάρτητα την ίδια ιδέα για πανομοιότυπο σχέδιο πειράματος και οι ερευνητές συλλέγουν δεδομένα. Σε ένα εργαστήριο, σκοπεύουν να συλλέξουν δεδομένα για μια εβδομάδα και τυχαίνει να πάρουν N = 30. Στο άλλο εργαστήριο, σκοπεύουν να σταματήσουν τη συλλογή δεδομένων όταν Ν = 30. Επιπλέον, τυχαία, τα δεδομένα στα δύο εργαστήρια τυγχάνουν πανομοιότυπα. (Αυτό δεν είναι τόσο αποδεκτό π.χ. Π τιμές για τα πανομοιότυπα σύνολα δεδομένων τους. Τα δύο Π οι τιμές είναι διαφορετικές επειδή τα δεδομένα συλλέχθηκαν με διαφορετικές προθέσεις διακοπής στην πραγματικότητα Π& lt.05 για ένα εργαστήριο αλλά Π& gt.05 για το άλλο εργαστήριο. Ποιο εργαστήριο έλαβε "σημαντικά" δεδομένα;

Το πρόβλημα είναι ότι τα δεδομένα δεν φέρουν καμία υπογραφή της πρόθεσης διακοπής του ερευνητή. Πράγματι, οι ερευνητές βάζουν τα πάντα για να βεβαιωθούν ότι τα δεδομένα δεν επηρεάζονται από την πρόθεσή τους να σταματήσουν. Κάθε δεδομένο που συλλέγεται υποτίθεται ότι είναι πλήρως απομονωμένο από τυχόν δεδομένα που συλλέγονται πριν ή μετά. Το τελευταίο δεδομένο που συλλέχθηκε δεν έχει ίχνος ότι ήταν το τελευταίο ή το πρώτο ή οποιαδήποτε ενδιάμεση θέση.

Όχι μόνο η πρόθεση είναι αδιαφανής για τα δεδομένα, είναι συχνά αδιαφανής για τον ερευνητή. Οι συνεργάτες σε ένα έργο μπορεί να έχουν διαφορετικές προθέσεις δειγματοληψίας (όπως στο παράδειγμα του σκηνοθέτη και του βοηθού, παραπάνω). Or η πρόθεση δειγματοληψίας μπορεί να αλλάξει στα μέσα της συλλογής δεδομένων. ("Ας συλλέξουμε N = 100." Στη συνέχεια, το απόγευμα της Παρασκευής, "Λοιπόν, έχουμε N = 94, αυτό είναι αρκετά καλό.") Or, όπως συμβαίνει συχνά, ορισμένα θέματα πρέπει να διαγραφούν από το σύνολο δεδομένων λόγω διαδικαστικών σφάλματα ή αδυναμία απάντησης, παρά την πρόθεση του συλλέκτη δεδομένων σχετικά με το μέγεθος του δείγματος ή τον χρόνο διακοπής. Όλες αυτές είναι πολύ ρεαλιστικές διαδικασίες δειγματοληψίας και τις ανεχόμαστε επειδή γνωρίζουμε ότι τα δεδομένα δεν επηρεάζονται εντελώς από την πρόθεση του ερευνητή.

Επομένως, είναι περίεργο ότι η ερμηνεία των δεδομένων ως προς Π οι τιμές θα πρέπει να εξαρτώνται καθοριστικά από κάτι που δεν έχει αντίκτυπο στα δεδομένα, δηλαδή την πρόθεση διακοπής. Όμως, ο σωστός υπολογισμός του Π οι τιμές εξαρτώνται από την πρόθεση διακοπής.

Λοιπόν, τι πρέπει να γίνει για αυτό το πρόβλημα; Λαμβάνοντας υπόψη τα παραπάνω παραδείγματα, φαίνεται σαφές ότι πρέπει να αντιμετωπίσουμε Π τιμές ως εγγενώς κακώς καθορισμένες επειδή εξαρτώνται από προθέσεις που δεν έχουν σημασία για τα δεδομένα.

Αλλά εδώ είναι η #1 σύσταση από το νέο άρθρο στην ologicalυχολογική Επιστήμη:

Πιθανώς αυτή η απαίτηση δηλώνεται έτσι ώστε οι ερευνητές να μπορούν να χρησιμοποιήσουν τον κανόνα διακοπής για να υπολογίσουν το αληθινό και σωστό Π αξία, καθορισμένη κατάλληλα για τις ιδιόρρυθμες προθέσεις των ερευνητών. Εδώ είναι ένα εύλογο παράδειγμα. "Αποφασίσαμε να συλλέξουμε 100 παρατηρήσεις, αλλά μέχρι την Παρασκευή είχαμε 94 και καταλήξαμε ότι ήταν αρκετά κοντά, οπότε σταματήσαμε και στη συνέχεια έπρεπε να διαγράψουμε 5 άτομα λόγω μεταγενέστερων ανακαλυφθέντων σφαλμάτων μεταγραφής. Μια μετα-πειραματική έρευνα της ομάδας του εργαστηρίου αποκάλυψε ότι ένας από τους βοηθούς μας σκόπευε να εγκαταλείψει τη δουλειά τη Δευτέρα, γεγονός που θα περιόριζε τη συλλογή δεδομένων μας αν δεν είχαμε αποφασίσει να σταματήσουμε την Παρασκευή. Επομένως, εκτελώντας μια μεγάλη προσομοίωση του Μόντε Κάρλο που ενσωμάτωσε το εκτιμώμενο ποσοστό πρόσληψης ατόμων κατά τη διάρκεια της εβδομάδα, και την εκτιμώμενη πιθανότητα να αποφασίσουμε να σταματήσουμε την Παρασκευή για διαφορετικές τιμές Ν που επιτεύχθηκε την Παρασκευή, και την εκτιμώμενη πιθανότητα σφάλματος μεταγραφής και την πιθανότητα να αποχωρήσει ένας βοηθός τη Δευτέρα, προσδιορίσαμε ότι Π=. "

Για να διευκολύνει την αναφορά αληθινών και σωστών Π θα ήταν εξαιρετικά χρήσιμο να υπάρχουν κρίσιμες τιμές για στατιστικά που χρησιμοποιούνται συνήθως (τ, φάκ.λπ.) υπό διάφορες τυπικές προθέσεις διακοπής που υιοθετούν οι ερευνητές. Όλες οι κρίσιμες αξίες στα σύγχρονα βιβλία και προγράμματα υπολογιστών υποθέτουν την μη ρεαλιστική σύμβαση ότι το Ν είχε καθοριστεί εκ των προτέρων. Αντ 'αυτού, θα πρέπει να έχουμε πίνακες κρίσιμων τιμών για διακοπή μετά από μια ορισμένη διάρκεια, με ποικιλία ποσοστών δειγματοληψίας κατά τη διάρκεια αυτού του διαστήματος. (Στην πραγματικότητα, έχω ήδη σπείρει αυτήν τη διαδικασία με ένα παράδειγμα σε αυτό το άρθρο.) Ως εκ τούτου, οι ερευνητές θα μπορούσαν να αποκτήσουν το αληθινό Π τιμές για τα δεδομένα τους, εάν σκόπευαν να σταματήσουν μετά από μια συγκεκριμένη διάρκεια.

Θα ήταν επίσης χρήσιμο να υπάρχουν συντελεστές διόρθωσης για απροσδόκητες διακοπές στη συλλογή δεδομένων ή απρόσμενες εκπτώσεις της συλλογής δεδομένων. Ο ερευνητής θα έπρεπε απλώς να εισαγάγει το προβλεπόμενο μέγεθος δείγματος και την πιθανότητα διακοπής ή αύξησης (και την πιθανότητα κάθε μεγέθους αύξησης) οποιαδήποτε στιγμή κατά τη συλλογή δεδομένων και ο συντελεστής διόρθωσης θα παρήγαγε το αληθινό και σωστό Π αξία για τα δεδομένα.

Οι ομοσπονδιακοί οργανισμοί χρηματοδότησης ήταν ιδιαίτερα πρόθυμοι το τελευταίο διάστημα να υποστηρίξουν τις συνεργατικές προσπάθειες ομάδων ερευνητών. Είναι πιθανό ότι διαφορετικά μέλη της ομάδας μπορεί να έχουν διαφορετικές προθέσεις σχετικά με τη συλλογή δεδομένων (ίσως κρυφά ή υποσυνείδητα, αλλά πάντως φυλάσσονται). Επομένως, θα ήταν εξαιρετικά χρήσιμο να δημιουργηθούν πίνακες με πραγματικές και σωστές κρίσιμες τιμές για περιπτώσεις παράλληλων μικτών προθέσεων, όταν ο ένας συνεργάτης σκοπεύει να σταματήσει σε ένα σταθερό μέγεθος δείγματος και ο άλλος συνεργάτης σκοπεύει να σταματήσει στο τέλος της εβδομάδας. Σαφώς, η κατασκευή αυτών των πινάκων θα πρέπει να αποτελεί σημαντική χρηματοδοτική προτεραιότητα για τους οργανισμούς χορηγίας.

Ανυπομονώ για μια νέα βιομηχανία εκδόσεων που θα αποκαλύψει κατάλληλες διορθώσεις για διαφορετικές προθέσεις δειγματοληψίας. Ευτυχώς, έχουμε ήδη ένα μοντέλο αυτής της βιομηχανίας στην εκτενή βιβλιογραφία σχετικά με τη διόρθωση ψευδών συναγερμών σε πολλές συγκρίσεις. Ανάλογα με τους τύπους των προβλεπόμενων συγκρίσεων, και εάν οι προθέσεις είναι προγραμματισμένες ή εκ των υστέρων, έχουμε μια σωρεία διορθώσεων για κάθε πιθανό σύνολο προβλεπόμενων συγκρίσεων. Δυστυχώς, όλες αυτές οι διορθώσεις για πολλαπλές συγκρίσεις βασίστηκαν στην υπόθεση δειγματοληψίας ότι η συλλογή δεδομένων σταμάτησε σε σταθερό μέγεθος δείγματος! Επομένως, κάθε μία από τις διορθώσεις για πολλαπλές συγκρίσεις θα πρέπει να επαναληφθεί για διαφορετικές προθέσεις διακοπής. Θα είναι μια μεγάλη μέρα για την επιστήμη όταν έχουμε ένα πλήρες σύνολο διορθώσεων για όλες τις διάφορες προθέσεις σχετικά με πολλαπλές συγκρίσεις και προθέσεις σχετικά με τη διακοπή της συλλογής δεδομένων, γιατί τότε θα γνωρίζουμε την αλήθεια και τη σωστή Π τιμές για τα δεδομένα μας, τα οποία ήταν εντελώς απομονωμένα από αυτές τις προθέσεις.

Ωχ! Συγγνώμη, έπεσα στον σαρκασμό. Αλλά γεια, είναι δικό μου blogΤο Πρέπει να επαναλάβω ότι συμφωνώ με πολλά από τα σημεία που έκαναν οι συντάκτες του άρθρου της ologicalυχολογικής Επιστήμης. Απλά δεν είναι το θέμα Π αξίες και διακοπή προθέσεων. Και ένα ακόμη σημείο, σχετικά με μια διαφορετική μέθοδο ανάλυσης που οι συγγραφείς απέρριψαν ως "μη λύση". Ακολουθεί το σχετικό απόσπασμα:

Είναι σημαντικό να είναι σαφές ότι η στατιστική ανάλυση οποιουδήποτε είδους μπορεί να ασχοληθεί μόνο με τα δεδομένα που παρέχει. Εάν ο σχεδιασμός και η διαδικασία συγκεντρώσουν προκατειλημμένα δεδομένα, καμία ανάλυση δεν μπορεί να αναιρέσει πλήρως αυτήν την προκατάληψη. Σκουπίδια μέσα, σκουπίδια έξω. Εάν το πρόβλημα "πάρα πολλών ελευθεριών ερευνητών" πηγάζει από προβλήματα σχεδιασμού και διαδικασίας, τότε χρειάζεται λύσεις σχεδιασμού και διαδικασίας. Το να πούμε ότι η ανάλυση Bayes είναι μια μη λύση σε ένα πρόβλημα σχεδιασμού και διαδικασίας είναι σαν να λέμε ότι ένας μύλος κρέατος είναι μια μη λύση για το κατεστραμμένο κρέας (και ότι επομένως ο μύλος κρέατος είναι άχρηστος) (και αφήνοντας τον αναγνώστη να κάνει το άλμα ότι επομένως ο μύλος κρέατος είναι άχρηστος). 1

Οι συγγραφείς υποστηρίζουν ότι η ανάλυση Bayes "αυξάνει τους βαθμούς ελευθερίας των ερευνητών" (και ως εκ τούτου είναι κακή) με δύο τρόπους. Πρώτον, "προσφέρει ένα νέο σύνολο αναλύσεων (επιπλέον όλων των συχνών)". Η σιωπηρή υπόθεση αυτής της δήλωσης φαίνεται να είναι ότι οι ερευνητές θα δοκίμαζαν συχνές και Bayesian προσεγγίσεις και θα αναφέρουν απλώς αυτήν που έδωσε το πιο κολακευτικό συμπέρασμα. Όχι, αυτό δεν θα πετάξει. Οι αναλύσεις Bayes παρέχουν τις πληρέστερες συμπερασματικές πληροφορίες με δεδομένα τα δεδομένα (με την κανονιστική μαθηματική έννοια) και οι αναλυτές δεν μπορούν απλώς να μπουν σε συχνότητα επειδή είναι κολακευτικό. Στην πραγματικότητα, η αναφορά α Π η αξία είναι ντροπιαστική, όχι κολακευτική, γιατί Π οι τιμές δεν έχουν καθοριστεί σωστά.

Δεύτερον, λένε οι συγγραφείς, "οι στατιστικές Bayes απαιτούν πρόσθετες κρίσεις (π.χ. η προηγούμενη διανομή)." Α, ο ασταμάτητος άντρας των προγόνων είναι τρομαγμένος για να τρομάξει τα παιδιά, λες και οι πρόγονοι μπορούν να προσαρμοστούν ιδιότροπα σε οτιδήποτε θέλει ο αναλυτής (εισάγετε εδώ ήχους από τρελό, πονηρό γέλιο) και έτσι προκαθορίζουν το συμπέρασμα. Στην πραγματικότητα, οι προτεραιότητες είναι εμφανείς και ρητά αποδεκτές σε ένα σκεπτικό επιστημονικό κοινό. Συνήθως, είναι μη δεσμευτικοί έτσι ώστε να έχουν ελάχιστη επιρροή στην μετέπειτα κατανομή. Όταν υπάρχει σημαντική προηγούμενη έρευνα για την ενημέρωση ενός προηγούμενου, τότε ένα ισχυρό προηγούμενο μπορεί να δώσει μεγάλη συμπερασματική μόχλευση σε μικρά δείγματα. Και δεν η χρήση ισχυρών προηγούμενων πληροφοριών όταν είναι διαθέσιμες μπορεί να είναι σοβαρή γκάφα, εξετάστε τυχαίες δοκιμές φαρμάκων και διάγνωση ασθενειών, οι οποίες πρέπει να λαμβάνουν υπόψη τα βασικά ποσοστά, δηλαδή τα προγενέστερα.

Στην πραγματικότητα, η Bayesian ανάλυση δίνει στους αναλυτές περισσότερη ευελιξία από την παραδοσιακή συχνή ανάλυση. Δίνει στον αναλυτή την ευελιξία να χρησιμοποιήσει ένα μοντέλο που περιγράφει πραγματικά τις τάσεις και τις κατανομές που παρουσιάζονται στα δεδομένα, αντί να είναι κορνίζες σε γραμμικά μοντέλα και κανονικές κατανομές που μπορεί να έχουν μικρή ομοιότητα με τα δεδομένα. (Φυσικά, αν ο αναλυτής θέλει γραμμικά μοντέλα με κανονικές κατανομές, η Bayesian ανάλυση παρέχει το πιο πλούσιο δυνατό συμπέρασμα σχετικά με τις παραμέτρους τους χωρίς να υπολογίσει ποτέ Π ). Με την ανάλυση Bayes, οι ερευνητές μπορούν πραγματικά να λάβουν χρήσιμες παραμετρικές περιγραφές πολύπλοκων δεδομένων, που περιλαμβάνουν μη γραμμικά μοντέλα πολλαπλών επιπέδων με μη φυσιολογικές κατανομές σε διάφορα επίπεδα σε όλο το μοντέλο.Αυτή είναι η ευελιξία που χρειάζεται η επιστημονική θεωρητικοποίηση.


† Simmons, J. P., Nelson, L. D., & amp Simonsohn, U. (2011). Falευδώς θετική ψυχολογία: Η αδιευκρίνιστη ευελιξία στη συλλογή και ανάλυση δεδομένων επιτρέπει την παρουσίαση οτιδήποτε ως σημαντικό. Psychυχολογική Επιστήμη, πρωτοδημοσιεύτηκε online 17 Οκτωβρίου 2011. DOI: 10.1177/0956797611417632

1 Αναθεώρηση στην παραθετική παρατήρηση που έγινε στις 23 Οκτωβρίου 2011, ως απάντηση στην προσωπική επικοινωνία του Uri Simonsohn. Η έκδοση Struck-out ήταν στην αρχική δημοσίευση, η οποία θα μπορούσε κατά λάθος να ερμηνευτεί ως δήλωση ότι οι ίδιοι οι συγγραφείς έκαναν ρητά το επιχείρημα του μύλου κρέατος-είναι-άχρηστο. Αυτοί δεν.


Περιορισμοί και βελτιστοποιήσεις

Η βελτιστοποίηση του συμπεράσματος Bayes εξαρτάται από το υποτιθέμενο μοντέλο. Οι πιθανολογίες του Bayesian βαθμονομούνται ως μακροπρόθεσμοι μέσοι όροι εάν οι παράμετροι αντλούνται από την προηγούμενη κατανομή και τα δεδομένα αντλούνται από το μοντέλο των δεδομένων με αυτές τις παραμέτρους. Γεγονότα με δηλωμένη πιθανότητα συμβαίνουν σε αυτήν τη συχνότητα μακροπρόθεσμα, όταν ο μέσος όρος είναι πάνω στο γεννητικό μοντέλο. Στην πράξη, τα μοντέλα μας δεν είναι ποτέ σωστά. Υπάρχουν δύο τρόποι με τους οποίους θα θέλαμε να ξεπεράσουμε αυτόν τον περιορισμό: εντοπίζοντας και διορθώνοντας προβλήματα με το μοντέλο και αποδεικνύοντας ότι ορισμένα συμπεράσματα είναι ισχυρά για λογικές αποκλίσεις από το μοντέλο.

Ακόμα και οι απλούστερες και πιο αποδεκτές συμπεράσματα του Bayes μπορούν να έχουν σοβαρούς περιορισμούς. Για παράδειγμα, ας υποθέσουμε ότι διεξάγεται ένα πείραμα που δίνει μια αμερόληπτη εκτίμηση z μιας παραμέτρου θ που αντιπροσωπεύει το αποτέλεσμα κάποιας θεραπείας. Αν αυτή η εκτίμηση z κανονικά κατανέμεται με τυπικό σφάλμα μικρό, μπορούμε να γράψουμε z

Ν(θ, μικρό 2), μια κανονική κατανομή που παραμετροποιείται από την παράμετρο θέσης και κλίμακας. Υποθετω πως θ έχει μια επίπεδη ομοιόμορφη προηγούμενη κατανομή, τότε η οπίσθια κατανομή είναι θ

Ν(z, μικρό 2). Τώρα ας υποθέσουμε ότι παρατηρούμε z = μικρό δηλαδή, η εκτίμηση του θ είναι ένα τυπικό σφάλμα από το μηδέν. Αυτό θα θεωρηθεί στατιστικά αδιάκριτο από το θόρυβο, με την έννοια ότι μια τέτοια εκτίμηση θα μπορούσε να συμβεί τυχαία, ακόμη και αν η πραγματική τιμή παραμέτρου ήταν μηδέν. Αλλά ο υπολογισμός Bayes δίνει μια μετέπειτα πιθανότητα Pr (θ & gt 0 |z) = 0,84. Αυτό καθιστά αμφισβητήσιμη τη βαθμονόμηση της πιθανότητας (βαθμονομημένα συμπεράσματα ή προβλέψεις είναι σωστά κατά μέσο όρο, υπό όρους από την πρόβλεψη).

Σε αυτό το παράδειγμα, η πιθανότητα βαθμονομείται εάν έχετε μέσο όρο έναντι του προηγούμενου. Είναι μαθηματικά αδύνατο να γίνει ο μέσος όρος για μια ομοιόμορφη κατανομή σε ένα άπειρο εύρος, αλλά θα μπορούσαμε να εξετάσουμε μια πολύ διάχυτη προηγούμενη, για παράδειγμα θ

Ν(0, 1.000 2), όπου υποθέτουμε ότι μικρό είναι κατά προσέγγιση σε κλίμακα μονάδας, είναι δηλαδή μια παράμετρος χωρίς διάσταση που αναμένεται να λάβει μια τιμή όχι πολύ μακριά από μία σε απόλυτη τιμή. Με αυτό το μοντέλο, όταν z παρατηρείται ίσο μικρό, η παράμετρος θ θα είναι θετική περίπου στο 84% των περιπτώσεων. Ο λόγος για τον οποίο η πιθανότητα 84% δεν φαίνεται σωστή είναι ότι η στολή, ή πολύ διάχυτη, προηγουμένως δεν φαίνεται γενικά κατάλληλη. Στην πράξη, οι μελέτες έχουν σχεδιαστεί για να εκτιμούν τα αποτελέσματα της θεραπείας με ένα λογικό επίπεδο ακρίβειας. Τα πραγματικά εφέ μπορεί να είναι 1 ή 2 τυπικά σφάλματα από το 0, αλλά σπάνια απέχουν 5, 10 ή 100 τυπικά σφάλματα. Σε αυτό το παράδειγμα, το συμπέρασμα Bayes, αν ληφθεί κυριολεκτικά, θα οδηγούσε σε υπερβολική βεβαιότητα: μια 84% πίσω πιθανότητα. Ωστόσο, ένας θετικός τρόπος για να το δούμε αυτό είναι ότι το προφανές πρόβλημα με το πίσω μέρος μας επέτρεψε να αναγνωρίσουμε ότι υπήρχαν διαθέσιμες προηγούμενες πληροφορίες που δεν είχαμε συμπεριλάβει στο μοντέλο μας, σε αυτήν την περίπτωση, προηγούμενες πληροφορίες που είναι απίθανο να δούμε πολύ μεγάλες αξίες του θΤο Επιπλέον, ένα ασθενώς ενημερωτικό προηγούμενο όπως π.χ. θ

Ν(0, μικρό 2) δεν έχει μεγάλη επίπτωση στο οπίσθιο, καθώς τότε το οπίσθιο γίνεται φυσιολογικό:

έτσι Pr (θ & gt 0 |z) = 0,76, σε σύγκριση με 0,84 από το προηγούμενο παράδειγμα μας. Τελικά, μόνο μια ισχυρή προτεραιότητα θα κάνει τη μεγάλη διαφορά. Οι πιθανότητες Bayes βαθμονομούνται μόνο όταν υπολογίζονται οι μέσοι όροι επί της πραγματικής προηγούμενης ή πληθυσμιακής κατανομής των παραμέτρων. Το σημαντικό σε αυτό το παράδειγμα δεν είναι οι συγκεκριμένοι αριθμοί, οι οποίοι θα εξαρτηθούν από το πλαίσιο, αλλά η ιδέα ότι κάθε στατιστική μέθοδος θα πρέπει να αξιολογηθεί στο εύρος των προβλημάτων στα οποία θα εφαρμοστεί.

Γενικότερα, τα μοντέλα Bayes μπορούν να ελεγχθούν συγκρίνοντας τις προηγούμενες προσομοιώσεις πρόβλεψης με τα δεδομένα 135 και με την εκτίμηση του προγνωστικού σφάλματος εκτός δείγματος 202. Υπάρχει ένα όφελος από τις ισχυρές προηγούμενες διανομές που περιορίζουν τις παραμέτρους σε λογικές τιμές ώστε να επιτρέπεται η συμπερίληψη περισσότερων δεδομένων, ενώ αποφεύγεται η υπερπροσαρμογή. Περισσότερα δεδομένα μπορούν να προέλθουν από διάφορες πηγές, συμπεριλαμβανομένων πρόσθετων σημείων δεδομένων, πρόσθετων μετρήσεων στα υπάρχοντα δεδομένα και προηγούμενων πληροφοριών που συνοψίζουν άλλα δεδομένα ή θεωρίες. Όλες οι μέθοδοι, Bayesian και άλλες, απαιτούν υποκειμενική ερμηνεία για να πούμε μια αληθοφανή ιστορία και όλα τα μοντέλα προέρχονται από αποφάσεις ερευνητών. Οποιαδήποτε επιλογή μοντέλου έχει συνέπειες ότι το επίπεδο προηγούμενο είναι ασθενές, δεν παρέχει συρρίκνωση της εκτίμησης, αλλά μπορεί να οδηγήσει σε ένα ισχυρό, πιθανώς ακατάλληλο, επίπεδο βεβαιότητας για θ.


Εισαγωγή

Οι μέθοδοι Bayes από μόνες τους δεν είναι ούτε σκοτεινές ούτε, πιστεύουμε, ιδιαίτερα δύσκολες. Με κάποιους τρόπους, ωστόσο, διαφέρουν ριζικά από τις κλασικές στατιστικές μεθόδους και ως εκ τούτου, βασίζονται σε έναν ελαφρώς διαφορετικό τρόπο σκέψης που μπορεί να φαίνεται ασυνήθιστος στην αρχή. Η Bayesian εκτίμηση των παραμέτρων συνήθως δεν θα καταλήξει σε μία μόνο εκτίμηση, αλλά θα αποφέρει μια σειρά εκτιμήσεων με ποικίλες αληθοφάνειες που σχετίζονται με αυτές και ο έλεγχος υπόθεσης Bayes σπάνια θα οδηγήσει σε παραποίηση μιας θεωρίας αλλά μάλλον σε αναδιανομή πιθανότητας μεταξύ ανταγωνιστικών λογαριασμών. Οι μέθοδοι Bayes δεν είναι επίσης νέες, με την πρώτη τους χρήση να χρονολογείται από τον 18ο αιώνα. Ούτε είναι καινούργιοι στην ψυχολογία: Εισήχθησαν στον χώρο πριν από 50 χρόνια, σε αυτό που σήμερα παραμένει μια εντυπωσιακά διορατική έκθεση των Ward Edwards, Harold Lindman και Savage (1963).

Παρ 'όλα αυτά, μέχρι πρόσφατα οι μέθοδοι Bayes δεν ήταν ιδιαίτερα συνηθισμένες στις κοινωνικές επιστήμες, οπότε η πρόσφατη αύξηση της υιοθέτησής τους σημαίνει ότι είναι νέες για τους περισσότερους επαγγελματίες - και για πολλούς ψυχολόγους, η εκμάθηση νέων στατιστικών τεχνικών μπορεί να προκαλέσει κατανοητά συναισθήματα άγχους ή τρόμου. Ταυτόχρονα, πρόσφατες αποκαλύψεις σχετικά με την αναπαραγωγιμότητα της ψυχολογικής επιστήμης (π.χ., Open Science Cooperation, 2015 Etz & amp Vandekerckhove, 2016) έχουν κεντρίσει το ενδιαφέρον για τις στατιστικές μεθόδους που βρίσκουν χρήση στον τομέα.

Στο παρόν άρθρο, παρέχουμε μια απαλή τεχνική εισαγωγή στο συμπέρασμα Bayesian (και θέτουμε το υπόλοιπο αυτού του ειδικού τεύχους Psychonomic Bulletin & amp Review), ξεκινώντας από τις πρώτες αρχές. Θα δώσουμε πρώτα μια σύντομη επισκόπηση που περιλαμβάνει τον ορισμό της πιθανότητας, τους βασικούς νόμους της θεωρίας πιθανοτήτων (το προϊόν και άθροισμα κανόνες πιθανότητας) και πώς ο κανόνας του Bayes και οι εφαρμογές του προκύπτουν από αυτούς τους δύο απλούς νόμους. Στη συνέχεια θα επεξηγήσουμε πώς μπορούν και πρέπει να χρησιμοποιηθούν οι νόμοι της πιθανότητας συμπέρασμα: για την εξαγωγή συμπερασμάτων από παρατηρούμενα δεδομένα. Δεν διστάζουμε να δείξουμε τύπους και μαθηματική έκθεση, αλλά όπου είναι δυνατόν τα συνδέουμε με ένα οπτικό βοήθημα, είτε σε σχήμα είτε σε πίνακα, για να κάνουμε τις έννοιες που αντιπροσωπεύουν πιο απτές. Παρέχουμε επίσης παραδείγματα μετά από κάθε κύρια ενότητα για να εξηγήσουμε πώς αυτές οι ιδέες μπορούν να εφαρμοστούν στην πράξη. Οι περισσότερες από τις βασικές ιδέες που περιγράφονται σε αυτό το έγγραφο απαιτούν μόνο μαθηματική ικανότητα στο επίπεδο της άλγεβρας του κολεγίου, όπως θα φανεί, πολλοί από τους τύπους λαμβάνονται με αναδιάταξη των εξισώσεων με δημιουργικούς τρόπους, έτσι ώστε η ποσότητα ενδιαφέροντος να βρίσκεται στην αριστερή πλευρά του μια ισότητα.

Σε οποιοδήποτε σημείο, οι αναγνώστες που ενδιαφέρονται περισσότερο για τη μεγαλύτερη εικόνα από τις τεχνικές λεπτομέρειες μπορούν να παραλείψουν με ασφάλεια τις εξισώσεις και να επικεντρωθούν στα παραδείγματα και τη συζήτηση. Ωστόσο, η χρήση λεκτικών εξηγήσεων αρκεί μόνο για να αποκτήσουμε μια επιφανειακή κατανόηση των υποκείμενων ιδεών και συνεπειών, οπότε παρέχουμε μαθηματικούς τύπους για τους αναγνώστες που ενδιαφέρονται για μια βαθύτερη εκτίμηση. Σε όλο το κείμενο, χρησιμοποιούμε περιστασιακά υποσημειώσεις για να παρέχουμε επιπλέον σημειωτικές διευκρινίσεις για τους αναγνώστες που ενδέχεται να μην είναι τόσο καλά γνώστες της μαθηματικής έκθεσης.

Ενώ υποστηρίζουμε ότι οι μαθηματικές βάσεις εξυπηρετούν την κατανόηση αυτών των μεθόδων με σημαντικούς τρόπους, θα πρέπει επίσης να επισημάνουμε ότι οι πρόσφατες εξελίξεις σχετικά με τα πακέτα στατιστικών λογισμικού Bayesian (π.χ., Wagenmakers, Love, et al., This issue Matzke, Boehm, & amp Vandekerckhove, this τεύχος van Ravenzwaaij, Cassey, & amp Brown, αυτό το ζήτημα Wagenmakers, Marsman, et al., this issue) έχουν καταστήσει δυνατή την εκτέλεση πολλών ειδών αναλύσεων Bayesian χωρίς την ανάγκη πραγματοποίησης οποιασδήποτε τεχνικής μαθηματικής προέλευσης. Η μαθηματική βάση που παρουσιάζουμε εδώ παραμένει, φυσικά, γενικότερη.

Πρώτον, ωστόσο, θα αφιερώσουμε λίγο χρόνο για να συζητήσουμε μια λεπτή σημασιολογική σύγχυση μεταξύ δύο ερμηνειών της βασικής έννοιας «πιθανότητα». Ο βιαστικός αναγνώστης μπορεί να παραλείψει με ασφάλεια το τμήμα που ακολουθεί (και να προχωρήσει στο "The Product and Sum Rules of Probability"), γνωρίζοντας μόνο ότι χρησιμοποιούμε τη λέξη "πιθανότητα" για να σημαίνει "ένα βαθμό πίστης": μια ποσότητα που δείχνει πόσο έντονα πιστεύουμε ότι κάτι είναι αληθινό.

Τι είναι πιθανότητα;

Σε όλο αυτό το κείμενο, θα ασχοληθούμε με την έννοια του πιθανότηταΤο Αυτό παρουσιάζει ένα άμεσο φιλοσοφικό πρόβλημα, επειδή η λέξη «πιθανότητα» είναι κατά κάποιον τρόπο διφορούμενη: περιστασιακά θα αλλάξει από το ένα νόημα στο άλλο και αυτή η διαφορά στο νόημα είναι μερικές φορές επιρροή.

Με μία έννοια - μερικές φορές ονομάζεται επιστημονική Ερμηνεία υποσημείωσης 1 - η πιθανότητα είναι α βαθμός πεποίθησης: είναι ένας αριθμός μεταξύ μηδέν και ενός που ποσοτικοποιεί πόσο έντονα πρέπει να πιστεύουμε ότι κάτι είναι αληθινό με βάση τις σχετικές πληροφορίες που έχουμε. Με άλλα λόγια, η πιθανότητα είναι μια μαθηματική γλώσσα για την έκφραση της αβεβαιότητάς μας. Αυτό το είδος πιθανότητας είναι εγγενώς υποκειμενικό - επειδή εξαρτάται από τις πληροφορίες που εσείς διαθέτουν —και λογικά άτομα μπορεί να διαφέρουν εύλογα στις πιθανότητες που αντιστοιχούν σε γεγονότα (ή προτάσεις). Σύμφωνα με την επιστημική ερμηνεία, δεν υπάρχει επομένως κάτι τέτοιο όπως ο πιθανότητα - υπάρχει μόνο τα δικα σου πιθανότητα (Lindley 2000). Η πιθανότητά σας μπορεί να θεωρηθεί ότι χαρακτηρίζει την κατάσταση της ελλιπούς γνώσης σας, και υπό αυτή την έννοια η πιθανότητα δεν υπάρχει πέρα ​​από το μυαλό σας.

Μπορούμε για παράδειγμα να πούμε "Υπάρχει 60% πιθανότητα ότι το Ηνωμένο Βασίλειο θα είναι εκτός Ευρωπαϊκής Ένωσης στις 31 Δεκεμβρίου 2018". Κάποιος που πιστεύει ότι υπάρχει 60% πιθανότητα να συμβεί αυτό το γεγονός θα πρέπει να είναι πρόθυμος να στοιχηματίσει μέχρι και $ 6 έναντι $ 4 στην εκδήλωση, επειδή το αναμενόμενο κέρδος τους θα ήταν τουλάχιστον 60% × (+4$ ) + 40% × (−6$), το οποίο είναι μηδέν. Με άλλα λόγια, το στοίχημα άνω των 6 δολαρίων θα ήταν αβέβαιο επειδή θα περίμεναν να χάσουν χρήματα και ότι η ανάληψη μιας τέτοιας ενέργειας δεν θα συνέρχομαι με αυτό που πιστεύουν. Φυσικά, στην επιστημονική πράξη κάποιος σπάνια αναγκάζεται να κάνει πραγματικά τέτοια στοιχήματα, αλλά θα ήταν ατυχές αν οι πιθανότητες μας (και ως εκ τούτου τα συμπεράσματά μας) δεν μπορούσαν να αξιοποιηθούν με σιγουριά εάν προκύψει μια τέτοια ευκαιρία (Hill 1974).

Το γεγονός ότι οι επιστημικές πιθανότητες γεγονότων είναι υποκειμενικές δεν σημαίνει ότι είναι αυθαίρετοςΤο Οι πιθανότητες δεν είναι πράξεις θέλησης, είναι υποκειμενικές απλώς με την έννοια ότι μπορεί να διαφέρουν από το ένα άτομο στο άλλο. Αυτό σημαίνει απλώς ότι διαφορετικοί άνθρωποι φέρνουν διαφορετικές πληροφορίες σε ένα δεδομένο πρόβλημα. Επιπλέον, εάν διαφορετικοί άνθρωποι ενημερώνουν τις πεποιθήσεις τους με ορθολογικό τρόπο, τότε καθώς συσσωρεύονται δεδομένα θα προσεγγίσουν σταδιακά τη συμφωνία (εκτός εάν έχουν αποκλείσει εκ των προτέρων το σημείο συμφωνίας εντελώς, για παράδειγμα, Jern, Chang, & amp, Kemp, 2014). Στην πραγματικότητα, μπορεί να αποδειχθεί ότι ο μόνος τρόπος με τον οποίο οι πεποιθήσεις μας πριν από τα δεδομένα (όποιες κι αν είναι αυτές) θα συμβαδίζουν με τις πεποιθήσεις μας μετά τα δεδομένα είναι να χρησιμοποιήσουμε την πιθανότητα για να αντιπροσωπεύσουμε την αβεβαιότητά μας και να ενημερώσουμε τις πεποιθήσεις μας σύμφωνα με τους νόμους της πιθανότητας ( Lindley 2000).

Με άλλη έννοια - το φυσικός ή κυβευτικός Ερμηνεία υποσημείωσης 2 - η πιθανότητα είναι μια δήλωση ενός αναμενόμενη συχνότητα σε πολλές επαναλήψεις μιας διαδικασίαςΤο Μια δήλωση πιθανής πιθανότητας μπορεί να είναι «Αν αναποδογυρίσω ένα νόμισμα πολλές φορές, η αναλογία των ανατροπών στις οποίες θα ανέβει το κέρμα είναι 50%. Επομένως, η πιθανότητα να εμφανιστεί ένα νόμισμα είναι 50%». Αυτές οι δηλώσεις εκφράζουν ιδιότητες του μακροχρόνια συμπεριφορά των καλά καθορισμένων διαδικασιών, αλλά δεν μπορούν να μιλήσουν σε μοναδικά γεγονότα απαιτούν υποθέσεις σχετικά με τη φυσική επαναληψιμότητα και την ανεξαρτησία μεταξύ των επαναλήψεων. Είναι σημαντικό να κατανοήσουμε ότι αυτές οι συχνότητες θεωρούνται ως ένα πραγματικό μέρος του φυσικού κόσμου, καθώς «οι σχετικές συχνότητες μιας μήτρας που πέφτει με αυτόν ή με αυτόν τον τρόπο είναι« επίμονες »και αποτελούν τις μετρήσιμες ιδιότητες αυτής της μήτρας, συγκρίσιμες με το μέγεθός της. και βάρος »(Neyman 1977, σελ. 99). Το απόσπασμα του Neyman παρέχει μια ενδιαφέρουσα αντίθεση με την επιστημική ερμηνεία. Ο Ιταλός πιθανολόγος και επιδραστικός στατιστικός του Μπαγιέζ Μπρούνο ντε Φινέτι ξεκίνησε περίφημα την πραγματεία του Θεωρία των πιθανοτήτων δηλώνοντας «Πιθανότητα δεν υπάρχει» και ότι «η εγκατάλειψη των δεισιδαιμονικών πεποιθήσεων σχετικά με την ύπαρξη του Φλογίστου, του Κοσμικού Αιθέρα, του Απόλυτου Χώρου και του Χρόνου,… ή των Νεράιδων και των Μαγισσών ήταν ένα ουσιαστικό βήμα στο δρόμο προς την επιστημονική σκέψη. Η πιθανότητα, επίσης, αν θεωρηθεί ως κάτι προικισμένο με κάποιο είδος αντικειμενικής ύπαρξης, δεν είναι λιγότερο μια παραπλανητική εσφαλμένη αντίληψη, μια απατηλή προσπάθεια εξωτερίκευσης ή υλοποίησης των πραγματικών πιθανοτήτων μας »(De Finetti 1974, σ. X). Αυτό δεν σημαίνει ότι δεν μπορούμε να κατασκευάσουμε μοντέλα που αποδίδουν πιθανότητες στα αποτελέσματα των φυσικών διεργασιών, μόνο ότι είναι απαραίτητα αφαιρέσεις.

Είναι σαφές ότι αυτές οι δύο ερμηνείες πιθανότητας δεν είναι οι ίδιες. Υπάρχουν πολλές καταστάσεις στις οποίες δεν ισχύει ο επιλεκτικός ορισμός και έτσι δεν θα μπορούσαν να προσδιοριστούν οι πιθανότητες: δεν θα δούμε επαναλαμβανόμενες περιπτώσεις της 31ης Δεκεμβρίου 2018, στις οποίες το Ηνωμένο Βασίλειο θα μπορούσε να βρίσκεται εντός ή εκτός ΕΕ, θα δούμε μόνο μία τέτοια Εκδήλωση. Ομοίως, «ποια είναι η πιθανότητα να Αυτό κέρμα, στο αμέσως επόμενο γύρισμα, θα ανέβουν κεφάλια; » δεν είναι κάτι για το οποίο ισχύει μια απλή πιθανότητα: δεν υπάρχουν μακροχρόνιες συχνότητες που πρέπει να ληφθούν υπόψη αν υπάρχει μόνο ένα χτύπημα που έχει σημασία.

Η πιθανότητα προειδοποίησης μπορεί - σε ορισμένες περιπτώσεις - να είναι έγκυρη σχετικός με την σύλληψη ή αντίληψη ερμηνεία της πιθανότητας, αλλά σπάνια είναι ποτέ επιχειρήσεων ερμηνεία (βλ. Jaynes, 1984 Winkler, 1972 Wrinch & amp Jeffreys, 1919): δεν μπορεί να ισχύει για μοναδικά γεγονότα όπως η αλήθεια ή το ψεύδος μιας επιστημονικής θεωρίας, οπότε απλά δεν μπορούμε να μιλήσουμε για πιθανές πιθανότητες όταν παλεύουμε με την αβεβαιότητα που αντιμετωπίζουμε στην επιστημονική πρακτική. Δηλαδή, μπορούμε να χρησιμοποιήσουμε έγκυρα την πιθανότητα παραίτησης σκέφτομαι για πιθανότητα με αφηρημένο τρόπο, αλλά όχι για να κάνετε δηλώσεις σχετικά με γεγονότα που παρατηρούνται στον πραγματικό κόσμο, όπως πειραματικά αποτελέσματα.

Αντίθετα, η επιστημική πιθανότητα ισχύει για οποιοδήποτε γεγονός που φροντίζουμε να εξετάσουμε-είτε είναι μοναδικό είτε επαναλαμβανόμενο-και αν έχουμε σχετικές πληροφορίες σχετικά με τις συχνότητες του πραγματικού κόσμου, τότε μπορούμε να επιλέξουμε να χρησιμοποιήσουμε αυτές τις πληροφορίες για να ενημερώσουμε τις πεποιθήσεις μας. Εάν η επανάληψη είναι δυνατή και θεωρούμε λογικό να υποθέσουμε ότι η πιθανότητα να εμφανιστεί ένα κέρμα σε μια δεδομένη ρίψη δεν αλλάζει με βάση το αποτέλεσμα των προηγούμενων ρίψεων, τότε ένας Μπαγιέζος θα μπορούσε εύλογα να πιστέψει και τα δύο (α) ότι στην επόμενη ρίψη εκεί είναι 50% πιθανότητα να ανέβει και β) Το 50% των εκτοξεύσεων θα οδηγήσει σε κεφαλές σε μια πολύ μεγάλη σειρά αναστροφών. Ως εκ τούτου, η επιστημική πιθανότητα είναι και τα δύο α σχετικός με την σύλληψη ή αντίληψη ερμηνεία της πιθανότητας και an επιχειρήσεων ερμηνεία. Η επιστημική πιθανότητα μπορεί να θεωρηθεί ως μια επέκταση της πιθανότητας παραίτησης που ισχύει για όλες τις περιπτώσεις όπου θα εφαρμοζόταν η τελευταία και για αμέτρητες περιπτώσεις όπου δεν μπορούσε.

Γιατί αυτό έχει σημασία

Υποστηρίζουμε ότι η παραπάνω διάκριση είναι άμεσα σχετική με την εμπειρική ψυχολογία. Στη συντριπτική πλειοψηφία των περιπτώσεων, οι ψυχολόγοι ενδιαφέρονται να κάνουν πιθανές δηλώσεις σχετικά με μοναδικά γεγονότα: Αυτό η θεωρία είναι είτε αληθινή είτε όχι Αυτό το αποτέλεσμα είναι είτε θετικό είτε αρνητικό Αυτό το μέγεθος του εφέ είναι πιθανώς μεταξύ Χ και y και είτε Αυτό μοντέλο ή το άλλο είναι πιο πιθανό με βάση τα δεδομένα. Σπάνια μας ενδιαφέρει απλώς η συχνότητα με την οποία μια καλά καθορισμένη διαδικασία θα επιτύχει ένα συγκεκριμένο αποτέλεσμα. Ακόμη και αυθαίρετα μεγάλες ακολουθίες πιστών επαναλήψεων εμπειρικών μελετών χρησιμεύουν για την αντιμετώπιση του α ενικός ερώτηση: «είναι Αυτό σωστή η θεωρία; » Μπορούμε λογικά να ορίσουμε ένα συγκεκριμένο μοντέλο συμπεριφοράς και να του εκχωρήσουμε παραμέτρους (ακόμη και παραμέτρους που είναι πιθανότητες) και στη συνέχεια να εξετάσουμε τη μακροπρόθεσμη συμπεριφορά του. Αυτή είναι μια έγκυρη επιτακτική ερώτηση. Ωστόσο, δεν είναι μια συμπερασματική διαδικασία: περιγράφει τη συμπεριφορά ενός εξιδανικευμένου μοντέλου, αλλά δεν μας παρέχει συμπεράσματα σχετικά με αυτό το μοντέλο. Θα μπορούσαμε επίσης να αναρωτηθούμε πόσο συχνά ένας ερευνητής θα κάνει λάθη στο συμπέρασμα (όπως ορίζονται) υπό ορισμένες συνθήκες, αλλά αυτό είναι καθαρά ακαδημαϊκή άσκηση, εκτός εάν το ποσοστό των λαθών είναι 0 ή 1, μια τέτοια μακροπρόθεσμη συχνότητα από μόνη της δεν μας επιτρέπει να προσδιορίστε την πιθανότητα ο ερευνητής να έκανε πραγματικά λάθος σχετικά με οποιοδήποτε ενικός εύρημα - σχετικά Αυτό κέρμα, Αυτό αποτέλεσμα, ή Αυτό υπόθεση. Αντίθετα, η επιστημική πιθανότητα εκφράζει βαθμούς πεποίθησης σχετικά με συγκεκριμένα, ατομικά, ενικός γεγονότα, και για τον λόγο αυτό θα πρέπει να είναι η προεπιλογή για επιστημονικό συμπέρασμα.

Στην επόμενη ενότητα, θα εισαγάγουμε τους βασικούς κανόνες της θεωρίας πιθανοτήτων. Αυτοί οι κανόνες είναι αγνωστικοί για την αντίληψή μας για την πιθανότητα - ισχύουν εξίσου για την επιστημική και την επιλεκτική πιθανότητα - αλλά σε όλη την υπόλοιπη εργασία και ιδιαίτερα στα παραδείγματα, θα χρησιμοποιήσουμε, εκτός εάν σημειωθεί διαφορετικά, μια επιστημική ερμηνεία της λέξης «πιθανότητα».

Το γινόμενο και το άθροισμα των πιθανοτήτων

Εδώ θα εισαγάγουμε τους δύο βασικούς κανόνες της θεωρίας πιθανοτήτων από τους οποίους προέρχεται ουσιαστικά όλο το συμπέρασμα του Bayes. Ωστόσο, πριν επιχειρήσουμε να εφαρμόσουμε τους νόμους της πιθανότητας, υπάρχουν συμβολικές συμβάσεις για να σχεδιάσουμε. Πρώτον, θα χρησιμοποιήσουμε Π(ΕΝΑ) για να δηλώσει την πιθανότητα κάποιου γεγονότος ΕΝΑ, όπου ΕΝΑ είναι μια δήλωση που μπορεί να είναι αληθινή ή ψευδής (π. ΕΝΑ θα μπορούσε να είναι "θα βρέξει σήμερα", "το Ηνωμένο Βασίλειο θα είναι εκτός ΕΕ στις 31 Δεκεμβρίου 2018" ή "το 20ο ψηφίο του π είναι 3 "). Στη συνέχεια, θα χρησιμοποιήσουμε (σι|ΕΝΑ) για να δηλώσει το υποθετικός συμβάν: η πιθανότητα να σι είναι αλήθεια δεδομένου ότι το Α είναι αλήθεια (π.χ., σι θα μπορούσε να είναι "θα βρέξει αύριο") είναι Π(σι|ΕΝΑ): η πιθανότητα να βρέξει αύριο δεδομένου ότι έβρεξε σήμερα. Τρίτον, θα χρησιμοποιήσουμε (ΕΝΑ,σι) να συμβολίσω α άρθρωση συμβάν: η πιθανότητα να ΕΝΑ και σι είναι και τα δύο αληθινά είναι Π(ΕΝΑ,σι). Η κοινή πιθανότητα Π(ΕΝΑ,σι) είναι φυσικά ίσο με αυτό της κοινής πιθανότητας Π(σι,ΕΝΑ): το γεγονός «βρέχει αύριο και σήμερα» είναι λογικά το ίδιο με «βρέχει σήμερα και αύριο». Τέλος, θα χρησιμοποιήσουμε (ΕΝΑ) να αναφερθεί στην άρνηση του ΕΝΑ: η πιθανότητα ΕΝΑ είναι ψεύτικο είναι ΠΕΝΑ). Αυτές οι σημειώσεις μπορούν να συνδυαστούν: αν ντο και ρε αντιπροσωπεύουν τα γεγονότα "είναι εποχή τυφώνων" και "έβρεξε χθες", αντίστοιχα, τότε Π(ΕΝΑ,σιντορε) είναι η πιθανότητα να βρέξει σήμερα και αύριο, δεδομένου ότι (¬ντο) δεν είναι εποχή τυφώνων και αυτό (¬ρε) δεν έβρεξε χθες (δηλαδή και τα δύο ντο και ρε δεν είναι αλήθεια).

Έχοντας αυτό το συμβολισμό υπόψη, εισάγουμε τον Κανόνα Πιθανοτήτων Προϊόντος:

Με λόγια: η πιθανότητα να ΕΝΑ και σι είναι και τα δύο αληθινά ίσα με την πιθανότητα σι πολλαπλασιάζεται με την υπό όρους πιθανότητα του ΕΝΑ υποθέτοντας σι είναι αλήθειαΤο Λόγω συμμετρίας, αυτό είναι επίσης ίσο με την πιθανότητα ΕΝΑ πολλαπλασιάζεται με την υπό όρους πιθανότητα του σι υποθέτοντας ΕΝΑ είναι αλήθειαΤο Η πιθανότητα να βρέξει σήμερα και αύριο είναι η πιθανότητα να βρέξει σήμερα σήμερα πολλαπλασιασμένη με την πιθανότητα να βρέξει αύριο δεδομένου ότι γνωρίζουμε ότι βρέχει σήμερα.

Αν υποθέσουμε ΕΝΑ και σι είναι στατιστικά ανεξάρτητες τότε Π(σι) ισούται Π(σι|ΕΝΑ), αφού γνωρίζω ΕΝΑ συμβαίνει δεν μας λέει τίποτα για την ευκαιρία σι συμβαίνει. Σε τέτοιες περιπτώσεις, ο κανόνας προϊόντος απλοποιείται ως εξής:

Συνεχίζοντας με το παράδειγμά μας, αυτό θα σήμαινε τον υπολογισμό της πιθανότητας να βρέξει τόσο σήμερα όσο και αύριο με τέτοιο τρόπο ώστε η γνώση του εάν έβρεξε ή όχι σήμερα δεν έχει καμία σχέση με το πόσο ισχυρά πρέπει να πιστεύουμε ότι θα βρέξει αύριο.

Η κατανόηση του συνολικού κανόνα πιθανοτήτων απαιτεί μια ακόμη έννοια: το ασύνδετο σετΤο Ένα ασύνδετο σετ δεν είναι άλλο από μια συλλογή αμοιβαίως αποκλειστικών γεγονότων. Για να απλοποιήσουμε την έκθεση, θα υποθέσουμε επίσης ότι ακριβώς ένα από αυτά τα γεγονότα πρέπει να είναι αληθινό, αν και αυτό δεν αποτελεί μέρος του κοινού ορισμού ενός τέτοιου συνόλου. Το πιο απλό παράδειγμα ενός ασύνδετου συνόλου είναι κάποιο γεγονός και η άρνησή του: Υποσημείωση 3 <σισι>>. Αν σι αντιπροσωπεύει την εκδήλωση "Θα βρέξει αύριο", τότε ¬σι αντιπροσωπεύει την εκδήλωση «Δεν θα βρέξει αύριο». Ένα και μόνο ένα από αυτά τα γεγονότα πρέπει να συμβεί, οπότε μαζί σχηματίζουν ένα ασύνδετο σύνολο. Αν ΕΝΑ αντιπροσωπεύει την εκδήλωση "Θα βρέξει σήμερα" και ¬ΕΝΑ αντιπροσωπεύει το "Δεν θα βρέξει σήμερα" (ένα άλλο ασύνδετο σετ), τότε υπάρχουν τέσσερα πιθανά ζεύγη αυτών των γεγονότων, ένα από τα οποία πρέπει να είναι αληθινό: (ΕΝΑ,σι), (ΕΝΑσι), (¬ΕΝΑ,σι), και (¬ΕΝΑσι). Η πιθανότητα ενός μόνο από τα μοναδικά γεγονότα, ας πούμε σι, μπορεί να βρεθεί προσθέτοντας τις πιθανότητες όλων των κοινών γεγονότων που περιέχουν σι ως εξής:

Με λίγα λόγια, η πιθανότητα να βρέξει αύριο είναι το άθροισμα δύο κοινών πιθανοτήτων: (1) η πιθανότητα να βρέξει σήμερα και αύριο και (2) η πιθανότητα να μην βρέξει σήμερα αλλά να βρέξει αύριο.

Γενικά, αν <ΕΝΑ 1,ΕΝΑ 2,…,ΕΝΑ κ> είναι ένα ασύνδετο σύνολο, ο αθροιστικός κανόνας πιθανότητας δηλώνει:

Δηλαδή να βρούμε την πιθανότητα συμβάντος σι μόνος σου αθροίζεις όλες τις κοινές πιθανότητες που περιλαμβάνουν και τα δύο σι και ένα στοιχείο ενός ασύνδετου συνόλου. Διαισθητικά, είναι σαφές ότι εάν ένα από τα <ΕΝΑ 1,ΕΝΑ 2,…,ΕΝΑ κ>πρέπει είναι αλήθεια, τότε η πιθανότητα ότι ένα από αυτά και Β είναι αληθές είναι ίσο με τη βασική πιθανότητα ότι σι είναι αλήθεια.

Στο πλαίσιο της εμπειρικής συλλογής δεδομένων, το ασύνδετο σύνολο πιθανών αποτελεσμάτων ονομάζεται συχνά το δείγμα χώρου.

Μια απεικόνιση του Κανόνα Πιθανοτήτων Προϊόντος

φαίνεται από το διάγραμμα διαδρομής στο Σχ. 1. Κάθε πιρούνι υποδηλώνει την έναρξη ενός ασύρματου συνόλου, με καθένα από τα στοιχεία αυτού του συνόλου να αντιπροσωπεύεται από τους κλάδους να εκτείνονται προς τα έξω. Οι γραμμές υποδεικνύουν την πιθανότητα επιλογής κάθε στοιχείου μέσα στο σύνολο. Ξεκινώντας από τα αριστερά, μπορεί κανείς να εντοπίσει αυτό το διάγραμμα για να βρει την κοινή πιθανότητα, ας πούμε, ΕΝΑ και σιΤο Στο Αρχή πιρούνι υπάρχει πιθανότητα 0,6 να πάει κατά μήκος του επάνω βέλους στο συμβάν ΕΝΑ (θα μπορούσε φυσικά να σχεδιαστεί ένα παρόμοιο διάγραμμα που ξεκινά με σι): Η πιθανότητα να βρέξει σήμερα είναι 0,6. Στη συνέχεια, υπάρχει πιθανότητα .667 να περάσετε από το επόμενο πιρούνι στο συμβάν (ΕΝΑ,σι): Η πιθανότητα να βρέξει αύριο δεδομένου ότι βρέχει σήμερα είναι 0,667. Ως εκ τούτου, της αρχικής πιθανότητας 0,6 που αντιστοιχεί σε ΕΝΑ, τα δύο τρίτα του διχαλώνει σε (ΕΝΑ,σι), άρα η πιθανότητα (ΕΝΑ,σι) είναι .6 × .667 = .40: Δεδομένου ότι έβρεξε σήμερα, η πιθανότητα να βρέξει αύριο είναι .667, οπότε η πιθανότητα να βρέξει και σήμερα και αύριο είναι .4. Η πιθανότητα οποιουδήποτε κοινού συμβάντος στο τέλος μιας διαδρομής μπορεί να βρεθεί πολλαπλασιάζοντας τις πιθανότητες όλων των πιρουνιών που χρειάζονται για να φτάσουμε εκεί.

Μια απεικόνιση του κανόνα πιθανότητας προϊόντος: Η πιθανότητα των κοινών γεγονότων στο δεξί άκρο του διαγράμματος επιτυγχάνεται πολλαπλασιάζοντας τις πιθανότητες κατά μήκος της διαδρομής που οδηγεί σε αυτό. Οι διαδρομές δείχνουν πού και πώς χωρίζουμε σταδιακά την αρχική πιθανότητα σε μικρότερα υποσύνολα. Μια προτεινόμενη άσκηση για τον έλεγχο της κατανόησης και την εξοικείωση με τους κανόνες είναι η κατασκευή του ισοδύναμου διαγράμματος διαδρομής (δηλαδή, εκείνο στο οποίο οι πιθανότητες άρθρωσης είναι πανομοιότυπες) ξεκινώντας από τα αριστερά με ένα πιρούνι που εξαρτάται από το γεγονός σι αντί ΕΝΑ

Μια απεικόνιση του αθροιστικού κανόνα της πιθανότητας

φαίνεται στον Πίνακα 1, ο οποίος παρουσιάζει τις πιθανότητες όλων των συμβάντων άρθρωσης που βρέθηκαν μέσω του Σχ. 1 στα κύρια κελιά. Για παράδειγμα, αθροίζοντας όλες τις πιθανότητες από κοινού σε όλη τη σειρά που υποδηλώνεται ΕΝΑ δίνει Π(ΕΝΑ). Προσθέτοντας όλες τις πιθανότητες από κοινού στη στήλη που δηλώνεται σι δίνει Π(σι). Αυτό μπορεί επίσης να φανεί σημειώνοντας ότι στο Σχ. 1, οι πιθανότητες των δύο παιδικών πιρουνιών να φύγουν από ΕΝΑ, και συγκεκριμένα (ΕΝΑ,σι) και (ΕΝΑσι), αθροίστε την πιθανότητα που αναφέρεται στο αρχικό πιρούνι που οδηγεί σε ΕΝΑΤο Αυτό ισχύει για οποιαδήποτε τιμή του Π(σι|ΕΝΑ) (και Πσι|ΕΝΑ) = 1 − Π(σι|ΕΝΑ)).


Μια διαισθητική (και σύντομη) εξήγηση του θεώματος Bayes ’

Το θεώρημα του Bayes ήταν το αντικείμενο ενός λεπτομερούς άρθρου. Το δοκίμιο είναι καλό, αλλά πάνω από 15.000 λέξεις - εδώ είναι η συμπυκνωμένη έκδοση για νεοφερμένους Μπαγιέζους όπως εγώ:

Οι δοκιμές δεν είναι το γεγονός. Έχουμε καρκίνο δοκιμή, χωριστά από το γεγονός της πραγματικής εμφάνισης καρκίνου. Εχουμε ένα δοκιμή για ανεπιθύμητα μηνύματα, χωριστά από το γεγονός της πραγματικής αποστολής μηνύματος ανεπιθύμητης αλληλογραφίας.

Οι δοκιμές είναι ελαττωματικές. Οι δοκιμές ανιχνεύουν πράγματα που δεν υπάρχουν (ψευδώς θετικά) και χάνουν πράγματα που υπάρχουν (ψευδώς αρνητικά). Οι άνθρωποι χρησιμοποιούν συχνά αποτελέσματα δοκιμών χωρίς να προσαρμόζονται για σφάλματα δοκιμής.

Τα ψευδώς θετικά ανατρέπουν τα αποτελέσματα. Ας υποθέσουμε ότι ψάχνετε για κάτι πραγματικά σπάνιο (1 στο εκατομμύριο). Ακόμη και με μια καλή δοκιμή, είναι πιθανό ότι ένα θετικό αποτέλεσμα είναι πραγματικά ένα ψευδώς θετικό σε κάποιον στο 999.999.

Οι άνθρωποι προτιμούν τους φυσικούς αριθμούς. Το να πούμε «100 στα 10.000» αντί «1%» βοηθά τους ανθρώπους να αντιμετωπίζουν τους αριθμούς με λιγότερα λάθη, ειδικά με πολλαπλάσια ποσοστά («Από αυτούς τους 100, οι 80 θα είναι θετικοί» και όχι «το 80% του 1% θα είναι θετικοί» ).

Ακόμα και η επιστήμη είναι μια δοκιμασίαΤο Σε φιλοσοφικό επίπεδο, τα επιστημονικά πειράματα είναι «δυνητικά ελαττωματικά τεστ» και πρέπει να αντιμετωπιστούν αναλόγως. Υπάρχει ένα δοκιμή για ένα χημικό, ή ένα φαινόμενο, και υπάρχει το Εκδήλωση του ίδιου του φαινομένου. Οι δοκιμές και ο εξοπλισμός μέτρησης έχουν ένα ποσοστό σφάλματος που πρέπει να ληφθεί υπόψη.

Το θεώρημα του Bayes μετατρέπει τα αποτελέσματα από τη δοκιμή σας στην πραγματική πιθανότητα του γεγονότος. Για παράδειγμα, μπορείτε:

Διορθώθηκε για σφάλματα μέτρησηςΤο Εάν γνωρίζετε τις πραγματικές πιθανότητες και την πιθανότητα ψευδώς θετικού και ψευδώς αρνητικού, μπορείτε να διορθώσετε σφάλματα μέτρησης.

Συνδέστε την πραγματική πιθανότητα με τη μετρούμενη πιθανότητα δοκιμής. Λαμβάνοντας υπόψη τα αποτελέσματα της εξέτασης μαστογραφίας και τα γνωστά ποσοστά σφάλματος, μπορείτε να προβλέψετε την πραγματική πιθανότητα εμφάνισης καρκίνου σε θετικό τεστ. Με τεχνικούς όρους, μπορείτε να βρείτε Pr (H | E), την πιθανότητα ότι μια υπόθεση H είναι αληθινή δεδομένης της απόδειξης E, ξεκινώντας από την Pr (E | H), την πιθανότητα ότι τα στοιχεία εμφανίζονται όταν η υπόθεση είναι αληθινή.


Στατιστική Μοντελοποίηση, Αιτιολογική Συμπέρασμα και Κοινωνική Επιστήμη

Υποσχέθηκα ότι δεν θα κάνω κανένα νέο blogging μέχρι τον Ιανουάριο, αλλά ήμουν εδώ σε αυτό το συνέδριο και κάποιος μου έκανε μια ερώτηση σχετικά με την παραπάνω διαφάνεια από την ομιλία μου.

Το νόημα της ιστορίας σε εκείνη τη διαφάνεια είναι ότι οι επίπεδες προτεραιότητες δίνουν σταθερά κακά συμπεράσματα. Or, για να το θέσω αλλιώς, η συνηθισμένη χρήση επίπεδων προτεραιών οδηγεί σε κακές ιδιότητες συχνότητας σε ρεαλιστικές ρυθμίσεις όπου οι μελέτες είναι θορυβώδεις και τα μεγέθη των επιπτώσεων είναι μικρά. (Περισσότερα εδώ.)

Λέγοντάς τον έτσι, είναι προφανές: Οι μέθοδοι Bayes βαθμονομούνται αν έχετε μέσο όρο σε σχέση με το προηγούμενο. Εάν η κατανομή των μεγεθών των αποτελεσμάτων που υπολογίζετε κατά μέσο όρο δεν είναι η ίδια με την προηγούμενη κατανομή που χρησιμοποιούσατε στην ανάλυση, τα συμπεράσματά σας Bayes γενικά θα έχουν προβλήματα.

Όμως, όσο απλή και αν είναι αυτή η δήλωση, οι πρακτικές συνέπειες είναι τεράστιες, επειδή είναι τυπικό να χρησιμοποιείτε επίπεδες προτεραιότητες στην ανάλυση Bayesian (δείτε τα περισσότερα από τα παραδείγματα στα βιβλία μας!) ή τετραγωνίζει τουλάχιστον συμπεράσματα και τα ερμηνεύει Bayesianly, για παράδειγμα ερμηνεύοντας ένα διάστημα 95% που αποκλείει το μηδέν ως ισχυρή απόδειξη για το πρόσημο της υποκείμενης παραμέτρου.

Στο έγγραφό μας του 2000, “Type S ποσοστά σφαλμάτων για κλασικές και Bayesian διαδικασίες μονής και πολλαπλής σύγκρισης, ” ο Francis Tuerlinckx και εγώ το διατυπώσαμε από την άποψη των ερευνητών που κάνουν αξιώσεις “ με εμπιστοσύνη. ” Στις κλασικές στατιστικές, κάνετε αξίωση με εμπιστοσύνη στο πρόσημο εφέ εάν το διάστημα εμπιστοσύνης 95% εξαιρεί το μηδέν. Στα στατιστικά του Bayes, κάποιος μπορεί να κάνει συγκρίσιμο ισχυρισμό με σιγουριά αν το 95% οπίσθιο διάστημα δεν αποκλείει το μηδέν. Με μια επίπεδη προηγούμενη, αυτά τα δύο είναι τα ίδια. Αλλά με έναν προγενέστερο Bayes, είναι διαφορετικοί. Συγκεκριμένα, με τα κανονικά δεδομένα και ένα φυσιολογικό προηγούμενο κέντρο 0, το διάστημα Bayesian είναι πάντα πιο πιθανό να περιλαμβάνει μηδέν, σε σύγκριση με το κλασικό διάστημα, επομένως μπορούμε να πούμε ότι το συμπέρασμα Bayes είναι πιο συντηρητικό, καθώς είναι λιγότερο πιθανό να οδηγήσει σε αξιώσεις με αυτοπεποίθηση.

Ακολουθεί το σχετικό γράφημα από το χαρτί του 2000:

Αυτό το διάγραμμα δείχνει την πιθανότητα υποβολής αξίωσης με εμπιστοσύνη, ως συνάρτηση του λόγου διακύμανσης, με βάση το απλό μοντέλο:

Το πραγματικό εφέ theta προσομοιώνεται από το κανονικό (0, tau).
Τα δεδομένα y προσομοιώνονται από το κανονικό (θήτα, σίγμα).
Το κλασικό διάστημα 95% είναι y +/- 2*σίγμα
Bayesian 95% διάστημα είναι theta.hat.bayes +/- 2*theta.se.bayes,
όπου theta.hat.bayes = y * (1/sigma^2)/(1/sigma^2 + 1/tau^2)
και theta.se.bayes = sqrt (1/(1/sigma^2 + 1/tau^2))

Αυτό που είναι πραγματικά δροσερό εδώ είναι αυτό που συμβαίνει όταν το tau/sigma είναι κοντά στο 0, το οποίο θα μπορούσαμε να ονομάσουμε τομέα “ sychυχολογικής Επιστήμης ” ή “PPNAS ”. Σε αυτό το όριο, το κλασικό διάστημα έχει 5% πιθανότητες να εξαιρέσει το 0. Φυσικά, αυτό σημαίνει το διάστημα 95%: αν δεν υπάρχει αποτέλεσμα, έχετε 5% πιθανότητα να δείτε κάτι.

Αλλά . Το Το κοιτάξτε τη διαδικασία Bayesian. Εκεί, η πιθανότητα μιας αξίωσης με εμπιστοσύνη είναι ουσιαστικά 0 όταν το tau/sigma είναι χαμηλό. Αυτό είναι σωστό: σε αυτήν τη ρύθμιση, τα δεδομένα πολύ σπάνια παρέχουν αρκετές πληροφορίες για να καθορίσουν το σημάδι οποιουδήποτε αποτελέσματος. Αλλά αυτό μπορεί να είναι αντίθετο αν έχετε κλασική στατιστική εκπαίδευση: έχουμε συνηθίσει να ακούμε ποσοστό σφάλματος περίπου 5% που μπορεί να εκπλήξει να συνειδητοποιήσουμε ότι, αν κάνετε τα πράγματα σωστά, το ποσοστό υποβολής αξιώσεων με σιγουριά μπορεί να είναι πολύ λιγότερο.

Εμείς είναι υποθέτοντας εδώ ότι η προηγούμενη διανομή και το μοντέλο δεδομένων είναι σωστά —, δηλαδή, υπολογίζουμε τις πιθανότητες υπολογίζοντας κατά μέσο όρο τη διαδικασία δημιουργίας δεδομένων στο μοντέλο μας.

Πολλαπλές συγκρίσεις

Εντάξει, τι σχέση έχει αυτό με πολλές συγκρίσεις; Η συνήθης ανησυχία είναι ότι εάν κάνουμε πολλούς ισχυρισμούς με σιγουριά, μπορούμε να απομακρυνθούμε αν δεν κάνουμε κάποια διόρθωση. Και, πράγματι, με την κλασική προσέγγιση, εάν το tau/sigma είναι μικρό, θα εξακολουθείτε να διεκδικείτε αξιώσεις με εμπιστοσύνη στο 5% των περιπτώσεων και ένα μεγάλο μέρος αυτών των ισχυρισμών θα είναι σε λάθος κατεύθυνση (a “type S , ” ή σημάδι, σφάλμα) ή πολύ μεγάλο (α “τύπος Μ, ” ή μέγεθος, σφάλμα), σε σύγκριση με την υποκείμενη αλήθεια.

Με συμπεράσματα Bayes (και το σωστό προηγούμενο), όμως, αυτό το πρόβλημα εξαφανίζεται. Αρκετά εκπληκτικά, εσύ μην ’t πρέπει να διορθώσουν συμπεράσματα Bayes για πολλαπλές συγκρίσεις.

Έκανα μια επίδειξη στο R για να το δείξω, προσομοιώνοντας ένα εκατομμύριο συγκρίσεις και βλέποντας τι κάνει η μέθοδος Bayes.

Ακολουθεί το πρώτο μισό των αποτελεσμάτων:

Έτσι, όταν το tau είναι το μισό του σίγμα, η κλασική διαδικασία αποδίδει αξιώσεις με σιγουριά 7% του χρόνου. Οι εκτιμήσεις είναι τεράστιες (άλλωστε, πρέπει να είναι τουλάχιστον δύο τυπικά σφάλματα από το 0), πολύ υψηλότερες από τις υποκείμενες παραμέτρους. Και το 14% αυτών των ισχυρισμών με εμπιστοσύνη είναι σε λάθος κατεύθυνση.

Το επόμενο μισό της εξόδου δείχνει τα αποτελέσματα από τα διαστήματα Bayes:

Όταν το tau είναι το μισό του σίγμα, οι ισχυρισμοί Bayes με σιγουριά είναι εξαιρετικά σπάνιοι. Όταν εκεί είναι ένας Bayesian ισχυρισμός με εμπιστοσύνη, θα είναι μεγάλος --- αυτό έχει νόημα το οπίσθιο τυπικό σφάλμα είναι sqrt (1/(1/1 + 1/.5^2)) = 0,45, και έτσι κάθε οπίσθιο μέσο που αντιστοιχεί σε ένα Bayesian αξίωση με εμπιστοσύνη εδώ θα πρέπει να είναι τουλάχιστον 0,9. Ο μέσος όρος για αυτές τις εκατομμύρια συγκρίσεις αποδεικνύεται ότι είναι 0,94.

Λοιπόν, προσέξτε τα εφέ επιλογής! Αλλά όχι, καθόλου. Αν δούμε το υποκείμενο αληθινά αποτελέσματα που αντιστοιχούν σε αυτούς τους ισχυρισμούς με σιγουριά, αυτοί έχουν μέσο όρο 0,97 (σε αυτήν την προσομοίωση σε άλλες προσομοιώσεις ενός εκατομμυρίου συγκρίσεων, παίρνουμε μέσα όπως 0,89 ή 1,06). Και πολύ λίγα από αυτά είναι πράγματι σε λάθος κατεύθυνση, με αρκετές προσομοιώσεις θα βρείτε ένα ποσοστό σφάλματος τύπου S λίγο μικρότερο από 2,5% που είναι αυτό που θα περίμενε κανείς, δεδομένου ότι αυτά τα 95% οπίσθια διαστήματα εξαιρούν το 0, οπότε κάτι λιγότερο από το 2,5% του διαστήματος θα είναι λάθος πρόσημο.

Έτσι, η διαδικασία Bayesian πολύ σπάνια κάνει αξίωση με σιγουριά. Αλλά, όταν συμβαίνει, συνήθως μαζεύει κάτι πραγματικό, μεγάλο και προς τη σωστή κατεύθυνση.

Στη συνέχεια τρέξαμε ξανά με το tau = 1, έναν κόσμο στον οποίο η τυπική απόκλιση των πραγματικών αποτελεσμάτων είναι ίση με το τυπικό σφάλμα των εκτιμήσεων:

Οι κλασικές εκτιμήσεις παραμένουν πολύ υψηλές, κατά μέσο όρο περίπου διπλάσιες από τα πραγματικά μεγέθη εφέ, η διαδικασία Bayesian είναι πιο συντηρητική, με λιγότερους ισχυρισμούς με σιγουριά και όχι υπερεκτίμηση μεγεθών επίδρασης.

Ο Bayes τα καταφέρνει καλύτερα επειδή χρησιμοποιεί περισσότερες πληροφορίες

Δεν πρέπει να εκπλαγούμε από αυτά τα αποτελέσματα. Η διαδικασία Bayesian χρησιμοποιεί περισσότερες πληροφορίες και έτσι μπορεί να εκτιμήσει καλύτερα τα μεγέθη των αποτελεσμάτων.

Αλλά αυτό μπορεί να φαίνεται σαν πρόβλημα: τι γίνεται αν αυτές οι προηγούμενες πληροφορίες για το θήτα δεν είναι διαθέσιμες; Έχω δύο απαντήσεις. Πρώτον, σε πολλές περιπτώσεις, κάποιες προηγούμενες πληροφορίες είναι διαθέσιμος. Δεύτερον, εάν έχετε πολλές συγκρίσεις, μπορείτε να χωρέσετε ένα πολυεπίπεδο μοντέλο και να εκτιμήσετε το tau. Έτσι, αυτό που μπορεί να μοιάζει με τα χειρότερα προβλήματα πολλαπλών συγκρίσεων δεν είναι τόσο άσχημο.

Κάποιος θα πρέπει επίσης να είναι σε θέση να λάβει συγκρίσιμα αποτελέσματα μη-Bayesianly καθορίζοντας ένα κατώφλι έτσι ώστε να ελέγχεται το ποσοστό σφάλματος τύπου S. Το κλειδί είναι να προχωρήσουμε πέρα ​​από το ψευδώς θετικό, ψευδώς αρνητικό πλαίσιο, να θέσουμε τους στόχους της εκτίμησης του σημείου και των μεγεθών των θετών και όχι να πλαισιώσουμε τα πράγματα με βάση την μη ρεαλιστική και μη ενδιαφέρουσα υπόθεση theta = 0.


Ένα έργο του Μπέιζ

Τι γίνεται όμως με το υπόλοιπο 76 % που ακόμη δεν μπορείς να λύσεις τέτοιου είδους προβλήματα; Ο Βέμπερ και οι συνεργάτες του ήθελαν να καταλάβουν το γιατί. Προσέλαβαν 180 φοιτητές από το πανεπιστήμιο και τους παρουσίασαν δύο δείγματα προβλημάτων στο λεγόμενο Bayesian συλλογισμό, πλαισιωμένα είτε σε μορφή πιθανότητας είτε σε φυσική μορφή συχνότητας.

Αυτό περιλαμβάνει την παροχή στατιστικών στα βασικά ποσοστά-ας πούμε, πιθανώς μιας 40χρονης γυναίκας που έχει διαγνωστεί με καρκίνο του μαστού (1 τοις εκατό)-μαζί με ένα στοιχείο ευαισθησίας (μια γυναίκα με καρκίνο του μαστού θα έχει θετικό αποτέλεσμα μαστογραφία 80 τοις εκατό) και ένα ποσοστό ψευδούς συναγερμού (μια γυναίκα χωρίς καρκίνο του μαστού έχει ακόμη 9,6 τοις εκατό πιθανότητες να πάρει θετικό αποτέλεσμα στη μαστογραφία της). Αν λοιπόν μια γυναίκα 40 ετών διαπιστώσει θετικό καρκίνο του μαστού, ποια είναι η πιθανότητα να έχει όντως την ασθένεια (η «εκ των υστέρων» εκτίμηση πιθανότητας);

Το πρόβλημα της μαστογραφίας είναι τόσο γνωστό ότι ο Weber et αϊ. κατέληξαν στα δικά τους προβλήματα. Για παράδειγμα, η πιθανότητα ένα τυχαία επιλεγμένο άτομο από έναν δεδομένο πληθυσμό να είναι εθισμένο στην ηρωίνη είναι 0,01 τοις εκατό (το βασικό ποσοστό). Εάν το άτομο που έχει επιλεγεί είναι εθισμένος στην ηρωίνη, υπάρχει 100 % πιθανότητα ότι το άτομο θα έχει φρέσκα σημάδια βελόνας στο χέρι του (στοιχείο ευαισθησίας). Ωστόσο, υπάρχει επίσης πιθανότητα 0,19 τοις εκατό ότι το τυχαία επιλεγμένο άτομο θα έχει φρέσκα σημάδια βελόνας στο χέρι του, ακόμη και αν δεν είναι εξαρτημένος από την ηρωίνη (ποσοστό ψευδούς συναγερμού). Ποια είναι λοιπόν η πιθανότητα ένα τυχαία επιλεγμένο άτομο με φρέσκα σημάδια βελόνας να είναι εθισμένο στην ηρωίνη (η μετέπειτα πιθανότητα);

Εδώ είναι το ίδιο πρόβλημα στη μορφή φυσικών συχνοτήτων: 10 στους 100.000 ανθρώπους θα εθίζονται στην ηρωίνη. Και 10 στους 10 εθισμένους στην ηρωίνη θα έχουν φρέσκα σημάδια βελόνας στα χέρια τους. Εν τω μεταξύ, 190 από 99.990 άτομα που είναι δεν εθισμένος στην ηρωίνη θα έχει παρόλα αυτά φρέσκα σημάδια βελόνας. Ποιο ποσοστό λοιπόν των ατόμων με φρέσκα σημάδια βελόνας είναι εθισμένο στην ηρωίνη;

Και στις δύο μορφές πιθανότητας και φυσικής συχνότητας για το πρόβλημα της εξάρτησης από την ηρωίνη, η απάντηση είναι πέντε τοις εκατό, αλλά η διαδικασία με την οποία κάποιος φτάνει σε αυτήν την απάντηση είναι πολύ απλούστερη στη μορφή φυσικής συχνότητας. Το σύνολο των ατόμων με βελόνες στο μπράτσο είναι το άθροισμα όλων των εξαρτημένων από την ηρωίνη (10) συν των 190 μη τοξικομανών. Και το 10/200 σας δίνει τη σωστή απάντηση. [διορθώθηκε]