Απόλυτη μέση απόκλιση μη ομαδοποιημένων δεδομένων
Υπάρχουν διάφορες τεχνικές για να μετρήσετε πόσο στενά ομαδοποιούνται οι τιμές των δεδομένων σας κατά την εργασία με δεδομένα. Η μέση απόκλιση είναι η πιο κοινή. Τα περισσότερα άτομα μαθαίνουν πώς να υπολογίζουν χρησιμοποιώντας την αριθμομηχανή μέσης απόκλισης στο σχολείο προσθέτοντας όλες τις τιμές δεδομένων μαζί και διαιρώντας με τον αριθμό των στοιχείων στο σύνολο. Ωστόσο, η μέση απόκλιση γύρω από τη μέση είναι ένας πιο περίπλοκος υπολογισμός. Αυτός ο υπολογισμός καθορίζει πόσο κοντά είναι οι αριθμοί σας στη μέση τιμή. Η εύρεση αυτού συνίσταται στην εύρεση του μέσου όρου για ένα σύνολο δεδομένων, στην εύρεση της διαφοράς κάθε σημείου δεδομένων από αυτόν τον μέσο όρο και στη συνέχεια στη λήψη του μέσου όρου αυτών των διαφορών.
Η απόλυτη μέση απόκλιση των σημείων δεδομένων από ένα κεντρικό σημείο είναι απόλυτη απόκλιση. Ως κεντρικό σημείο μπορεί να χρησιμοποιηθεί ο μέσος, ο διάμεσος, ο τρόπος λειτουργίας ή το τυχαίο σημείο. Ο μέσος όρος χρησιμοποιείται συχνά ως άξονας. Ο τύπος απόλυτης μέσης απόκλισης χρησιμοποιείται για τον υπολογισμό της μέσης απόλυτης απόκλισης (MAD), του μέσου όρου των απόλυτων αποκλίσεων (αποστάσεων) των σημείων δεδομένων από τη μέση τιμή του συνόλου δεδομένων. Σε σύγκριση με τη μέτρηση κεντρικής τάσης, η μέση απόκλιση καθορίζει τη διασπορά όλων των στοιχείων δεδομένων στη σειρά. Η διάμεσος ή η μέση τιμή είναι μια δημοφιλής μέτρηση της κεντρικής τάσης. Μπορείτε να υπολογίσετε τη μέση απόκλιση τόσο για ομαδοποιημένα όσο και για μη ομαδοποιημένα δεδομένα.
Σε αυτό το άρθρο, θα διερευνήσουμε την Απόλυτη μέση απόκλιση μη ομαδοποιημένων δεδομένων.
Ποια είναι η μέση απόκλιση;
Ένα μέτρο της κεντρικής τάσης είναι η μέση απόκλιση. Μπορούμε να το καταλάβουμε χρησιμοποιώντας τον Αριθμητικό μέσο όρο, τον διάμεσο ή τον τρόπο λειτουργίας. Δείχνει πόσο απομακρυσμένες είναι όλες οι παρατηρήσεις, κατά μέσο όρο, από τη μέση. Επειδή είναι απόλυτη τιμή, κάθε απόκλιση είναι απόλυτη απόκλιση, αγνοώντας τα αρνητικά σημάδια. Επιπλέον, οι αποκλίσεις και στις δύο πλευρές του μέσου όρου πρέπει να είναι ίδιες.
Τι είναι τα μη ομαδοποιημένα δεδομένα;
Η κύρια διάκριση μεταξύ ομαδοποιημένων και μη ομαδοποιημένων δεδομένων είναι ότι τα μη ομαδοποιημένα δεδομένα είναι αδόμητα και σε τυχαία μορφή. Αυτό το είδος δεδομένων είναι επίσης γνωστό ως ακατέργαστα δεδομένα, ενώ τα ομαδοποιημένα δεδομένα είναι δεδομένα που έχουν ταξινομηθεί σε ομάδες ή ταξινομούνται σύμφωνα με την κατανομή συχνότητας. Τα διαστήματα τάξεων είναι τα ονόματα που δίνονται σε αυτές τις ομάδες.
Τα μη ομαδοποιημένα δεδομένα είναι ένα είδος διανομής στο οποίο κάθε πληροφορία εμφανίζεται στην ακατέργαστη μορφή του. Για παράδειγμα, τα πέντε τελευταία αποτελέσματα δοκιμών μιας μαθήτριας είναι 65, 94, 85, 77 και 80. Μπορούμε να συμπεράνουμε την απόδοσή της συνάγοντας το εύρος και τη μέση απόκλιση από αυτά τα δεδομένα.
Ποιο είναι το εύρος και η απόκλισή του;
Το εύρος είναι η διαφορά μεταξύ της υψηλότερης και της ελάχιστης τιμής της κατανομής. Το άθροισμα των απόλυτων τιμών διασποράς στον αριθμό των παρατηρήσεων ορίζεται τεχνικά ως μέση απόκλιση.
Πώς να υπολογίσετε την Απόλυτη μέση απόκλιση μη ομαδοποιημένων δεδομένων με έναν τύπο;
Ο μέσος όρος του δείγματος χρησιμοποιείται για τον υπολογισμό της μέσης απόκλισης για μη ομαδοποιημένα δεδομένα. Πρώτον, η διαφορά μεταξύ κάθε στοιχείου στην κατανομή (σύνολο δεδομένων) και του μέσου όρου καθορίζεται από την απόλυτη τιμή. Στη συνέχεια, αφαιρέστε το μέσο όρο από κάθε αριθμό στη συλλογή δεδομένων, αγνοώντας τα θετικά και αρνητικά πρόσημα (θεωρήστε τα πάντα θετικά).
Τέλος, το άθροισμα όλων των διαφορών διαιρείται με τον αριθμό των στοιχείων του δείγματος.
Η μέση απόκλιση είναι ο μέσος όρος των τελικών αποκλίσεων από έναν εύλογο μέσο όρο των παρατηρήσεων ή των τιμών. Ο κατάλληλος μέσος όρος θα μπορούσε να είναι ο μέσος όρος, ο διάμεσος ή ο τρόπος λειτουργίας. Η μέση απόλυτη απόκλιση είναι ένα άλλο όνομα για αυτήν. Θα μάθουμε περισσότερα για συγκεκριμένους ζωτικούς τύπους σήμερα σε αυτήν την παράγραφο, όπως ο τύπος μέσης απόκλισης για μια διακριτή ή συνεχή σειρά και ούτω καθεξής.
Αυτός είναι ο τύπος που πρέπει να χρησιμοποιηθεί:
Όπου X είναι η τιμή της παρατήρησης και y η μέση τιμή πληθυσμού.
N είναι ο συνολικός αριθμός των παρατηρήσεων στο δείγμα. Το X είναι ο μέσος όρος του δείγματος.
Το γράμμα n υποδηλώνει τον αριθμό των παρατηρήσεων στο δείγμα.
Βήματα που πρέπει να ακολουθήσετε για να εξαγάγετε την απόλυτη μέση απόκλιση μη ομαδοποιημένων δεδομένων
Η μέση απόσταση μεταξύ κάθε τιμής δεδομένων και της μέσης τιμής είναι η μέση απόλυτη απόκλιση (MAD) ενός συνόλου δεδομένων. Ένα μέτρο διακύμανσης σε ένα σύνολο δεδομένων είναι η μέση απόλυτη απόκλιση. Η μέση απόλυτη απόκλιση μας λέει πόσο «δισκορπισμένες» είναι οι τιμές σε ένα σύνολο δεδομένων.
Τα ακόλουθα βήματα χρησιμοποιούνται για τον υπολογισμό της μέσης απόκλισης για μη ομαδοποιημένα δεδομένα:
Να επιτρέπεται στις παρατηρήσεις να συνθέσουν το σύνολο δεδομένων:Έστω ότι το σύνολο δεδομένων αποτελείται από παρατηρήσεις x 1, x2, x 3 … … … . . x n.
Βήμα θ) Προσδιορίστε το μέτρο της κεντρικής τάσης που χρησιμοποιείται για τον υπολογισμό της μέσης απόκλισης. Ας υποθέσουμε ότι αυτό είναι «α».
Βήμα ii) Από το μέτρο της κεντρικής τάσης που υπολογίζεται σε βήμα, υπολογίζω την απόλυτη απόκλιση κάθε παρατήρησης, δηλ., |x1−a|,|x2−a|,|x3−a|………..|xn−a |
Βήμα iii) Υπολογίστε τον μέσο όρο όλων των απόλυτων διακυμάνσεων. Αυτό αποδίδει τη μέση απόλυτη απόκλιση (M.A.D.) γύρω από το «a» για μη ομαδοποιημένα δεδομένα. Όπου, M.A.D (a) =∑ n i = | x i – a |/ n
Εάν η μέση τιμή χρησιμοποιείται ως μέτρο:
Εάν χρησιμοποιείται ο μέσος όρος ως μέτρο της κεντρικής τάσης, η παραπάνω εξίσωση μπορεί να ξαναγραφτεί ως εξής:
M.A.D(¯x)=∑ni=|xi–¯x|/n
Where¯x=Mean
Εάν η διάμεσος χρησιμοποιείται ως μέτρο:
Γύρω από τη διάμεσο, είναι παρόμοια:
M.A.D(a) =∑ n i = | x i – M |/ n
Το M είναι η διάμεση τιμή.
Ας δούμε αυτό το παράδειγμα για να το καταλάβουμε καλύτερα:
- Ο Arjun απολαμβάνει να δημοσιεύει βίντεο με την κιθάρα του στο διαδίκτυο. Δείτε πόσα "μου αρέσει" έλαβαν τα τελευταία πέντε βίντεο:10, 15, 15, 17, 18, 21. Για να βρούμε την Απόλυτη μέση απόκλιση, πρέπει να υπολογίσουμε τη μέση τιμή.
Επομένως, ο μέσος όρος θα είναι:Το άθροισμα των δεδομένων είναι 96 συνολικά "μου αρέσει" και υπάρχουν έξι φωτογραφίες.
Που είναι 96/6 =16.
Η απόσταση μεταξύ κάθε σημείου δεδομένων και του μέσου όρου πρέπει τώρα να υπολογιστεί.
- | 10 – 16 | =6
- | 15 – 16 | =1
- | 15 – 16 |=1
- |17 – 16 |=1
- | 18 – 16 | =2
- | 21 – 16 | =5
Τώρα προσθέτουμε αυτούς τους αριθμούς μαζί και τους διαιρούμε με τον αριθμό των σημείων δεδομένων:6 + 1 + 1 + 1 + 2 + 5 =16 / 6 =2,67
Ως εκ τούτου, κατά μέσο όρο, κάθε φωτογραφία απείχε τρία likes από τη μέση τιμή.
Συμπερασματικά:
Η απόλυτη μέση απόκλιση είναι ένας από τους καλύτερους τρόπους κατανόησης και ανάλυσης ενός συνόλου δεδομένων, επειδή είναι απλός στον υπολογισμό, βασίζεται σε όλες τις παρατηρήσεις μιας σειράς, δείχνει τη διασπορά ή τη διασπορά των διαφόρων στοιχείων ενός σειρά από την κεντρική της τιμή και δεν επηρεάζεται από τις τιμές των ακραίων στοιχείων της σειράς. Ελπίζουμε ότι αυτό το άρθρο σας έδωσε μια καλύτερη κατανόηση της μέσης απόκλισης.