Αναρωτιέσαι: Μήπως βρήκα, δηλαδή, πόσο είναι το μέγεθος που ερευνώ; Αυτές οι περίπου ίδιες μεταξύ τους μετρήσεις παρουσιάζουν μεγάλη επαναληψιμότητα. Ναι! Μπορεί, όμως, να είναι πολύ μακριά από την πραγματική τιμή του μεγέθους, δηλαδή να παρουσιάζουν μικρή ακρίβεια. Κάποια Συστηματικά Σφάλματα σε εξαπάτησαν. (Προς στιγμήν, ελπίζω!)
Παράδειγμα: Στο ευγενές άθλημα της τοξοβολίας ρίχνεις 4 βέλη το ένα δίπλα στο άλλο.

Στόχοι τοξοβολίας.
Αναφορές & Πηγές
Σφάλματα και Κατάλοιπα: Ας υποθέσουμε ότι υπάρχει μια σειρά παρατηρήσεων της κατανομής της μεταβλητής
Πληθυσμός (population): Κάθε σύνολο Ν αντικειμένων ή Ν ατόμων που έχουν κάποιο κοινό μετρήσιμο χαρακτηριστικό X κσι δυνητικά μπορω να μετρησω.
Δείγμα (sample) : Κάθε υποσύνολο του πληθυσμού
Κατανομή μετρήσεων: Οι όροι πληθυσμός και δείγμα μπορεί να αναφέρονται είτε στα άτομα, είτε στις μετρήσεις του κοινού χαρακτηριστικού τους Χ. Γενικά υπάρχει μια κατανομή των μετρήσεων του δείγματος, η οποία συνήθως μελετάται και μια κατανομή των μετρήσεων όλου του πληθυσμού που συνήθως υπάρχει αλλά είναι δύσκολο να προσδιοριστεί.
Έστω ότι μελετώ ένα πλυθησμό μεγέθους Ν με γνωστή τιμή
Πιθανότερη τιμή για το μέγεθος Χ αποτελεί η μέση τιμή της κατανομής :
Το
Σφάλμα μεμονωμένης μέτρησης
Διακύμανση
Η διακύμανση ισούται με την μέση τιμή των τετραγώνων των σφαλμάτων και αποτελεί μια ένδειξη το πόσο απέχουν οι μετρούμενες τιμές από τον μέσο ορό. Στην ουσία μέσω των τετραγώνων των σφαλμάτων εισάγεται στατιστικό βάρος, ώστε όσο πιο μακριά βρίσκονται οι τιμές από τον μέσο ορό τόσο μεγαλύτερη να είναι η συνεισφορά τους στην διακύμανση. Στην περίπτωση που οι τιμές
Αξίζει να σημειωθεί ότι η μέση τιμή και η διακύμανση αναφέρονται και ως ροπή πρώτης τάξης και ροπή δεύτερης τάξης αντίστοιχα και στην ουσία αποτελούν περιγραφείς σχήματος.
Τυπική απόκλιση κατανομής
Δίνεται από την ρίζα της διακύμανσης και εκφράζει ποσό απέχουν οι μετρήσεις από την πραγματική τιμή αλλά στις ίδιες μονάδες με τις μετρήσεις.
Μπορούμε να θεωρήσουμε την τυπική απόκλιση ως το μετρό ενός διανύσματος σε ένα πολυδιάστατο ευκλείδιο χώρο μεταξύ των σημείων
Αξίζει να σημειωθεί ότι σε οποιαδήποτε κατανομή, περίπου το 95% των τιμών θα βρίσκεται εντός 2 τυπικών αποκλίσεων από τη μέση τιμή.

Συχνά επειδή δεν είναι δυνατό να γνωρίζουμε το Χ η να πάρουμε όλες τις μετρήσεις που θα επιθυμούσαμε αλλά και για οικονομικούς και πρακτικούς λογούς περιοριζόμαστε σε ένα δείγμα του πληθυσμού.
Ως εκτίμηση του Χ θεωρούμε τη μεση τιμή

Το σφάλμα
Η τυπική απόκλιση
Ο παράγοντας n-1 αποτελεί μια διόρθωση για το δείγμα, ισχύει επίσης μεταξύ δείγματος και κατανομής
το
το τυπικό σφαλμα δίνεται από:
το σχετικό τυπικό σφάλμα δίνεται από:
η εκτίμηση του μεγέθους Χ
Πολύ συχνά ζητείται να επιβεβαιωθεί η γραμμική σχέση μεταξύ δυο μεταβλητών x, y εκ των οποίων η y θεωρείται εξαρτημένη ενώ η x.ανεξάρτητη. Δηλαδή ότι υπάρχει κάποιο α και β τέτοια ώστε η ευθεία y=α+βx να μοντελοποιεί τα δεδομένα μας (
Η μέθοδος αυτή ονομάζεται γραμμική παλινδρόμηση (linear regression) και στην ουσία μπορεί και μοντελοποιεί και μη γραμμικές σχέσεις όπως πολυωνυμικές και εκθετικές.
Στο παρακάτω σχήμα βλέπουμε κάποια δεδομένα κι ζητάμε την ευθεία η όποια αντιπροσωπεύει καλύτερα αυτά τα δεδομένα. Ένας συνήθης τρόπος είναι να απαιτήσουμε το σύνολο των καταλοίπων (διάφορα μέτρησης με την προβλεπόμενη-εκτιμώμενη τιμή) να είναι ελάχιστο, δηλαδή το άθροισμα των τετραγώνων των διαφόρων yi-y να είναι ελάχιστο. Ονομάζεται μέθοδος ελαχίστων τετραγώνων.
Οι εκτιμώμενοι παράμετροι
όπου

