Статистическа грешка, която възниква, когато анализаторът не избере извадка, която представлява цялата популация от данни, а получените резултати се различават от тези, които биха били получени от цялата популация.

Ако погледнете определението за извадково наблюдение, ще забележите че един от най-важните му елементи е наличието на всички характеристики на съвкупността. Например: ако целта на изследването е да представи общественото мнение преди избори, допитване до всеки един от хората с право на глас (изчерпателно наблюдение) е трудно осъществимо. В такива случай се прави извадково наблюдение – изследват се групи от общото, които покриват основните му характеристики. В случая с проучването на мнението преди избори е необходимо да се гарантира, че в обособената извадка фигурират представители от всички групи – по пол, възраст, образование, доход и населено място.

Защо това е важно? През 1936 година американското списание Literary Digest организира най-мащабното и скъпо платено проучване за прогнозиране на следващия американки президент – Алфред Ландън или Франклин Д. Рузвелт. Събраната извадка, която е най-голямата за такива цели до момента (около 2,4 милиона души), предвижда сигурна победа за Ландън с 57%.

В действителност Рузвелт печели с 62%. На какво се дължи тази грешка? Проучването на Literary digest се провежда по телефон, който през 1936 г. е притежание предимно на домакинства с по-висок доход, традиционни привърженици на републиканската партия и съответно на Ландън. Иначе казано, независимо от размера на извадката, ако тя не притежава важните характеристики на съвкупността (в случая - разпределение на ниво доходи на домакинствата), прогнозите направени с нея ще са най-вероятно грешни.