Лекція 1.7 .
Виявлення та вилучення похибок.
Основним методом зменшення впливу випадкових похибок є здійснення вимірювань з багаторазовими спостереженнями і подальше статистичне опрацювання отриманих результатів. Методики статистичного опрацювання залежать від виду вимірювання, а також від статистичних властивостей випадкових похибок, зокрема, їх розподілу, корельованості тощо, вони грунтуються на статистичних методах оцінювання параметрів випадкових величин. Використання конкретної методики залежить від апріорної інформації про параметри розподілу випадкових похибок. Якщо така інформація відсутня, то необхідно виконати широкі за обсягом експериментальні дослідження для оцінювання потрібних властивостей випадкових похибок, зокрема, моделі густини розподілу та числових характеристик. Для кожної густини розподілу випадкової похибки існує інший спосіб розрахунку результату вимірювання за результатами окремих спостережень, а також інший спосіб оцінювання довірчих границь непевності (розсіювання) результату.
Загалом, незалежно від виду розподілу випадкових похибок якість оцінюваного результату покращується зі збільшенням кількості результатів спостережень. Однак треба врахувати принаймні чотири застереження:
Розподіл випадкової похибки не повинен суперечити модельному, згідно з яким оцінюють результат і його непевність. Якщо ж фактичний розподіл суперечить модельному, то оцінюваний результат вимірювання, а також параметри його непевності можуть істотно відрізнятися від найкращих, одержуваних для заданої моделі розподілу.
Окремі результати спостережень повинні бути статистично незалежними,некорельованими. Наявність кореляції між результатами спостережень погіршує якість отримуваних оцінок.
Вимірювана величина повинна залишатися сталою під час усього вимірювального експерименту. Навіть повільна зміна вимірюваної величини під час тривалого експерименту (для збільшення кількості спостережень) спричиняє погіршення оцінюваного результату (вплив динамічної похибки вимірювання).
4. В остаточному результаті повинні бути відсутні систематичні похибки або вони повинні бути якісно скориговані. Наявність невиявленої і неякісно скоригованої систематичної похибки зводить нанівець намагання покращити результатвимірювання, збільшивши кількість результатів спостережень.
Якщо у конкретному вимірюванні розподіл випадкових похибок та інші їх характеристики заздалегідь невідомі, то необхідно виконати детальні статистичні дослідження для їх встановлення. Застосовують відповідні статистичні критерії і для досягнення заданого рівня впевненості про вид розподілу необхідно виконати великий обсяг вимірювальних експериментів, навіть кілька сотень і більше.
Найчастіше на основі експериментальних даних спочатку будують гістограму і за її формою роблять попередній висновок про вид розподілу. Далі на основі одного з критеріїв перевіряють гіпотезу на належність певного розподілу до вибраного модельного. Досліджуючи випадкові похибки, знаходять інші їх характеристики, зокрема, оцінки математичного сподівання, медіани, моди, дисперсії, асиметрії, ексцесу тощо. Оскільки наявна лише скінченна за обсягом група результатів (так звана вибірка), то розраховані ті чи інші характеристики похибки є випадковими величинами. Це пояснюється тим, що, здійснивши інший експеримент, ми отримаємо інші результати (іншу вибірку), і, як наслідок, інше значення шуканої характеристики. І так для кожної нової групи результатів. Однак важливим є те, що зі збільшенням обсягу вибірки одержувані значення характеристики будуть мати менший розкид, тобто стабілізуються.
Внаслідок того, що в результаті розрахунків отримуємо не справжнє (істинне) значення характеристики, а лише певне, близьке до неї випадкове значення, то говорять не про визначення характеристик випадкових похибок, а про їх оцінювання.
Розраховану за експериментальними даними оцінку певної характеристики прийнято називати вибірковою характеристикою, а також статистикою. Отже, вибіркова характеристика (статистика) певної групи результатів є випадковою величиною, що має певний розподіл значень та числові характеристики (математичне сподівання, дисперсію тощо).
Незважаючи на те, що середнє значення є широковживаною характеристикою для опрацювання результатів з багаторазовими спостереженнями, воно є справді "найкращим" лише для нормального розподілу випадкових похибок. Для інших розподілів середнє за ефективністю може поступатися іншим оцінкам. Зокрема, якщо відомо, що розподіл випадкових похибок є двостороннім експоненційним, то найкращою оцінкою результату є медіана вибірки - елемент впорядкованої за зростанням вибірки з серединним номером. Якщо ж відомо, що похибка має рівномірний розподіл, то найкращою оцінкою результату є середина розмаху вибірки, тобто середнє значення з найменшого і найбільшого елементів впорядкованої вибірки (див. нижче).
Перевірка гіпотези про заданий розподіл випадкових похибок
У практиці вимірювань часто закон (густина) розподілу випадкових похибок невідомий, хоча з тих чи інших підстав можна зробити певний прогноз щодо його виду (назвемо його модельним розподілом В). Такий прогноз можна зробити на основі побудови гістограми чи полігона. Точніше можна оцінити густину розподілу випадкових похибок, використовуючи статистичні методи, зокрема, перевірку гіпотези про те, що закон розподілу В не суперечить експериментальним даним. Така гіпотеза перевіряється за допомогою спеціально вибраної випадкової величини - критерію узгодженості. Його значення залежать від одержаних результатів вимірювального експерименту та значень, які відповідають модельному розподілу В.
Гістограма, полігон. Для якісного оцінювання форми закону розподілу широко застосовують наочні графічні методи, зокрема, будують полігон та гістограму статистичного розподілу. Для цього отримані результати спостережень х,, х2,..., хп (де п- обсяг вибірки -кількість спостережень), які в літературі зі статистики називають варіантами, спочатку сортують за зростанням і одержану впорядковану послідовність називають варіаційним рядом
хсі<хс2<хс3<...<хсі
Оскільки результати вимірювань подаються скінченною кількістю цифр (за умови застосування цифрових приладів це здійснюється автоматично), то деякі з результатів можуть повторюватися кілька разів. Відношення кількості п. випадань результату х . до загальної кількості спостережень п називається відносною частотою результату

а сукупність відносних частот називається статистичним розподілом вибірки. Його називають емпіричним, оскільки частоти появи окремих результатів знайдені за експериментальними - емпіричними даними.
Внаслідок порівняно невеликого обсягу вибірки (всього 50 елементів) на основі статистичного розподілу досить важко встановити вигляд розподілу випадкових похибок, для цього потрібно мати вибірку в кілька сотень (а часто навіть і тисяч) результатів спостережень. А це, своєю чергою, вимагає значних експериментальних затрат.
Певним вирішенням такої проблеми є усереднення отриманого статистичного розподілу у формі гістограми та полігона, які є певними аналогами густини розподілу випадкової похибки. Операція усереднення полягає у тому, що гістограма і полігон будуються не для кожного можливого результату спостереження, як це зроблено для статистичного розподілу, а для груп результатів, які потрапляють в деякий інтервал, наприклад, сталої ширини h.
Гістограмою називають ступеневу фігуру, яка утворена з прямокутників сталої ширини й, а їх висоти дорівнюють частотам потрапляння результатів у відповідні sнтервали (рис1. , а). Для побудови гістограми спочатку весь інтервал можливих значень як різницю між найбільшим та найменшим значеннями вибірки -так званий розмах вибірки
ділять на r інтервалів .


Рис1. . Гістограма (а) і полігон (б)
Кількість інтервалів залежить від кількості результатів, хоча не існує однозначної залежності між ними. Якщо кількість результатів спостережень невелика, можна використати залежність r =?n ,а ддя значніших обсягів вибірок (сотні, тисячі і більше) існують інші залежності; водночас рекомендована кількість інтервалів досить невелика і знаходиться в межах від 7 до 22.
Полігоном – називають ламану , відрізки якої сполучають точки, що відповідають серединам верхніх основ прямокутників. За формою гістограми або полігона можна зробити висновок по закон розподілу випадкових похибок.
Перевірка статистичних гіпотез про розподіл похибки. Критерій?2 . Найоб'єктивнішу відповідь на гіпотезу про узгодженість певного модельного розподілу випадкових похибок з отриманими результатами
спостережень дають статистичні критерії узгодженості. Абстрагуючись від розподілу випадкових похибок, у загальнішому розумінні під час статистичних досліджень певних виробів висувають гіпотезу про те, що досліджуваний виріб є бракованим, тобто не відповідає нормам. Загалом запропонована гіпотеза може бути правильною або неправильною. її перевіряють статистичними методами. Внаслідок перевірки гіпотези можуть бути зроблені два неправильні висновки, тобто можуть бути допущені помилки двох родів.
Помилка першого роду полягає у тому, що буде відкинена правильна гіпотеза, наприклад, виріб є бракованим, однак він зарахований до справних. Помилка другого роду полягає у тому, що буде прийнята неправильна гіпотеза, наприклад, виріб є справним, однак він зарахований до бракованих. Помилки першого чи другого родів можуть мати різні наслідки. Якщо досліджувалася міцність троса пасажирського ліфта, і на основі виконаних вимірювань була запропонована гіпотеза про непридатність троса, то помилка першого роду - відкинена правильна гіпотеза, тобто трос зарахований до придатних для застосування - може призвести до загибелі людей. Помилка другого роду - добрий трос був визнаний бракованим -спричинить лише матеріальні втрати (вартість доброго троса). В Інших випадках наслідки помилок першого та другого родів можуть бути іншими.
Ймовірність допустити помилку першого роду (відкинути правильну гіпотезу) прийнято позначати ? і її називають рівнем значущості. Оскільки це ймовірність відкинення правильної гіпотези, то рівень значущості інколи називають ризиком (відкинути правильну гіпотезу).
Ймовірність допустити помилку другого роду (прийняти неправильну гіпотезу) прийнято позначати ?.
Очевидно, що ймовірність відкинення правильної гіпотези повинна бути малою, однак, разом з тим, цю ймовірність не можна задавати занадто малою, оскільки тоді зросте ймовірність прийняття неправильної гіпотези. Типово рівень значущості (ризик) становить від ? =0,001 до ? -0,1, а найчастіше - на рівні кількох сотих. Зарахування результатів, спотворених грубими похибками (промахів) до таких, які не відкидають, може істотно змінити результат вимірювання.
Для перевірки статистичних гіпотез про передбачуваний закон невідомого розподілу похибки (і не тільки) використовують так званий критерій узгодженості. Існує декілька критеріїв узгодженості:
?2 {"хі~квадрат") Пірсона,
Колмогорова,
Смірнова тощо.
Найзручнішим і наЙуніверсальншшм критерієм узгодженості є критерій ?2 К. Пірсона, він цілком не залежить ні від виду закону розподілу, ні від значень випадкових похибок.
Виявлення грубих результатів вимірювань
При використанні статистичних методів для оцінки результату і характеристик випадкових похибок вимірювань за вибіркою (серією, рядом) результатів спостережень обмеженого об’єму повинна виконуватися вимога однорідності цієї вибірки, тобто приналежність усіх її членів до однієї генеральної сукупності. Проте на практиці дана вимога часто порушується, оскільки до складу вибірки можуть входити результати спостережень, які мають грубі похибки і промахи, що може призвести до істотного викривлення результату вимірювань і його похибки.
При попередньому перегляді результатів спостережень експериментатор мусить діяти так. Якщо є результати спостережень (звичайно один-два), які різко відрізняються від інших, то слід уважно проаналізувати, чи не допущена помилка при знятті показів ЗВТ або їх записі. Коли експериментатор переконався, що дані результати є промахами, то вони вилучаються з подальшого розгляду. В противному разі, тобто якщо не вдається підтвердити, що підозрілі результати належать до промахів, необхідно перевірити, чи не викликані сумнівні результати спостережень грубими похибками. Така сама перевірка необхідна і в тому випадку, коли експериментальні дані одержані автоматично, а також за умови, що їх обробка виконується через деякий час після закінчення експерименту.
Для виявлення грубих результатів (похибок) вимірювань використовують статистичні критерії.
При умові, що вимоги до точності результатів прямих вимірювань невисокі, можна користуватися найпростішим критерієм, яким є "правило EMBED Equation.3". Його сутність полягає в тому, що для вибірки EMBED Equation.3 обчислюється оцінка СКВ EMBED Equation.3 і всі результати спостережень, які задовольняють умову EMBED Equation.3, визнаються такими, що мають грубі похибки. Дане правило в ряді випадків є надмірно "жорстким". Так, якщо для нормального розподілу поява результату спостереження EMBED Equation.3 свідчить про наявність у ньому грубої похибки, то для рівномірного розподілу аналогічний висновок відповідає умові EMBED Equation.3. Це означає, що критерій виявлення грубих похибок повинен ураховувати не тільки степінь розсіювання результатів вимірювань, яке характеризується значенням СКВ EMBED Equation.3, але й вид розподілу випадкових похибок.
Для виявлення грубих похибок результатів вимірювань, які підпорядковуються нормальному розподілу, широке розповсюдження знаходить критерій, що ґрунтується на порівнянні теоретичного (або граничного) і експериментального (або фактичного) значень параметра t, який характеризує найбільше відхилення результатів спостережень EMBED Equation.3 від середнього арифметичного EMBED Equation.3.
Методика застосування цього критерію така.
1. Складають упорядкований (варіаційний) ряд результатів спостережень, розмістивши вихідні елементи ряду в порядку зростання (убування) і виконавши їх перенумерування, наприклад, EMBED Equation.3.
2. Для початкового ряду результатів спостережень обчислюють значення середнього арифметичного EMBED Equation.3 і незміщеної оцінки СКВ EMBED Equation.3.
3. Для крайніх членів упорядкованого ряду, які найбільш віддалені від центра розподілу (визначається як середнє арифметичне EMBED Equation.3 цього ряду) і тому з найбільшою ймовірністю можуть мати грубі похибки, обчислюють відношення
EMBED Equation.3
де EMBED Equation.3 та EMBED Equation.3.
4. За таблицею значень EMBED Equation.3 входом якої є заданий рівень значущості EMBED Equation.3 і число елементів вибірки n, знаходять теоретичне значення EMBED Equation.3 і порівнюють його з обчисленим у п. 3 значенням t. Якщо виявиться, що EMBED Equation.3, то відповідний результат спостереження EMBED Equation.3 або EMBED Equation.3, повинен бути вилучений з подальшої обробки як грубий.
Потім пп. 2?4 повторюють для (n?1) елементів вибірки до тих пір, доки умова EMBED Equation.3 не перейде в умову EMBED Equation.3. Проте при невеликій кількості спостережень, принаймні при EMBED Equation.3, указана методика може призвести до невірної оцінки грубої похибки і, як наслідок, до помилкового вилучення результату спостереження EMBED Equation.3, який насправді не є грубим.
Методи вилучення систематичних похибок з результатів вимірювань
Систематичні похибки, незалежно від характеру їх змінювання в часі при постановці і проведенні вимірювального експерименту, повинні бути виявлені і вилучені з результатів вимірювань або хоча б зменшені, для чого важливо знати джерела і причини їх виникнення. За цією ознакою розрізняють такі систематичні похибки: похибку через неадекватність об’єкта і фізичної моделі вимірювання; похибки методу вимірювання і ЗВТ; похибки, обумовлені дією впливних величин, і суб’єктивну похибку оператора. Систематичні похибки можуть бути викликані одночасно декількома причинами, які треба враховувати при організації вимірювального експерименту і виробленні заходів щодо їх вилучення.
Наведемо основні методи вилучення або зменшення систематичних похибок результатів вимірювань.
1. Застосування спеціальних конструктивних і схемотехнічних рішень, направлених на ослаблення або усунення дії на систематичну похибку ЗВТ впливних величин. Наприклад, термостатування і теплоізоляція ЗВТ або окремих його вузлів з метою зменшення температурної похибки, екранування для захисту від зовнішніх електромагнітних полів, застосування спеціальних фундаментів і віброгасних пристроїв для ослаблення впливу механічних дій, застосування спеціальних схемотехнічних рішень при розробці найбільш критичних до дії зовнішніх факторів вузлів ЗВТ та їх виготовлення з високостабільних комплектуючих елементів.
2. Вилучення методичної систематичної похибки аналітичним шляхом на основі розрахунку її значення, виходячи з особливостей застосованого при експерименті методу вимірювань і характеристик ЗВТ.
3. Використання методу заміщення для виключення інструментальної похибки вимірювань, яка обумовлена вимірювальним приладом. При цьому вимірювання виконуються за два етапи. Спочатку на вхід вимірювального приладу подається вимірювана фізична величина і фіксується показ приладу. Потім до входу вимірювального приладу приєднується вихід регульованої зразкової міри, яка відтворює фізичну величину, однорідну з вимірюваною і, регулюючи міру, добиваються того ж показу приладу. Результат вимірювання, вільний від систематичної похибки, зчитується з відлікового пристрою міри.
Прикладом вилучення систематичної похибки за допомогою методу заміщення служить вимірювання активного опору EMBED Equation.3 омметром, який має постійну систематичну похибку, в тому числі за рахунок з’єднувальних проводів. Результат вимірювання опору омметром подамо у вигляді EMBED Equation.3, де EMBED Equation.3 ? систематична похибка омметра. Після цього замість вимірюваного опору EMBED Equation.3 до омметра приєднується магазин опору, змінюванням опору EMBED Equation.3 якого добиваються того ж показу омметра EMBED Equation.3. При постійній систематичній похибці омметра EMBED Equation.3 для результатів двох вимірювань (а вони однакові й дорівнюють EMBED Equation.3) виконується умова EMBED Equation.3, звідки EMBED Equation.3, тобто відлік результату вимірювання опору EMBED Equation.3 здійснюється з магазина опору, а постійна систематична похибка омметра EMBED Equation.3 вилучається.
4. Застосування методу компенсації систематичної похибки за знаком. Метод дозволяє вилучити постійну систематичну похибку, яка обумовлена впливною величиною і характеризується не тільки її значенням, але й напрямом. Для цього необхідно провести два вимірювання величини X таким чином, щоб систематична похибка EMBED Equation.3, залишаючись незмінною за модулем, увійшла в результати вимірювань EMBED Equation.3 з різними знаками: EMBED Equation.3 і EMBED Equation.3. Тоді результат вимірювання визначається середнім значенням
EMBED Equation.3
Такий варіант методу компенсації за знаком використовується, зокрема, для вилучення систематичних похибок, обумовлених впливом зовнішніх постійних магнітних полів або термоЕРС, у цифрових фазометрах двопівперіодної дії (з усередненням двох результатів вимірювань, виконаних через півперіоду вхідних сигналів). Різновидом методу компенсації є метод періодичних спостережень, який дозволяє вилучити періодичну систематичну похибку. Його суть зводиться до того, що вимірювання проводять парне число разів через інтервали часу, що дорівнюють півперіоду змінювання систематичної похибки, а результат вимірювання знаходять усередненням одержаних результатів.
5. Застосування методу протиставлення, який також передбачає дворазове вимірювання розміру фізичної величини. При цьому умови експериментів повинні відрізнятися так, щоб за відомими закономірностями систематичної похибки можна було б її вилучити. Прикладом цього методу може служити вимірювання активного опору EMBED Equation.3 за схемою моста постійного струму (рис. 1), для якої результат вимірювання визначається з умови рівноваги EMBED Equation.3.
EMBED Msxml2.SAXXMLReader.5.0
]Рис.1. До пояснення вилучення систематичної похибки вимірювань
за допомогою метода протиставлення
Результат вимірювання EMBED Equation.3 може включати в себе систематичну похибку внаслідок відмінності опорів резисторів EMBED Equation.3 від їх номінального значення. Цю похибку можна вилучити, якщо резистори R1 і R2 поміняти місцями і знову зрівноважити міст тільки резистором R3. З умови рівноваги моста одержимо EMBED Equation.3, де EMBED Equation.3 ? опір резистора R3 при новій рівновазі моста. Підставивши відношення EMBED Equation.3, знайдене з однієї умови рівноваги моста, в іншу умову його рівноваги, одержимо EMBED Equation.3. Таким чином, із результату вимірювання EMBED Equation.3 виключається відношення опорів EMBED Equation.3, а отже, і систематична похибка, що вноситься резисторами R1 і R2.
6. Проведення повірки ЗВТ з метою визначення систематичної похибки та її компенсації уведенням поправки в результат вимірювання. Цей метод застосовується для вилучення постійних у часі систематичних похибок, що мають ЗВТ, в окремих позначках шкали.
У сучасних ЗВТ, особливо в програмно-керованих, для визначення поправок або коригувальних коефіцієнтів усе ширше використовується калібрування від внутрішнього, інколи зовнішнього калібратора, який являє собою або джерело зразкового (опорного) сигналу з параметрами, заданими з високою точністю, або зразкові елементи (резистори, конденсатори). Калібрування здійснюється в декількох точках діапазону вимірювань, для кожної з них визначається поправка (або коригувальний коефіцієнт) і всі їх значення записують в ОЗП ЗВТ. Потім результат вимірювання уточнюється за допомогою поправки або коригувального коефіцієнта.
Таким чином, у принципі, систематичні похибки вимірювань можуть бути передбачені, виявлені і тому є можливість для їх повного вилучення з результату вимірювання, тобто перейти до виправленого результату вимірювання. Проте, використовуючи на практиці описані методи вилучення систематичних похибок, слід пам’ятати, що повною мірою добитися цієї мети не можна. Отже, будь-який виправлений результат вимірювання має деякий залишок систематичної похибки, названий невилученою систематичною похибкою, що є випадковою величиною, оцінювання характеристик якої ґрунтується на методах математичної статистики.
Інколи для підвищення правильності вимірювань, тобто зменшення систематичних похибок, використовують рандомізацію. Під рандомізацією розуміють штучне переведення систематичних похибок у випадкові (в перекладі з англійської термін "рандомізація" означає перемішування, створення хаосу). Для здійснення рандомізації процес вимірювання організується так, щоб фактори, які впливають на результати вимірювань, а точніше, на їх похибки, діяли випадково. Наприклад, неточне градуювання шкали вимірювального приладу призводить до появи систематичних похибок для даного приладу. Якщо ж вимірювання самої фізичної величини провести декількома приладами даного типу, то ці похибки будуть змінюватися від приладу до приладу випадково. Піддаючи одержані результати спостережень статистичній обробці, можна істотно зменшити систематичну складову результату вимірювання.