Neistoty typu A
Neistoty merania, ktoré sa prejavujú tak, že pri opakovaných meraniach sa získajú rôzne hodnoty, sa nazývajú neistoty typu A (kategória náhodných chýb). Ich veľkosť môžeme odhadnúť opakovaním merania. Neistoty typu A majú vo všeobecnosti dve hlavné príčiny:
-
Meraná veličina je „presná“, fluktuáciu hodnoty (neistotu) spôsobuje metóda merania. Tu možno zahrnúť nedokonalosť ľudských zmyslov a meracích prístrojov.
-
Fluktuácia meranej veličiny vyplýva z jej podstaty. Napríklad meranie sily vetra, ktorá kolíše, a teda iba séria opakovaných meraní umožňuje určiť jej strednú hodnotu.
Metóda vyhodnotenia tohto typu neistôt vychádza zo štatistickej analýzy opakovanej série meraní. Ak je n nezávislých rovnako presných pozorovaní (n>1), bude odhad výslednej hodnoty y reprezentovaný hodnotou výberového priemeru (aritmetického priemeru). Neistota prislúchajúca k odhadu y sa určí ako smerodajná odchýlka tejto výslednej hodnoty, teda výberového priemeru.
Charakteristiky polohy a šírky štatistického súboru
Opakovanými meraniami získavame súbor hodnôt sústredených okolo „správnej“ hodnoty, čo je možné popísať pomocou štatistických charakteristík. Hodnoty štatistického súboru sa obvykle znázorňujú histogramom. Jeho konštrukcia závisí od vlastností štatistických súborov, ktoré sa delia na dva typy: diskrétne – namerané údaje nadobúdajú iba isté konkrétne hodnoty (napríklad meranie rádioaktivity / počet jadrových rozpadov za jednotku času alebo výsledok hádzania kockou) a spojité – namerané hodnoty môžu nadobúdať ľubovoľnú veľkosť.
Opakovaním merania získame N nameraných hodnôt x1, x2, …, xn (platí pre spojité i diskrétne rozdelenie). Najbežnejšou metódou určenia stredu rozdelenia je výpočet aritmetického priemeru.
\[ \overline{x}=\frac{1}{N}\sum_{i=1}^{N}x_{i} \]
Platí pravidlo aditívnosti (dva súbory N hodnôt xi, yi)
\[ \overline{x+y}=\frac{1}{N}\sum_{i=1}^{N}\left(x_{i}+y_{i}\right)=\frac{1}{N}\sum_{i=1}^{N}x_{i}+ \frac{1}{N}\sum_{i=1}^{N}y_{i}=\overline{x}+\overline{y} \]
a multiplikatívnosti
\[ \overline{cx}=\frac{1}{N}\sum_{i=1}^{N}\left(cx_{i}\right)=c\frac{1}{N}\sum_{1}^{N}x_{i}=c\overline{x} \]
Napriek svojím výhodám má aritmetický priemer jednu nepríjemnú vlastnosť: je extrémne citlivý na „vybočujúce údaje“. Preto boli vypracované také postupy hľadania stredu (vrcholu) rozdelenia početnosti, ktoré sú menej citlivé na prítomnosť vybočujúcich údajov. Najbežnejšie: orezaný aritmetický priemer, medián a modus.
Orezaný aritmetický priemer sa počíta ako obyčajný aritmetický priemer zo súboru, z ktorého bolo vynechané isté percento údajov, symetricky od najvyšších a najnižších hodnôt. Počet orezaných údajov sa volí empiricky s ohľadom na početnosť vybočujúcich údajov a nezvykne prevyšovať 20 %.
Medián je prostredný prvok zo súboru hodnôt usporiadaných podľa veľkosti. Pri párnom počte údajov je to aritmetický priemer z príslušných prostredných hodnôt. Prítomnosť dvoch údajov vybočujúcich tým istým smerom znamená posun mediánu na susedný prvok súboru. Keďže sa medián nachádza v oblasti maxima výskytu prvkov, neznamená to obvykle podstatnú zmenu hodnoty mediánu. Medián sa obyčajne označuje vlnovkou (tildou) nad písmenom.
Modus je charakteristikou odvodenou od histogramu a predstavuje polohu jeho maxima. Keďže intervaly histogramu sú obvykle dosť široké, pri hľadaní maxima sa robí geometrická interpolácia.
Druhou základnou charakteristikou rozdelení, ktoré majú výrazné maximum, je priemerná veľkosť odchýlok nameraných hodnôt od maxima – šírka rozdelenia. Keďže odchýlky sú tak kladné ako aj záporné, obyčajný aritmetický priemer odchýlok nie je vhodnou charakteristikou. Preto sa najčastejšie používa priemer z druhých mocnín odchýlok – disperzia (rozptyl, variancia).
\begin{aligned}
\ D(x) = \frac{ 1 }{ N } \sum_{i=1}^N \left( x_i-\overline{x} \right) ^2
\end{aligned}
Iný spôsob výpočtu disperzie:
\begin{aligned}
\ D(x) = \frac{ 1 }{ N } \sum_{i=1}^N \left( x_i-\overline{x} \right) ^2 = \frac{ 1 }{ N } \sum_{i=1}^N \left( x_i^2-2x_i \overline{x} + \overline{x}^2 \right) = \frac{ 1 }{ N } \sum_{i=1}^N x_i^2-2 \overline{x} \frac{ 1 }{ N }\sum_{i=1}^N x_i + \frac{ 1 }{ N } \sum_{i=1}^N \overline{x}^2 =
\end{aligned}
\begin{aligned}
\ = \frac{ 1 }{ N } \sum_{i=1}^N x_i^2-2 \overline{x} \overline{x} + \overline{x}^2 = \frac{ 1 }{ N }\sum_{i=1}^N x_i^2 - \left( \frac{ 1 }{ N } \sum_{i=1}^N x_i \right)^2
\end{aligned}
Ak rozptyl hodnôt spôsobujú dve vzájomne nezávislé príčiny x a y, výsledná stredná hodnota je rovná súčtu jednotlivých stredných hodnôt. Disperzia výsledného pôsobenia:
\begin{aligned}
\ D(x+y)= \frac{ 1 }{ N } \sum_{i=1}^N \left[ \left( x_i + y_i \right) - \overline{\left( x + y \right)} \right]^2 = \frac{ 1 }{ N } \sum_{i=1}^N \left[ \left( x_i + y_i \right) - \left( \overline{x} + \overline{y} \right) \right]^2 =
\end{aligned}
\begin{aligned}
\ = \frac{ 1 }{ N } \sum_{i=1}^N \left[ \left( x_i - \overline{x} \right) + \left( y_i - \overline{y} \right) \right]^2 = \frac{ 1 }{ N } \sum_{i=1}^N \left[ \left( x_i - \overline{x} \right)^2 + \left( y_i - \overline{y} \right)^2 + \left( x_i - \overline{x} \right) \left( y_i - \overline{y} \right) \right] =
\end{aligned}
\begin{aligned}
\ = \frac{ 1 }{ N } \sum_{i=1}^N \left( x_i - \overline{x} \right)^2 + \frac{ 1 }{ N } \sum_{i=1}^N \left( y_i - \overline{y} \right)^2 + \frac{ 1 }{ N } \sum_{i=1}^N \left( x_i - \overline{x} \right) \left( y_i - \overline{y} \right) =
\end{aligned}
\begin{aligned}
\ = D(x)+D(y)+2r \sqrt{D(x)} \sqrt{D(y)}
\end{aligned}
\begin{aligned}
\ r = \frac{ \sum_{i=1}^N \left( x_i - \overline{x} \right) \left( y_i - \overline{y} \right) }{ \sqrt{ \sum_{i=1}^N \left( x_i - \overline{x} \right)^2} \sqrt{ \sum_{i=1}^N \left( y_i - \overline{y} \right)^2} } = \frac{ D(x,y)}{ \sqrt{D(x)} \sqrt{D(y)}}
\end{aligned}
r je korelačný koeficient a D(x, y) sa nazýva vzájomný rozptyl (kovariancia).
Ak sú obe príčiny nezávislé, rozdiely (x - x̅) a (y - y̅) nadobúdajú nezávisle od seba kladné aj záporné hodnoty a ich súčin predstavuje v súčte veľmi malý príspevok v porovnaní s disperziami. Vtedy sa korelačný koeficient rovná nule (r = 0) a vzťah pre disperziu možno zjednodušiť na tvar:
\begin{aligned}
\ D(x+y) = D(x)+D(y)
\end{aligned}
Nulová hodnota korelačného koeficientu ešte nezaručuje štatistickú nezávislosť oboch príčin. Ak sú napríklad hodnoty xi, yi rovnomerne rozložené na kružnici (silná závislosť, žiadne náhodne rozložené body), dostaneme tiež r = 0.
Ak je súvis medzi odchýlkami veľmi tesný (v najhoršom prípade môžu byť priamo úmerné (y - y̅)=k(x - x̅), body xi, yi ležia na priamke v rovine xy), korelačný koeficient nadobúda hodnotu r = ±1. Pre kovarianciu v takomto prípade platí vzťah:
\begin{aligned}
\ D(x,y) = \pm \sqrt{D(x)} \sqrt{D(y)}
\end{aligned}
Disperzia charakterizuje rozptyl údajov okolo strednej hodnoty. Pretože je súčtom druhých mocnín odchýlok, fyzikálny rozmer disperzie je druhou mocninou fyzikálneho rozmeru meranej veličiny. Napr. pri meraní času stredná hodnota má rozmer [s] a disperzia [s2]. Preto sa zavádza štandardná (smerodajná) odchýlka:
\begin{aligned}
\ s(x) = \sqrt{D(x)}
\end{aligned}
Niekedy sa vyjadruje aj v percentách pod názvom relatívna štandardná (smerodajná) odchýlka:
\begin{aligned}
\ \rho (x) = \frac{s(x)}{\overline{x}}.100 \%
\end{aligned}
Podobne ako u disperzie, pre skladanie smerodajných odchýlok platia vzťahy:
\begin{aligned}
\ s(x+y) = \sqrt{s^2(x)+s^2(y)+2rs(x)s(y)}
\end{aligned}
\begin{aligned}
\ s(x+y) = \sqrt{s^2(x)+s^2(y)}
\end{aligned}
S rozdelením pravdepodobnosti súvisia pojmy strednej hodnoty rozdelenia pravde-podobnosti (limita aritmetického priemeru pre veľké početnosti N), ktorá sa označuje písmenom μ, a štandardnej odchýlky rozdelenia pravdepodobnosti (limita štandardnej odchýlky pre veľké početnosti N), ktorá sa označuje písmenom σ. Ich súvis s pravdepodobnosťami pi je nasledujúci:
\begin{aligned}
\ \mu = \lim_{N \rightarrow \infty} \overline{x} = \lim_{N \rightarrow \infty} \left( \frac{1}{N} \sum_{i=1}^k n_i x_i \right) = \lim_{N \rightarrow \infty} \left( \sum_{i=1}^k \frac{n_i}{N} x_i \right) = \sum_{i=1}^k \left( \lim_{N \rightarrow \infty} \frac{n_i}{N} \right) x_i = \sum_{i=1}^k p_i x_i
\end{aligned}
\begin{aligned}
\ \sigma^2 = \lim_{N \rightarrow \infty} D(x) = \lim_{N \rightarrow \infty} \left( \frac{1}{N} \sum_{i=1}^k n_i \left( x_i-\mu \right)^2 \right) = \lim_{N \rightarrow \infty} \left( \sum_{i=1}^k \frac{n_i}{N} \left( x_i- \overline{x} \right) ^2 \right) = \sum_{i=1}^k p_i \left( x_i- \overline{x} \right) ^2
\end{aligned}
Jednou z hlavných výhod rozdelenia pravdepodobnosti ako charakteristiky štatistického javu je to, že na základe detailnejších znalostí o povahe javu možno rozdelenie pravdepodobnosti teoreticky odvodiť. To umožňuje nájsť súvis medzi parametrami nameraného konečného súboru (aritmetický priemer, disperzia) a parametrami teoretického rozdelenia pravdepodobnosti (μ a σ).
Neistoty typu B
Ak máme iba jeden prístroj, opakovaním merania ho ako zdroj neistoty neodhalíme. Takéto neistoty sa nazývajú neistoty typu B (kategória systematických chýb). Ich veľkosť možno odhadnúť iba na základe doplňujúcich informácií (o presnosti prístroja, o vplyve parametrov prostredia na jeho údaj) od výrobcu. Ak takéto informácie nie sú k dispozícii, môžeme ich získať porovnaním údaja prístroja s iným, veľmi presným prístrojom. Podstatným rozdielom medzi neistotami typu A a B je teda to, že veľkosť neistôt typu A môžeme odhadnúť opakovaním merania a veľkosť neistôt typu B iba na základe doplňujúcich údajov. Záleží hlavne na skúsenosti experimentátora, či pri odhade neistoty typu B nezabudne zahrnúť niektorý dôležitý vplyv (vlhkosť vzduchu, rušenie a podobne). Preto v protokole je vhodné poznamenať všetky (aj zdanlivo nepodstatné) detaily, ktoré sa neskôr môžu využiť pri stanovení neistôt typu B.
Vyhodnotenie štandardných neistôt meranej veličiny metódou typu B je založené na iných než štatistických prístupoch k analýze série pozorovaní. Odhaduje sa pomocou racionálneho úsudku na základe všetkých možných dostupných informácií. Najčastejšie sa používajú:
- údaje výrobcu meracej techniky,
- skúsenosti z predchádzajúcich sérií meraní,
- skúsenosti s vlastnosťami chovania prvkov, materiálov a techniky,
- údaje získané pri kalibrácií z certifikátov,
- neistoty referenčných údajov v príručkách.
Pri určovaní neistoty metódou typu B sa vychádza z dielčích neistôt jednotlivých zdrojov uB(zi). Ak je známa maximálna odchýlka i-tého zdroja neistoty zi max, určí sa neistota uB(zi) podľa vzťahu:
\begin{aligned}
\ u_B(z_i) = \frac{z_{imax}}{k}
\end{aligned}
kde k je súčiniteľ vychádzajúci zo zákona rozdelenia, ktorým sa príslušný zdroj neistoty riadi, takže napr. pre normálne rozdelenie je k = 2, (príp. 3), pre rovnomerné rozdelenie k=√3 = 1,73 atď. V niektorých prípadoch však môže byť známa už priamo hodnota štandardnej neistoty uB(zi) (napr. z kalibračného certifikátu meradla). Výsledná neistota určovaná metódou B je pre p zdrojov z1, z2,...zp určená podľa vzťahu:
\begin{aligned}
\ u_B(x) = \sqrt{\sum_{i=1}^p A_i^2 u_B^2(z_i)}
\end{aligned}
kde uB(zi) sú neistoty jednotlivých zdrojov, Ai ich súčinitele citlivosti. Takto sa neistota vyhodnocovaná metódou B prevedie do celkom novej podoby. Aj tieto neistoty získavajú charakter smerodajnej odchýlky.
Kombinovaná a rozšírená neistota
V praxi iba málokedy vystačíme s jedným alebo druhým typom neistoty samostatne. Je potrebné určiť výsledný efekt kombinovaných neistôt merania oboch typov, A i B. Výsledná kombinovaná neistota veličiny y je označovaná uC(y) a určuje sa ako odmocnina súčtu štvorcov oboch typov neistôt A a B podľa vzťahu:
\begin{aligned}
\ u_C(y) = \sqrt{u_A^2(y)+u_B^2(y)}
\end{aligned}
Tam, kde nevystačia štandardné neistoty, je nutné použiť ich rozšíreného tvaru pomocou koeficientu kr. Pôvodne stanovená smerodajná odchýlka (teda aj štandardná neistota) predstavuje napríklad u najčastejšie používaného normálneho (Gaussovho) rozdelenia interval určený pravdepodobnosťou asi 68 %. Podobne je tomu i u iných typov rozdelení.
Aby bolo dosiahnuté lepšie pokrytie, ktorého pravdepodobnosť sa bude blížiť k 100 %, je nutné štandardnú neistotu rozšíriť koeficientom rozšírenia kr, ktorého význam je v podstate zhodný s významom kvantilov u normálneho Gaussovho rozdelenia, kde k=2 pre rozšírenie na 95 % pravdepodobnosť a k=3 pre rozšírenie na 99,7 % pravdepodobnosť atď. Rozšírená výsledná neistota je potom vyjadrená vzťahom:
\begin{aligned}
\ U(y) = k_r u_C(y)
\end{aligned}
kde U(y) je rozšírená neistota, kr koeficient rozšírenia, uC(y) štandardná neistota kombinovaná.
Zdroje neistôt
Ako zdroje neistôt možno označiť všetky javy, ktoré určitým spôsobom môžu ovplyvniť neurčitosť jednoznačného stanovenia výsledku merania a tým vzdiaľujú nameranú hodnotu od hodnoty skutočnej. Značnú úlohu tu zohráva tiež skutočnosť, či ide o meracie metódy priame alebo nepriame. Na neistoty pôsobí výber meracích prístrojov analógových alebo číslicových, použitie rôznych filtrov, vzorkovačov a ďalších prostriedkov v celej trase prenosu a úpravy meracieho signálu. K neistotám veľmi výrazne prispievajú rušivé vplyvy prostredia v tom najširšom slova zmysle. Najčastejšie sa vyskytujúce zdroje:
- neúplná definícia meranej veličiny,
- nedokonalá realizácia definície meranej veličiny,
-
nevhodný výber prístroja (rozlišovacia schopnosť ai.), nereprezentatívny výber vzorky – meraná vzorka nemusí reprezentovať definovanú meranú veličinu,
- nevhodný postup pri meraní,
- nedostatočne známe účinky podmienok prostredia (ich nedokonalé meranie),
- subjektívnosť odčítania z analógových prístrojov,
- obmedzená rozlišovacia schopnosť prístrojov,
- nepresnosť etalónov a referenčných materiálov,
-
nepresné hodnoty konštánt a iných parametrov získaných z externých zdrojov a používaných v algoritme spracovania údajov,
- linearizácia, aproximácia, interpolácia alebo extrapolácia pri vyhodnotení,
- zmeny pri opakovaných meraniach meranej veličiny pri očividne rovnakých podmienkach.
Niektoré zo zdrojov sa prejavujú výhradne či výraznejšie v neistotách vyhodnotených metódou typu A, iné pri použití metódy typu B. Mnohé zdroje ale môžu byť príčinou oboch skupín neistôt, a práve tu číha najväčšie úskalie v podobe opomenutia jednej zo zložiek, čo môže mať i veľmi výrazný skresľujúci účinok. Tieto zdroje nemusia byť vždy nezávislé.