2_2_正確さ

「molと聞いて頭痛を起こす人たちのための化学+」シリーズ-2
【正確さ】
 工業化学科に入って毒性の次に出てきたのが”正確さ”でした。この授業で上皿天秤を扱ったのは私の世代が最後だと思います。私が大学院に進んだ後で学生実験でデジタルの電子天秤を使うようになりました。他の大学も同じようなものだと思います。
 なぜこんな古臭い話を持ち出したかと言うと、誤差の話をする際幾分便利だからです。
注釈:今回は正確さの話をしますが、分析化学の測定に於けるそれについては書いていきます。従って、数学・社会学・医学などのそれと比べて書くことがかなり単純です。


1-1.測定に於ける誤差
 上皿天秤をご存じない方はいらっしゃらないと思いますが、大雑把に説明しますとシーソーの片方に目的の物体と反対側に重量の分かっている分銅を載せ、棒を水平にすることにより質量を測定する道具です。一方で電子天秤は圧電素子に重量がかかることでそれに応じた量の電子が流れ、それを測定することで重量を測定します。
 この二つには様々な違いがありますが、今回注目するのは数値の表示です。電子天秤はデジタルなのでそのまま数字が表示されますが、上皿天秤はそんな表示はありません。上皿天秤はある程度重量が揃うと左右に同じ幅で振れます。この時、真っ直ぐ中央の目盛りを指していれば大きな問題はありませんが、毎回そこまで厳密に分銅や対象の物質を測り取るのはかなり難しいです。従って、振れ方からどの辺に振れの中央が来るかを目視で読み取ることになります。これはどういうことかと言いますと人によって幾分読み取りの差が出てしまう可能性があるということです。これを個人誤差と呼びます。
 こう書くと電子天秤の方が正しいように感じるかも知れませんが、そうとは限りません。その天秤が置いてある標高によって重力が僅かに異なます。即ち、圧電素子にかかる重量が変化するという事です。上皿天秤の場合は左右を拮抗させて測定するので重力の違いの影響を受けず、その分銅と同じ測定値です。これは場所による誤差が少ないということです。この環境による誤差は偶然誤差と呼びます。
 他にも道具の個体差である機器誤差などもありますが、ここで覚えておいて欲しい事はそこではなく、誤差はどこにでもあって完全になくすのは非常に困難であるということです。
 誤差はなくならないとので、今度は誤差をどう扱うかということが重要になってきます。
 先程の上皿天秤の振れの中央を読む場合に誤差が影響するのは測定する数値の一番小さい位です。従って、この位は一番あてにならない値とみなします。例えば0.1mgまで測定できるのであれば0.1mgの位を四捨五入し1mg単位までを測定値として扱います。
 これを上皿天秤を使って学習すると実感として理解できますが、電子天秤の場合は装置の内部で計算してしまうので分かり難いと思います。ただ、だからと言って上皿天秤を用意するのも大変ですし、当時の計算を覚えても使う機会もありません。ここら辺はそういう世界を経て今があるのだと理解すれば良いと思います。


1-2.ノイズ
 ついでにノイズの話もしておきましょう。ノイズもあてにならない値の一つです。
 ノイズは至る所にあります。例えば部屋の騒音を調べる場合を考えてみましょう。部屋で様々な振動を測定しますが、日常的な風の音や道路の足音なども信号として入ります。電気を使う測定機器の場合、近くの電流によって起きる電磁波も信号として受け取ってしまいます。これらのずっと起こっている微々たる信号を全て測定すべき信号として捉えるでしょうか。
 これは非常に難しい話で、そういった微小な信号までも測定しようとすると測定機器がどの範囲を測定できるのかが問題になります。弱い信号を測定する機器は大方強い信号は振り切れてしまって測定できません。強い信号を調べようとすれば弱い信号は無視されます。また、先程の音や光であればヒトが感知できる波長だけで良いのかと言った問題もあります。
 従って、目的に合わせて適正な測定範囲(測定感度)を設定しなければなりません。その上で非常に弱い信号やどうしても取り除けない無駄な信号は背景(バックグラウンド)として無視します。
 ではノイズとするかどうか判断に迷うほどの弱い信号が出た場合はどうすれば良いでしょうか。
 これを判定するための考え方がS/N(SN比、信号雑音比、signal-noise ratio)です。検出された信号を分子に、バックグラウンドのノイズの信号の強さ分母として計算し、小さい場合はその信号を無視します。ここで覚える必要はありませんが、分析化学に於いてはS/N≦3はバックグラウンドとして無視することが多いです。
 こういった問題から、できるだけ無駄な信号を出さないことやバックグラウンドを安定させることが非常に重要になってきます。従って、測定に於いてはその系に与える影響は極力減らさなければならないと言う鉄則があります。簡単に言えば測定対象に無暗に触らないという事です。
 例としてビーカー中の水温の時間による変化を測る場合を考えてみましょう。温度計が水の熱を奪ったり逆に水に熱を与えるのでそれだけ測定する温度が変わります。そのため温度計を入れた直後のバックグラウンドが乱れます。これをなるべく小さくしたいので、例えば大きいビーカーを使って水量を増やせば相対的に熱の移動量は減り、バックグラウンドは変わり難くなります。


2.測定結果の正確さ
 これまでは測定する際の正確さの話でした。ここからは測定結果の正確さを説明していきます。
先ずは用語の説明から。

真値:正しい値。本来測定されるべき値。ただし、実際は誤差が発生するため計算上の値。
正確度(accuracy):測定値と真値との近さ。ここまで用いた「正確さ」は本来これを指す。
精密度(precision):測定値のばらつきの小ささ。「精度」とも言う。

 これらは分野によって微妙に違いがあるので注意してください。私が書いたものは化学ですが、機械では肌感覚として正確度(化学)+精密度(化学)を指していると聞いたことがあります。
 さて話を戻して測定結果の正確さをグラフで表すと以下のようになります。

図.2 真値と測定値

複数回測定していると測定値の集合は正規分布をとるようになります。
 正確度は真値と測定値の近さなので、実線の測定値(測定値1)は点線の測定値(測定値2)と比べてより正確度が良いと言えます。また、精密度は分布のばらつき(広がり)なので、実線の測定値は破線の測定値と比べてより精密度が良いと言えます。
 分析機器を用いる際は標準試料(STD、standard sample)と言う既に真値が分かっている物質を使ってそのずれ(誤差)を確認し、補正をかけます。これを校正と言います。校正のやり方は機器それぞれで異なるし、本格的に必要であれば製造元とのやり取りした上で更に専門書を読む必要があるので説明しません。


3.データのばらつき
 最後にデータのばらつきについて説明します。先程の精密度に関する内容です。ただし、本稿は化学が嫌いだった方々を対象としているので詳細な計算式までは説明せず、どう考えるかと言う触りだけ紹介します。詳細をお望みであれば数学の教科書や専門書を読むことをお勧めします。
 先ず専門用語の説明です。

平均値(average):データの集団の中間的な値。
 平均値=全てのデータの合計値をデータの総数で割ったもの
分散(variance):データのばらつき具合を表す値。
 分散= 全てのデータと平均値の差の2乗の合計を平均値で割ったもの
標準偏差(SD、standard deviation):データのばらつき具合を表す値。「σ」で表す。
 標準偏差=分散の平方根
偏差値:平均値を50、標準偏差を10に直した(標準化と言う)値。
 偏差値=点数と平均値の差の10倍を標準偏差で割って50足す

 この標準偏差σが大きいとばらつきが大きいということです。分析化学に於いてはσが事前に設定した値より大きい場合は平均値から一番離れたデータを間違った値(外れ値と言う)として除外して計算し直すことがあります。
 偏差値は分析化学で使うことはありませんが、受験でお馴染みなのでおまけとして書きました。
 さて、ここで質問ですが、分散図(グラフ)に直線と数式が入ったものを見たことがあるでしょうか。例となるグラフを以下に挙げます。

図.3 散布図と最小二乗法

 これは散布図(分布図)と言われるグラフで、それぞれのデータがXとYの2つの項目を持っており、それらを縦軸(Y軸)と横軸(X軸)に取ったものです。このデータはXとYが何らかの関係を持つ可能性があると見られ、その関係式が右上に書かれています。ここではYはXの関数なのでf(x)と表記されています。
この数式はこれらの分布をおおよその計算で表しているので近似式と言われ、最小二乗法と言われる方法で導き出されています。
 この最小二乗法はそれぞれの点からこの近似式に縦軸と平行な直線を下ろし、その直線の長さの2乗の合計が最も小さくなるように計算されています。つまり、前述の分散が使われているということです。近似式の下のR2はその近似式がどれほど合理的であるかを示しており、1に近い程良い近似が取れていると言えます。
 これは基本的にグラフ作成用アプリケーションに計算させるので数学を専門とするのでなければ中身を詳しく知る必要はありませんが、そういった便利なものがあるのだということは覚えておいてください。


 さて、専門の方には怒られるような上っ面の話ばかりしてきましたが、データは最低でもここで説明したような考え方を以て取り扱われています。全部覚えろとは言いませんが、何の理由もなく数字をこねくり回しているわけではないと理解していただければ幸いです。

この記事が気に入ったらサポートをしてみませんか?