サステンラボ

サステンラボあなたにやさしい資産運用メディア

| あなたにやさしい資産運用メディア

COLUMN | 2022.5.17

標準偏差とリスク

標準偏差とは、どのくらいデータがばらついているかを表す指標です。金融の世界で「リスク」と言うと、金融資産の収益率の標準偏差を指すことが多いです。「期待値」の記事では、期待値の考え方をご紹介しました。例えば投資判断においては、期待値だけではなく、リスク(標準偏差)を考慮することも必要です。具体例を交えながら、標準偏差の計算方法や具体的な活用例をご紹介します。 

データのばらつきを考える

A~Eの5人が数学と英語のテストを受けた結果、表のようになったとします。数学と英語では、点数のばらつき度合が大きいのはどちらの教科でしょうか。 

点数ABCDE合計平均点
数学656970727435070
英語456070809535070
数学と英語それぞれの5人の点数

それぞれのテストの平均点は同じ70点ですが、5人の点数のばらつき度合が異なります。数学は5人とも平均点に近い70点前後の点数ですが、英語については40点台の人や90点台の人もいます。このように見ると、数学よりも英語の方が点数のばらつきが大きいと考えることができます。 

標準偏差

標準偏差の計算

上でご紹介したような、データのばらつき度合を数値で表したものを、統計の世界で標準偏差といいます。ここでは、順を追って標準偏差を計算してみます。 

具体的な計算手順は、(1) 偏差を計算、(2) 偏差の2乗を計算、(3) 分散を計算、(4) 標準偏差を計算、となります。 

数学ABCDE合計平均
点数656970727435070
(1) 偏差
(点数-平均点)
65-70
= -5
69-70
= -1
70-70
= 0
72-70
= 2
74-70
= 4
00
(2) 偏差の2乗
(偏差×偏差)
251041646(3) 分散
46/5 = 9.2
(4) 標準偏差
\(\sqrt{9.2}≒3.0\)
数学の標準偏差の計算手順

(1) 偏差の計算

各5人の点数が、平均からどのくらい離れているのかを計算します(点数-平均点)。これを偏差と言います。直感的には、この偏差を上手く足し合わせていけば、点数の全体的なばらつき具合が表現できそうです。しかし、5人の偏差を単純に合計すると0になってしまいます。

5人の数学の点数と、平均からの乖離(偏差)

(2) 偏差の2乗(偏差×偏差)を計算

そこで、偏差を2乗した(これによりマイナスの符号を消した)後に、それらを合計していきます。

$$25 + 1 + 0 + 4 + 16 = 46$$

偏差の2乗は、偏差と比べると数字の大きさが変わりますが、合計が0になることを避けることができます。 

(3) 分散を計算

次に、「(2)偏差の2乗」の平均値を計算します。これは、分散と呼ばれます。「偏差の2乗」の合計を、人数で割ることで計算できます。

$$46 / 5 = 9.2$$

これにより、ばらつき度合(に近いもの)の一人当たり平均値が計算できました。 

(4) 標準偏差を計算

最後に、標準偏差は、分散のルート(√; 平方根)を取ることで計算できます。逆に言うと、分散は、標準偏差の2乗です。 

さきほど、分散を計算するときに「偏差」を2乗しましたが、これにより数字の大きさ(単位)が変わりました。ここで「2乗」の逆の計算である「√」の計算を行うことで、分散の単位(点×点)を元データの単位(点)に揃えることができます。 分散は、(2)の計算で9.2となったので、標準偏差は

$$\sqrt{9.2}≒3.0$$

よって、数学の点数の標準偏差(ばらつき度合)は、3.0点となります。標準偏差は、元データと単位が同じになるので、元データと同じ尺度でばらつき度合を表すことができます。 

※上記の数学の点数の例では、偏差の単位が「点」、分散の単位が「点×点」、標準偏差の単位が「点」となります。

また、英語の点数の標準偏差を計算すると、17.0点となります。 

英語ABCDE合計平均
点数456070809535070
(1) 偏差
(点数-平均点)
-25-100102500
(2) 偏差の2乗
(偏差×偏差)
62510001006251,450(3) 分散
1,450/5 = 290
(4) 標準偏差
\(\sqrt{290}≒17.0\)
英語の標準偏差の計算手順

数学、英語の点数の標準偏差が、それぞれ3.0点、17.0点となるので、英語の点数のばらつきの方が大きいことが分かりました。 

このように、標準偏差が大き(小さ)ければ、データの分布のばらつきが大きい(小さい)ということになります。 

標準偏差の性質

ここまでで、標準偏差の計算方法をご紹介しました。標準偏差はデータのばらつき度合を表していますが、標準偏差の値にはどのような性質があるのでしょうか。 

データ(点数)の分布が正規分布だと仮定すると、平均±標準偏差の間(平均から標準偏差1個分以内)におさまっている人が全体の約68.3%いるということを表します。正規分布を簡単に言うと、平均付近のデータ数が最も多く、平均から離れるほどデータ数が少なくなるような、山なりの分布のことです。 

μ=平均、σ=標準偏差を表す

例えば、100人がテストを受け、平均点が65点、標準偏差が8点になったとします。この場合、
 平均点+標準偏差 = 65+8 = 73
 平均点-標準偏差 = 65-8 = 57
なので、57点~73点の間の点数を取っている人が、約68人(≒100人×68.3%)いる、という意味になります。
あくまでも正規分布を仮定しているので、実際の100人の点数の分布によっては、57点~73点を取得した人数が68人前後とはならない可能性も十分あり得ます。

ここで、正規分布を仮定した場合、標準偏差の有名な性質として、 

 全体の約68.3%が、平均±標準偏差の間(平均の1標準偏差以内)に存在する
 全体の約95.5%が、平均±2×標準偏差の間(平均の2標準偏差以内)に存在する
 全体の約99.7%が、平均±3×標準偏差の間(平均の3標準偏差以内)に存在する

というものがあります。  

μ=平均、σ=標準偏差を表す

この性質を利用すると、平均から標準偏差の何個分離れているのかが分かれば、データ全体の中で約何%以内に入るのかが分かります。 

標準偏差の活用例

Zスコアと偏差値

平均から標準偏差の何個分離れた位置にいるか、を表す数字をZスコア(またはZ値)と言います。 

例えば、先ほどのテストの例(平均点が65点、標準偏差が8点)で、Xさんが81点、Yさんが53点を取ったとします。二人はそれぞれ平均点から標準偏差の何個分離れた位置にいるでしょうか。 

XさんとYさんの偏差(平均点からの乖離)は、81-65 =16点、53-65 = -12点なので、 

 XさんのZスコア = 偏差/標準偏差 = 16/8 = 2.0 (個分)
 YさんのZスコア = 偏差/標準偏差 = -12/8 = -1.5 (個分)
となり、
 XさんのZスコアは2.0なので、Xさんは平均から標準偏差の2.0個分上の位置にいる
 YさんのZスコアは-1.5なので、Yさんは平均から標準偏差の1.5個分下の位置にいる

ということが分かります。

専門的に表現すると、Zスコアは、元データ全体の平均が0、標準偏差が1になるように、各データを標準化した値です。Zスコアを計算することで、平均や標準偏差が異なるデータ同士を比較できるようになります。 Zスコアを用いた例としては、偏差値が挙げられます。模擬試験や入学試験などでよく耳にする言葉かと思います。偏差値を用いることで、平均点や標準偏差の異なるテスト(難易度の異なるテスト)であっても、受験者に対する自分の相対的な実力を把握できるようになります。 

偏差値は、平均点が50点、標準偏差が10点になるように、受験生一人ひとりの得点を変換した数字です。Zスコアが、平均(50点)から標準偏差(10点)の何個分離れた位置にいるかを表す、ということを考えると、 

$$偏差値 = Zスコア×10+50$$

で計算できます。Xさん、YさんのZスコアはそれぞれ2.0, -1.5だったので、 

 Xさんの偏差値 = 2.0×10 + 50 = 70
 Yさんの偏差値 = -1.5×10 + 50 = 35

偏差値の分布:平均点が50点、標準偏差が10点の正規分布

平均点を取った人の偏差値は50となり、平均点よりも上回った(下回った)点数を取った人は、偏差値は50よりも上(下)となります。 

Zスコア偏差値上位何%か受験生が1,000人の場合
2.5750.6%6位付近
2702.3%23位付近
1.5656.7%67位付近
16015.9%159位付近
0.55530.9%300位付近
05050.0%500位付近
-0.54569.1%691位付近
-14084.1%841位付近
-1.53593.3%933位付近
-23097.7%977位付近
-2.52599.4%994位付近
Zスコアと偏差値の関係。Zスコア = (点数-平均点)/標準偏差。偏差値 = Zスコア×10+50。

金融資産のリスク

標準偏差はデータのばらつき度合を表しますが、金融ではリスクを把握する際に、よく標準偏差を計算します。金融の世界でリスクというと、リターン(金融資産の収益率)のばらつき度合や、リターンの不確実性の大きさを表すことが多いです。 

価格変動が大きい資産やリターンのばらつきが大きい資産は、リスクの高い資産とみなされ、その逆であればリスクの低い資産とみなされます。 

低リスク資産と高リスク資産

下のような資産Aと資産Bを考えます。過去5年のリターンが表のようになりました。

12345平均標準偏差平均
±1標準偏差
平均
±2標準偏差
資産A15%-10%20%-15%10%4.0%13.9%-9.9%~+17.9%-23.9%~+31.9%
資産B7%-3%5%-2%4%2.2%4.0%-1.8%~+6.2%-5.7%~+10.1%
資産Aと資産Bの過去5年リターンの、平均と標準偏差

さきほどの標準偏差の意味をここで当てはめると、 

 資産A:約68.4%(約95.5%)の確率で、リターンが -9.9% ~ +17.9%(-23.9% ~ +31.9%)におさまる
 資産B:約68.4%(約95.5%)の確率で、リターンが -1.8% ~ +6.2%(-5.7% ~ +10.1%)におさまる

この場合、リターンの出方の不確実性(リスク)が大きいのは、標準偏差の大きい資産Aであることが分かります。 

まとめ

 1. 標準偏差は、データのばらつき度合を表す数値である
 2. 標準偏差が大きい(小さい)ほど、データのばらつき度合が大きい(小さい)
 3. 標準偏差は、偏差値の計算や、金融におけるリスクの計算で使われる

(ご参考)数式での表現

\(\mu\)を平均、\(\sigma\)を標準偏差、\(n\)をデータ数、\(x_i\)を\(i\)番目のデータとすると、各値は以下のように計算できます。

 平均:\(\mu = \frac{1}{n}\sum_{i=1}^{n}x_i\)
      \(= \frac{1}{n}(x_1+x_2+…+x_n)\)

 偏差:\(x_i-\mu\)

 分散:\(\sigma^2=\frac{1}{n}\sum_{i=1}^{n}(x_i-\mu)^2\)
      \(=\frac{1}{n}\{(x_1-\mu)^2 + (x_2-\mu)^2 +…+ (x_n-\mu)^2\}\)

 標準偏差:\(\sigma=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(x_i-\mu)^2}\)
       \(=\sqrt{\frac{1}{n}\{(x_1-\mu)^2+(x_2-\mu)^2+…+(x_n-\mu)^2\}}\)

 Zスコア:\(Z=\frac{x_i-\mu}{\sigma}\)

 偏差値:\(Z×10+50 = \frac{x_i-\mu}{\sigma}×10+50\)