ローレンツ曲線とは、横軸に累積相対度数、縦軸にも累積相対度数を組み合わせて描いた折れ線グラフです。
ものごとの集中度合いや偏り、不均等さを示すときに使われます。たとえば、所得や資産がどのくらい不平等に分配されているのか、などです。
グラフ内の対角線に対して、ローレンツ曲線は三日月の形になっていますね。これがデータが不均等に分布していることを示しています。
それでは、ローレンツ曲線はどのように作成するか、またローレンツ曲線の意味や見方について説明していきます。
ローレンツ曲線の作成
世帯(2人以上)収入の分布状況をローレンツ曲線で作成し、見てみましょう。厚生労働省のサイトからデータを借りました。
世帯年収を50万円で区切り、それぞれの年収区間での世帯数と年収のデータから、年収の偏り、不均等さをローレンツ曲線で示してみます。
こちらのデータをつかって、ローレンツ曲線を作成します。
累積相対度数(累積%)を表にする
世帯年収を50万円で区切り、それぞれの区画のなかの世帯数、また年収合計(平均年収×世帯数)を表にします。
年収800万円以上では、100万円、250万円で区切って区画をつくっています。
世帯年収を、
- 200万未満
- 200~250万円
- 250~300万円
・・・といったように区切って、その中に何世帯が含まれているかを見ます。ひと区切りのことを階級と呼びます。
階級のなかのデータ数量のことを度数といって、全体の中での度数の割合のことを相対度数といいます。比率、%と同じことです。
累積相対度数は、その階級以下の相対度数を足し合わせたものです。
たとえば、450万円から500万円の階級の度数は、425世帯で、相対度数は7.0%です。それ以下の相対度数を足し合わせた累積相対度数は、48.4%となっています。
エクセルの散布図でグラフを作成する
上記表で、各階級ごとに世帯数の分布を見ると、250万円~500万円の階級に多いですね。
一方で、各階級ごとの年収合計(その階級の平均年収×世帯数となります)を見てみると、300万以下の階級だと少なく、300~700万あたりはそこそこの金額です。これがそれぞれの階級への配分になります。
階級別に見て、他の階級よりも世帯数が多く分布している割に、年収合計が少ない階級もあれば、他の階級よりも世帯数が少なく分布している割に、年収合計が多い階級もあります。
これは、不均等であるということです。年収が均等に配分されているのであれば、そのようなことはないですよね。
そういった不均等さをグラフで示すために、
- 横軸を「各階級の世帯数の累積相対度数(累積%)」
- 縦軸を「各階級の年収合計の累積相対度数(累積%)」
として、エクセルで線付きの散布図を作成します。
ローレンツ曲線の完成です。
ローレンツ曲線の見方と意味
ローレンツ曲線はカーブをした線です。グラフ内の対角線が均等配分線です。
ローレンツ曲線を下からたどっていくと、グラフ横軸で世帯数の累積相対度数%が40%のところで、縦軸の年収合計(平均年収×世帯数)の累積相対度数%を見ると20%程度になっています。これは、40%の世帯が受け取っている年収の配分は20%であることなります。
仮に、年収というものが、あまねく全ての人々(世帯)に均等に分配されているのであれば、横軸の世帯数の累積相対度数%が40%のところで、縦軸の世帯年収合計(平均年収×世帯数)の累積相対度数%も40%となるはずです。つまり、ローレンツ曲線は、グラフ内の均等配分線のように線が引かれるはずです。
しかし、そうなっておらず、上のグラフのようにカーブしているということは、不均等さがあることを示しています。
ローレンツ曲線とグラフ対角線の均等配分線。この間は三日月の形になっていますね。ローレンツ曲線がグラフの対角線から離れて、三日月状の面積が大きくなるほど、データが不均等に分布していることを意味します。
ローレンンツ曲線によって、収入の配分に偏りがあることを視覚的にとらえることができました。