ローレンツ曲線の意味と作り方

ローレンツ曲線とは、横軸に累積相対度数、縦軸にも累積相対度数を組み合わせて描いた折れ線グラフです。

ものごとの集中度合いや偏り、不均等さを示すときに使われます。たとえば、所得や資産がどのくらい不平等に分配されているのか、などです。

ローレンツ曲線の作成

世帯(2人以上)収入の分布状況をローレンツ曲線で作成し、見てみましょう。厚生労働省のサイトからデータを借りました。

こちらのデータをつかって、ローレンツ曲線を作成します。

累積相対度数(累積%)を表にする

世帯年収を、

  • 200万未満
  • 200~250万円
  • 250~300万円

・・・といったように区切って、その中に何世帯が含まれているかを見ます。ひと区切りのことを階級と呼びます。

階級のなかのデータ量のことを度数といって、全体の中での度数の割合のことを相対度数といいます。比率、%と同じことです。

累積相対度数は、その階級以下の相対度数を足し合わせていったものです。

たとえば、450万円から500万円の階級の度数は、425世帯で、相対度数は7.0%、それ以下を足し合わせた累積度数は、48.4%となっています。

エクセル散布図での作成

上記表のように各階級ごとに世帯数が分布しています。250万円~500万円あたりが多そうですね。

一方で、各階級ごとの年収合計(その階級の平均年収×世帯数となります)を見てみると、300万以下の階級だと少なく、300~700万あたりはそこそこの金額です。これがそれぞれの階級への配分になります。

階級別に見て、他の階級よりも世帯数が多く分布している割に、年収合計が少なかったり、他の階級よりも世帯数が少なく分布している割に、年収合計が多かったりといえます。そういった不均等さをグラフで示すために、

  • 横軸を「各階級の世帯数の累積相対度数(累積%)」
  • 縦軸を「各階級の年収合計の累積相対度数(累積%)」

として、エクセルで線付きの散布図を作成します。

縦軸と横軸のデータを指定します。

ローレンツ曲線の完成です。

ローレンツ曲線の見方と意味

ローレンツ曲線はカーブをした線、グラフ内に描かれた均等配分線はグラフの対角線です。

ローレンツ曲線と下からたどって、グラフ横軸、世帯数の累積%が40%のところで、縦軸の年収合計(平均年収×世帯数)の累積%を見ると20%程度になっています。これは、この年収の世帯が受け取っている配分が、少ないといえます。

年収というものが、あまねく全ての人々(世帯)に均等に分配されているのであれば、横軸の世帯数累積%が40%のところで、縦軸の世帯年収合計(平均年収×世帯数)の累積%も40%となるはずです。グラフ内の均等配分線のように線が引かれるはずです。

しかし、そうなっておらず、このグラフのようになっているということは、世帯数の残り60%のところに、収入額が配分されていることを意味しています。

ローレンツ曲線とグラフ対角線の均等配分線。この間は三日月の形になっています。ローレンツ曲線がグラフの対角線から離れて、三日月状の面積が大きいほど、データが不均等に分布していることを示します。

ローレンンツ曲線によって、収入の配分に偏りがあることを視覚的にとらえることができました。