公開日:

データ分析における日付の扱いについて ~その1~

データ分析における日付の扱いについて ~その1~

11月になると、来年のカレンダーが気になり始めます。書店や文具店にカレンダーや手帳が並び始め、「来年のカレンダーはどれにしようか?」などと物色をしています。今年は、例年にない祝日が2日もありました。天皇即位の日(5/1)と即位礼正殿の儀(10/22)、しかも4月30日と5月2日は国民の祝日に! なんか凄く得した気分!な年でした。で、来年(2020年)のカレンダーを見てみると、例年と違うところがあります。2月24日(月) が天皇誕生日 (振替休日)です。7月24日(金)がスポーツの日 (体育の日)となり2020年に限って10月から7月に変更になってます。そう言えば、今年も来年も12月23日は祝日じゃないの? 昭和の日はあるのに平成の日はないんか??? というように、来年のカレンダーを見る時はいつも祝日からです。同時にいつも思うことは「何で2月は28日しかないんや!」(来年は29日ですけど)

データ分析をしていると、日付を扱うことがとても多いです。そして日付に悩まされることも多いです。一か月が30日だったり31日だったり、ましてや2月は28日だったり29日だったり。大の月(31日)と小の月(30日)が必ずしも交互にやって来るわけじゃない...月別の売上やサイトのアクセス数の推移をグラフや表にしたところで、そもそも月の日数が違うじゃん!平日と土日では、売上やアクセス数の傾向が違うのに、一か月の土日の数もまちまち!(通常は8日か9日だが、2019年の場合3月と6月は土日が10日もある) 何だかとっても扱い難いと思いませんか? そもそもカレンダーというものは、何でこんなに不規則になってるんでしょうかね?

そんな疑問が湧いてきて色々調べてみると、面白いことがたくさん見つかってきました。二回に分けて、『データ分析における日付の扱い』についてお話したいと思いますが、前半は、なぜカレンダーがこんなに複雑になっているのか?を探ってみましょう。

カレンダーの歴史

グレゴリウス13世

グレゴリオ暦
現在使われているカレンダーは、グレゴリオ暦というもので、ローマ教皇グレゴリウス13世の指揮で1582年に制定されたものです。グレゴリオ暦は、それ以前のユリウス暦を改定したもので、何を改定したかと言うと、ユリウス暦のズレを変えたものです(閏年の数を400年に100回から400年に97回に変えた)。

ユリウス・カエサル

ユリウス暦
ユリウス暦はというと、紀元前45年、ユリウス・カエサル(ジュリアス・シーザー)によって制定された暦です。一年を平年は365日とし4年毎に閏日を設けて366日とする暦が制定されました。そして、紀元7年に皇帝アウグストゥスによって一年を 12か月とし各月の日数が決められたそうです。なぜ各月の日数がそうなったかは様々な説があるようですが、それ以前のローマ暦の月の日数を継承している説が有力なようです。

ローマ(ロムルス)暦
ユリウス暦の前に使われていたのはローマ暦で紀元前753年に制定されました。ローマ暦は今で言う3月~12月の10ヶ月しかなく、一年は 304日でその後の61日間は日付が有りませんでした。目的が農耕作業のためだったので、収穫のない時期は暦がなかったのです。一年がいつから始まるかも国王が春めいてきたら新年を宣言するというアバウトな暦だったようです。その後、ヌマ暦が紀元前713年に登場しています。ヌマ暦はローマ暦に2か月足して12か月制を採用しました。一年を355日とし、二年に一回 2月を23日にして閏月(22日)を設けて太陽暦に近づけるという方法をとっていました。閏月は一年の最後である2月の後に設けられていました。この慣習を継承して、ユリウス暦でも日数の調整が一年最後である2月に行われ、閏日も2月に設けられるようになったわけです。だから2月は平年が28日となり、閏年が29日となりました。

話がだんだん本題とそれてきてしまいましたが、私たちが現在使っているカレンダーはローマ時代の暦を継承しているわけです。一年が365日で12か月になったのも、閏年、大の月や小の月の順番が決まったのも、2月が28日に決まったのも、2000年以上前、紀元前の話なのです。 カレンダーは、長い歴史の中で、政治や宗教の影響を受けて様々な操作が組み込まれ出来上がっているので、明確な法則性のない仕組みになってしまっているのです。

現在のカレンダーが紀元前からあったものだと知って驚きが隠せません(日本はまだ弥生時代の頃の話です)。 これだけ科学や天文学、コンピュータシステムが発達し、AI(人工知能)時代の到来と言われている現代に、ローマ時代と基本的に変わらなカレンダーを使っていることに、私は少々違和感を感じてきました。

「もっと現代にマッチしたカレンダーがあるんじゃなかろうか?」


ということで、次回はもっと現代にあったカレンダーを考えてみたいと思います。(つづく)

この記事を書いた人:
森田浩彰
BIエンジニア・Tableau画伯
東京生まれ。趣味はトライアスロン。フルマラソンベストタイムは3時間8分。 (株)ナイキジャパン Sales Operations、ジョンソン・エンド・ジョンソン(株) Sales Planning、(株)アダストリア 情報システム部を経て、現在は(株)クリーク・アンド・リバー社 デジタルマーケティンググループにてBIエンジニアとして活躍。 『データ活用で世の中を良くする』ことを信条としている。