昨日のNHKテレビによれば、京都の北山隼君(小学3年生)が夏休みの自由研究で、多数のセミの抜け殻を収集していて、そのうちの15%が、恐らくこの猛暑のために羽化できずに死んだことを明らかにしたという。北山君が集めたセミの抜け殻はすでに数千個に達するそうである。
セミの抜け殻の例
https://ja.wikipedia.org/wiki/セミ
私が 感じたのは、数千個もセミの抜け殻があるとすれば、これはDeep Learningによる画像認識(画像識別)の対象として非常に適しているのではないか!ということでした。非常に貴重な実データなのである!日本のセミは、ニイニイゼミ、クマゼミ、ツクツクホウシなど数種類のはずであるので、雄雌の区別をするとしても、数千個の抜け殻を、10種類程度に分類することになるからである。(実際には5,000個もあるそうなので、500個を学習データにして学習させ、残り4,500個をテスト(評価)データとして分類する。)
先の記事では、数種類のコインの分類を、(コーディング無しで)分類することをやってみた。そのために、Machine Learning for Kidsというwebサイトを使った。もしも、学校の先生がこれを利用して適切に指導できれば、小学生でもDeep Learningの世界に触れて、さらに素晴らしい自由研究につなげられるのではなかろうか。
北山君は、NHKの取材記者の求めに応じて、抜け殻を手にとって裏返し、「これは、クマゼミの雄」などと応えていた。抜け殻のお尻の微妙な形の違いで雄雌が分かるという。Deep Learningではそのような特徴は人間が与えなくてもよい。北山君の判定とDeep Learningの認識にどのような差が出るかも興味がありますね。
まもなく、小学校ではプログラミングが必修になるという。必ずしも直接的にプログラミングにタッチしない場合でも、このようなITと理科を結びつけることが重要になってくるように思われる。