AIには、学習データが不可欠です。地球上での似た画像はもちろん学習している筈ですが、実際に火星に行ってみると色々な違いがあるようです。すなわち、実際に火星で撮影した画像をたくさん学習(この辺は砂丘なのか、堅い土なのか、大きな岩なのかな等々)する必要があります。そのためには、人が画像をみて、領域毎に(砂か土か岩石かなどを示す)ラベルを付ける必要があります。しかし、学習すべき画像の数は膨大であるため、そのようなラベル付けをしてくれる人を求めています。以下のサイトにその説明があります。
AI4Mars
ユーザ登録すれば、誰でもすぐにこの作業(ボランティア)に参加できます。さっそくやってみました。下図のような画像が次々と表示されます。いくらでも好きなだけ作業できます。画像をよく見て、以下の4つのラベルを付ける区域を多角形で示してあげればよいのです。「教師付き(ラベル付き)学習」に使われるのですね。
●Sand:砂地(車輪が埋まるかもしれない)
●Soil:車輪が埋まらないような堅い土
●Bedrock:タイルを敷き詰めたような比較的平坦な岩
●Bigrocks:高さ30cmを越えるような大きな岩(あまり多くないが)
この画像について、私がラベル付けした結果が以下の図です。中央付近は砂地、その上下の領域は埋まらないような土、そして、左下隅は堅い平板な岩のように見えました。その結果を、ボタンを押してNASAヘ送信します。
(注)分かりやすさのため画像に文字を表示していますが、
実際には不要です。多角形を描く色で識別されます。
ここで、ちょっと心配になる人がいるかも知れません。「私のラベル付けが間違っていて、その結果、探査車が砂にはまったり、大きな岩石に衝突してしまったら責任を問われるのでは?」と。それはないです。膨大な数のボランティアがやっている筈ですから、少しくらい誤りがあっても、雑音として扱われ、問題ないはずです。AIの学習では、むしろ、一定の雑音が含まれている方が、適用性が高くなる(柔軟性が高まる)傾向があるからです。
この作業は、子供といっしょにやるのもいいと思います。AIとはどんな仕組みでやっているのかを知るきっかけになるでしょう。人間によるデータの準備の重要性も分かるはずです。
■ここで思い出したことが...
以下は古い(3年前)の記事ですが、Google機械翻訳に対する人手による改善ボランティア活動です。今回の火星探査車向けAIの場合と似ていませんか。
■さらに進めることもできそう...
この作業をやって行くうちに、もっと先をやりたくなるかも知れません。すなわち、ラベル付け作業で終わらず、このようなラベル付き画像を集めたら、自分でも独自にdeep learningできますね。それを基に、自分でおもちゃの火星探査車も動かせそうに思います。実際、こうして大勢のボランティアがラベル付けした画像は公開されるようです。すでに一部は使えるようになっているはずです。
0 件のコメント:
コメントを投稿