2019年8月19日月曜日

Google Lensによるリアルタイム画像認識

 先の記事は、Google Photoに格納された画像のGoogle Lensによる認識に関するものでした。実は、スマホのカメラで撮影して、リアルタイムにその画像を認識することもできます。(ただし、AndroidかiOSか、またOSのバージョンや搭載カメラによっても違いがあるようです。)

 猛暑が続いている毎日ですが、ふと見ると、ベランダにセミが舞い降りていました。早速スマホで撮影して、Google Lensでリアルタイムにそのセミの名前を得ることができました。下図の左側がそれです。「アブラゼミ」に違いありません。

 と思っていたら、そのセミが勝手にでんぐり返って動けなくなってしまいました。その仰向けの状態を撮影して、再度リアルタイム判定しました。 右側の図のとおり、結果はさきほどと同じく、「 アブラゼミ」でした。


 Google Lensは、あらゆる画像を大量に学習しているようです。向きや背景などによらずに認識できる頑強さがあります。ある物について詳しく調べようとする場合、まずその名前が分かることは重要です。名前が分かれば、さらに詳しい情報を検索する手段は色々あるからです。

【補足】
 これまで、画像からの植物の名前の特定と、セミの種類の特定をやってみました。最後に、写真の風景(撮影場所)は的確に判定できるかを試して見ました。結論としては、実に見事というほかありません。以下の例は、以前訪問したことのある、ボストン市内とMIT構内、ビクトリア(カナダ)、および、ある国内大学ですが、実際の写真の一部を切り取ってコピーして新たな画像としたものをGoogle Lensへ与えています。すなわち、GPSの位置情報などは含まれていません。しかし、判定結果はとても的確です。

 





 こうなると止まりません!もう一つやって見ます。MITメディアラボに展示されていたSaymour Papert(1970年代)によるLogo Turtleです。これは、Computational Thinking教育の象徴、原点とも言えるデバイスです。その写真をGoogle Lensに調べさせてみました。小さな説明パネルも写っていたのですが、テキスト情報によらずに画像だけで解析してもらうため、ここでは意図的にそれを除外して入力しました。

 以下の図のとおり、解析結果として候補はいくつか表示されたのですが、その中に、このLogo Turtleが2件見つかりました!2件とも、MITメディアラボの展示を撮影したものと思われます。



 この例のように、「半透明プラスチックの中に車輪のあるこの装置は何か?」を調べるのに、まず、Google Lensでいくつかの候補を得て、「多分これじゃなか!」と思える画像をクリックすることで、さらに詳細な情報へ行き着くことができます。

 小学生がいる場合、「もう夏休みの宿題は済みましたか?」

0 件のコメント:

コメントを投稿