sparse-dense by FoYo: ちょっと惹かれるPython１行コード（その２）

【what is this】前回に引き続き、短くて美しい１行コードを検討します。参考文献[1]を参考にしています。Pythonの初心者が中級へステップアップするのに適しています。小生もこれに該当しますので、個人的な忘備録でもあります。

■例題：漁獲高の平均を上回る漁港をリストアップする
　今回データ分析の対象とするデータ（参考文献[2]を参考とした）を以下に示します。Python numpy配列であるFHには、主要な漁港名９つを格納しています。そして、別のnumpy配列Vには、この漁港の順に、2014年〜2018年の５年間の漁獲高（水揚げ量）を万トン単位で格納してあります。

【解くべき問題】

　上記データ45件（=9漁港x5年）の平均値を一回でも超えた漁港を示すこと。

【解答プログラム】

　以下の１行コードが解答プログラム（出力込み）です！

答えは、"銚子"、"釧路"、"焼津"の３漁港でした。

■一行コードの分解 ...
　上記１行コードをすぐに理解できる人は少ないかもしれません。そこで、その中身を分解してみます。最後には、「なるほど、素晴らしい！」となるでしょう。

（１）平均値を求める

　これは下図のように、簡単です。

（２）平均値を超えるか否かを真偽配列で表す

　この真偽の配列は、下図のように生成することができます。numpyのbroadcastが働いています。

（３）"True"の位置のインデックスを求める

　上図の真偽配列において、'True'となる位置のインデックスを下図のように求めます。ここで、numpy関数nonzeroが使われていますが、'nonzero'は、Pythonでは、'True'に対応することに注意します。全45件のうち、13件が'nonzero'であり、その位置のインデックスは、下図のように２次元配列で表されます。

　例えば、上段の'0'と下段の'0'のペアは、銚子漁港の最初（2014年）のデータが、平均直を超えていることを意味します。また、釧路漁港（上段インデックス4）は、３回平均値を超えたことが分かります。