2020年9月8日火曜日

国立国語研究所「言語資源活用ワークショップ2020」(その2)

この記事は、前回記事の続きです。
国立国語研究所「言語資源活用ワークショップ2020」(その1)

以下は、ここでの小生のポスターWeb発表に対する質疑応答を記録したものです。(ご討論戴いた方のお名前は匿名化させていただきました。)デフォルトでは、SLACKのチャット機能を利用した討論形式です。希望者は、自分でzoomの部屋を立ち上げればリアルタイム映像で討論可能ですが、小生はSLACKだけにしました。ご参加戴いた方々、特にご討論戴いた方々に感謝申し上げます。

■ポスター発表 質疑応答状況(2020-9-8  15:00-15:50)
■本ポスターセッションの発表数 = 10件、セッションログイン数 = 318名
----------------------------------------------------------------
P2-5 植物に関する自由形式説明文からのJSON形式テキストの自動生成
発表者:山本 富士男(神奈川工科大)
----------------------------------------------------------------

■Fujio Yamamoto  2:31 PM
こんにちは、みなさま
ご質問ご意見等ございましたら、よろしくお願い致します。

■AAA氏  3:03 PM
京大のAAAと申します.興味深く拝見しました.こちらの JSON のタグとして type, what, how を設定されていますが,この value に入るものが重複しているのが気になりました.このサンプルではナツメの leaf の how は “楕円形で” となっておりますが,fruit の what にも “楕円形の” と類似した表現が生起していますが,これは設計通りのものなのでしょうか?

■Fujio Yamamoto  3:08 PM
気にしていた点をご質問いただき、ありがとうございます。確かに、現在のバージョンでは、例えば、花の色に関しては、「白い花」ならば、白はwhatに入りますが、「白く咲く」だとhowに入ってしまいます。そうすると、「白い花」の検索を、howとwhatの両方見る必要があり、不便です。改善を考えています。 

■BBB氏  3:24 PM
国語研のBBBです。今回、対象を植物とされたのは、どのような理由によるのでしょうか。例えば植物は動物にくらべると処理しやすいというようなことがあるのでしょうか。

■Fujio Yamamoto  3:29 PM
ご指摘ありがとうございます。今回、動物ではなく植物にしたという特別な理由はありません。きっかけは、予稿集の参考文献に挙げてあります、「デジタル植物写真集」の自由形式記述から、植物の特性を指定した柔軟な検索を行いたい、ということから始まりました。一定の検討は必要と思いますが、動物や観光地などの検索にも適用できるかも知れません。 

■BBB氏   3:31 PM
ありがとうございました。高い精度で自動抽出が可能になれば、大変有益だろうと思いました。

■Fujio Yamamoto 3:34 PM
重ねてありがとうございます。
今回は、type、what、howという大まかな特性の抽出に留まっています。それはそれで有利な面もありますが、特性の分解能をもう少し高くして、精密化を図れないか検討したいと思います。

==================================
感想:
この分野(コーパス言語学や言語資源研究)では全くの素人である小生ですが、情報系との接点である「自然言語処理」の応用という観点から参加させていただきました。初めてのWEB開催ということで、主催者側の準備も大変だったと思いますが、良い雰囲気で参加者と発表者の交流ができたと思います。来年は、恐らく世の中も落ち着いて、国語研究所現地での開催となることを期待し、小生もそれまでに少しでも新たな進展を達成して、また発表に望みたいと考えます。

クロージングでの、主催者側のまとめによりますと、下図のとおり、37件の発表の多くは言語学・日本語学に属するものでした。小生の発表は6件ある自然言語処理のひとつになっているはずです。恐らく、今後、自然言語処理も増加する方向ではないかと思います。

0 件のコメント:

コメントを投稿