2022年2月21日月曜日

「で」の利用10例の係り受け解析とその利用

【what is this】先の記事では、「... で ...」の「で」が、どこに係るかを話題にしました。人間は違和感なく使っている場合でも、SuPar-UniDic [1]などの係り受け解析ではあまり適切な結果が得られない場合がありました。それをまとめて、係り受け解析を利用するアプリケーションでは、どのように対応するのかも、簡単に述べます。

「で」の利用10例の係り受け解析
 
以下に「で」の使い方10例を検討します。いずれも、日本人にとっては、恐らくほとんど違和感はないと思います。SuPar-UniDic[1]による係り受け解析結果を示します。「...で」の係り先は、(0)〜(6)は「咲く。」でしたが、(7)〜(9)は「丸い」という結果となりました。

(0)場所1:庭先で丸い花がまばらに咲く
(1)場所2:温室で丸い花がまばらに咲く。
(2)状況1:室温で丸い花がまばらに咲く。
(3)状況2:日陰で丸い花がまばらに咲く。
(4)理由1:暖気で丸い花がまばらに咲く。
(5)理由2:遮光で丸い花がまばらに咲く。
(6)時間1:7日で丸い花がまばらに咲く。
(7)特徴1:巨大で丸い花がまばらに咲く。
(8)特徴2:濃紺で丸い花がまばらに咲く。
(9)特徴3:黄色で丸い花がまばらに咲く。

 まず、場所、状況、理由、期間などを意味する「で」の使い方(0)〜(6)に対しては適切な結果です。そして、特徴を表す(7)〜(9)も一見妥当のように見えますが、先の記事に書いた通り、安岡孝一教授によると、以下のような係り受け解析の方が適切だろうとのことです。

(7')特徴1:巨大で丸いがまばらに咲く。
(8')特徴2:濃紺で丸いがまばらに咲く。
(9')特徴3:黄色で丸いがまばらに咲く。

 なぜなら、これらの「...で」が修飾するのは本来「花」だからです。しかし、この場合の「で」は解析上、曲者のようです。確かに、見た目にも、「巨大で花」「濃紺で花」「黄色で花」は違和感があります。

アプリケーション側での「で」の係り受け解析の利用
 
では、前報のアプリケーション等ではどのように利用したのでしようか。いくつか検討しましたが、結論として、上記の解析結果を素直に受け入れることにしました。すなわち、「巨大で丸い」「濃紺で丸い」「黄色で丸い」のように、複合語と考え、それが「花」に係るとして扱えば特に問題がないようです。

 一方、人間側がちょっと妥協して、コンピュータと共存するということであれば、次のように、(7)〜(9)にある「で」を「な」(単語によっては「の」)に変更するのが良いかもしれません。その場合は、以下のように、係り受け解析として適切な結果が得られ、アプリケーション側もハッピーではあります。

(7'')特徴1:巨大丸いがまばらに咲く。
(8'')特徴2:濃紺丸いがまばらに咲く。
(9'')特徴3:黄色丸いがまばらに咲く。

上記以外に「で」の用法をご存知でしたら教えて下さい
 ただし、「丸い花がまばらに咲く。」の先頭となり得るものをお願いします。

現代の英訳ソフトはどうだろう
 今回取り上げた10例文に対して、現代の英訳ソフトはどうでしょうか。英訳結果を見ただけの判断ですが、真面目に?係り受け解析はやっていなくて、別のこと(seq2seqやAttentions)で処理しているように見えます。(これについては、後日、また述べてみたいのですが...)

Google翻訳
(0) Round flowers bloom sparsely in the garden.
(1) Round flowers bloom sparsely in the greenhouse.
(2) Round flowers bloom sparsely at room temperature.
(3) Round flowers bloom sparsely in the shade.
(4) Warm and round flowers bloom sparsely.
(5) Round flowers bloom sparsely in the shade.
(6) Round flowers bloom sparsely in 7 days.
(7) Huge, round flowers bloom sparsely.
(8) Navy blue and round flowers bloom sparsely.
(9) Yellow, round flowers bloom sparsely.

 (4)はおかしいです。「暖気で」が正しく認識されていない。(8)は微妙?

DeepL翻訳
(0) Round flowers bloom sparsely in the garden.
(1) Round flowers bloom sparsely in the greenhouse.
(2) Round flowers bloom sparsely at room temperature.
(3) Round flowers bloom sparsely in shade.
(4) Round flowers bloom sparsely in warm air.
(5) Round flowers bloom sparsely in shade.
(6) Sparse round flowers in 7 days.
(7) Huge round flowers sparsely bloom.
(8) Dark blue, round flowers sparsely bloom.
(9) Yellow with sparse round flowers.

 (6)は少し、(9)は完全におかしい。「黄色で」がうまく扱えていない。また、(6) (9)とも「咲く」が訳ぬけしている。これがこの英訳方式の本質というか特徴でもある!?

参考資料
[1] yasuokaの日記: BERTモデルを用いた日本語係り受け解析ツールSuPar-UniDicリリースhttps://srad.jp/~yasuoka/journal/645402/

0 件のコメント:

コメントを投稿