創屋ぷれす

SQuAD / NER / SWAG / GLUE

自然言語処理におけるタスクの例です。
タスクとは、自然言語処理の研究者の間で共有されている問題集のようなものだと私は認識しています。
AIにそのタスクのデータセットを学習させ、問題を解かせることでスコアが出ます。
研究者たちは、そのスコアを競い合っています。
自然言語処理といっても、「文章が同じ意味を持つか?」「質疑応答ができるか?」「正しい文章か?」など
多くの分野があり、それぞれがタスクとなっています。

表題のものでいうと、
GLUE:8種の言語理解タスク
SQuAD:質疑応答
SWAG:入力文に後続する文を4つの候補から選択
NER:固有表現抽出
になります。

ある自然言語処理AIが優秀だからといって、
どのタスクが強く、どのタスクが弱いということを把握しておかなければ、適切な運用はできないでしょう。

Comments are closed.