一句话描述:多任务 Prompt 可以明确影响 Zero-shot 学习。
论文:[2110.08207] Multitask Prompted Training Enables Zero-Shot Task Generalization
Code:bigscience-workshop/promptsource: Toolkit for collecting and applying prompts
摘要:大语言模型显示出可观的 Zero-shot 泛化能力,被假设成是语言模型中多任务训练暗含的结果,所以这个能力能不能体现的直接点?本文使用一大堆有监督数据集,每个又有多个不同自然语言的 prompt,通过微调一个预训练的 Encoder-Decoder 模型,取得不错的 Zero-shot 性能。真可谓是大数据集、大 prompt 出奇迹。