ChatGPT 影响冲击:职业、行业与产业

2022 年末的时候,ChatGPT 横空出世,朋友第一时间关注试玩后与我分享。当时听他说效果很好,不过我并没有特别放心上,毕竟,对话机器人已经不知道来过多少轮了,都快麻了。直到过了几天他给我看了一个非常亮眼的 Case——把我们平时工作中的业务文本直接丢给 ChatGPT,让它做实体抽取任务。结果完成的非常好,甚至可以按照指定的格式(如 Json)输出,而且如果你再告诉它一些特有规则,它还能进一步提取。这就很厉害了,至少之前的对话机器人可做不到这点。于是赶紧关注起来,先看介绍——哇靠,居然有强化学习(个人兴趣,一直比较关注强化学习在 NLP 方面的应用【相关文献1和2】),顿时来了兴趣——再看,发现 InstructGPT 这篇 Paper 在 11 月已经读过了,顿时恍然——原来是这篇。然后就上淘宝买了个账号开始玩起来,玩着玩着就感觉到这东西对 NLP 这个职业的冲击,但当时并没有想到它能出圈,能影响整个行业甚至产业。

过年的时候,在用它写春节祝福时发现 Prompt 技能不够用了,搜了一下才发现是自己狭隘了,于是赶紧补充了一波,写下了这篇 Prompt 工程:ChatGPT Prompt 工程:设计、实践与思考 | Yam。然后,我感觉好像应该差不多了吧,没想到,一切才刚刚开始……现在,大家都知道了……在 Prompt 工程中,我在文末写到:“本想继续谈谈关于 ChatGPT 对 NLP 行业甚至 AI 领域的影响,以及是否马上就会出现强 AI,以及与此相关的影响等,由于与本文主旨关系不大,我将择文再议”。其实后面一直想写,只不过因为要研究 ChatGPT 的实现和标注,所以耽搁到现在,现在总算可以把这个坑给填上,只不过我把影响范围进一步扩大了——到产业级别。

本文主要就 ChatGPT 对职业、行业和产业的影响展开讨论,为了避免被其他信息影响,最近一段时间几乎没看(刻意为之)类似新闻或文章,所以内容更多会偏主观,仅供参考。

More

ChatGPT 标注指南:任务、数据与规范

ChatGPT 刚刚出来时,业内人士一致认为高质量的数据是一个非常关键的因素。且不论这个结论在 ChatGPT 这里是否正确,但高质量的数据对模型大有裨益却是公认的。而且,我们也可以从公开的 InstructGPT 标注指南中对此窥探一二。本文主要就围绕这份指南进行介绍,有点标题党了,但是考虑到 ChatGPT 和 InstructGPT 是兄弟关系,我们有理由相信 ChatGPT 的标注也是基于 InstructGPT 给出的指南进行的。当然不一定是全部,但至少我们可以从中学习和借鉴一些东西,是有此文。

More

ChatGPT Prompt 示例

下面的 Case 主要收集自网络,我会在后面添加上出处。关于 Prompt 设计技巧可以参考之前的文章:ChatGPT Prompt 工程:设计、实践与思考 | Yam,这里面的一些代表性 Case 也挪过来了。

特别说明:我们还是尽量从「设计」的角度给出 Case,而不是任务或内容。

另外需要说明:经测试,有些在中文下效果不如英文好(英文 Prompt 中文版本都是 ChatGPT 翻译的)。目前已有 Case 如下:

  • 直接问答、解释(不需要设计)
  • 扮演互动
  • 扮演+任务+步骤+上下文+目标+格式
  • 使用扮演绕过限制
  • 目标+上下文+多任务
  • 标题+指定对象+任务
  • 合作创作
  • 表格转换
  • 简化长 Prompt
  • 综合多个结果
  • 创造力增强
  • 游戏引擎
  • 推荐
  • 思维树

More

语言模型级联

这是一篇来自 Google 的研究结果,通过一定的方法和策略,比如多个预训练模型结合,进一步提升模型整体推理能力。本文主要是对这方面的研究做了一个整体统一的划分,包括:思维链(Chain-of-Thought),验证器(Verifiers, STaR)选择-推理(Selection-Inference),工具使用(Tool Use)等,这些统称为:语言模型级联(Language Model Cascades)。

More

ChatGPT Prompt工程:设计、实践与思考

ChatGPT 火爆出圈了,有些人惊叹于它的能力,当然也有部分人觉得也就那样。这就不得不提 Prompt 了,据说【相关文献1】,ChatGPT 效果好不好完全取决于你的 Prompt,“看来 Propmt 也成一个技术活儿了”。当我这么想的时候,没想到国外居然已经有了成熟的售卖 Prompt 的网站,这玩意儿居然成了 NFT(Non-Fungible Token),真是世界变化太快,本人过于迟钝。

其实,对于 ChatGPT 的能力,作为 NLPer 第一时间就领教过了,作为行业内人士,而且多年来一直关注文本生成领域,ChatGPT 带给我的冲击和震撼是非常大的,甚至那几天晚上连觉都睡不着,真是焦虑感爆棚。记得在 DataWhale 团队群里一次讨论 ChatGPT 时,我发过这样的消息,原话如下:

1
2
3
4
NLP真的考虑要转行了
ChatGPT已经抹平了任务、行业、语言
以后也不用分那么多task榜单了,不用管行业
强大的一批,LM as SAAS 将统治一切

LM as SAAS,其实应该是 LMAS——Language Model as Service。

过了几天看到这篇文章:ChatGPT 会对未来 5 年的 NLP 算法从业者带来怎样的冲击?发现业内大家也是差不多的想法(虽然我发消息在这篇文章之后,但之前的确没看过),尤其是张俊林博士的观点个人比较认同,NLP 工程师的确不容乐观。这里不是说这个职业的职责不容乐观,而是说整个行业可能会受到冲击。

有点跑偏了,说回 Prompt,春节时就想用 ChatGPT 生成一些祝福语,突然发现自己掌握的 Prompt 出来的效果不太好了。Google 了一下结果就发现了 The Art of ChatGPT Prompting: A Guide to Crafting Clear and Effective Prompts 这本电子书,再一搜,发现这个领域居然已经发展到如斯境地。本着学习的心态,阅读整理了一些 Prompt 工程的资料(见《文献和参考——核心文献》),是有此文。本文主要介绍关于 ChatGPT Prompt 的方法,我会结合这些资料加上自己的理解写出来,同时会在中文环境下做相关试验。

More

人生随笔

今天是除夕,一大早因为一个梦醒来了,不是噩梦,当然也不是美梦。要搁平时,肯定继续睡了,但上完厕所发现居然毫无睡意,而且很想写点什么。至于原因,好像也没什么原因,可能是近期一直想写点东西,也可能是马上又过完了一年,还有可能是年纪见长容易感慨。总之,好似有方向,但又无目的。

More

GPT3 和它的 In-Context Learning

ChatGPT 的爆火让很多 NLPer 大吃一惊,焦虑感爆棚,它的思路和方法都不复杂,但效果却出奇的好。我想任何研究成果的爆发都不可能是一蹴而就的,期间必然包含这一系列小的创新和优化。于是,重新把 GPT3 的 Paper 拉出来读了一遍,重点关注了实验结果之外的东西,果然发现不少细节。因此,本文还是以 GPT3 为主。

More

W2NER解读

NER 任务主要有三种类型:Flat(平铺)、overlapped(重叠或嵌套)、discontinuous(不连续),越来越多的研究致力于将它们统一起来。当前的 STOA 主要包括基于 Span 和 Seq2Seq 模型,不过它们很少关注边界,可能会导致后续的偏移。本文提出的统一方法(W2NER)是将其视为词词关系分类,为此引入两种词词关系:NNWNext-Neighboring-Word)和 THW-*Tail-Head-Word-*)。具体而言,构造一个 2D 的词词关系网格,然后使用多粒度 2D 卷积,以更好地细化网格表示。最后,使用一个共同预测器来推理词-词关系。

More