天天亮点!计算机动态点评:CHATGPT:掀起AI产业新周期
2023-02-07 11:20:41 | 来源:华泰证券股份有限公司 | 编辑: |
2023-02-07 11:20:41 | 来源:华泰证券股份有限公司 | 编辑: |
ChatGPT 问世,AI 赛道关注度有望持续提升
(资料图片仅供参考)
2022 年11 月30 日,OpenAI 公司正式对外发布聊天机器人软件ChatGPT,并迅速在全球范围获得大量用户青睐。目前ChatGPT 主要通过提供API、订阅服务等获得收入,随着盈利模式拓展,未来商业落地有望加速。我们认为,ChatGPT 受到广泛关注的原因在于能够实现接近人类水平的自然语言处理能力,对话逻辑也已经与人类类似。而ChatGPT 成功的背后,来自独特算法模型的加持,验证了单一大模型的实战意义,同时也是AI 大模型路线一次里程碑式的胜利。在大模型基础上,GPT 得以从1.0 逐步演化至2.0、3.0、3.5 等版本。而随着用户数量扩张,模型有望加速迭代,产品力持续升级或将带动AI 赛道关注度有望持续提升。
背景:发源于OpenAI,成名于生成式语言
OpenAI 成立于2015 年,专注于强化学习等AI 算法、模型的研发与应用。2019 年公司获得微软注资10 亿美元,就Azure 业务开发人工智能技术。2023 年,微软再次追加百亿投资,深入布局生成式AI 技术。随着公司AI技术不断沉淀,产品模型持续演进,GPT 模型陆续演化出GPT-2、GPT-3、GPT-3.5 等版本。基于微调后的GPT-3.5 模型,OpenAI 推出ChatGPT 软件。目前来看,OpenAI 围绕ChatGPT 的盈利模式大致分为两种:1)提供API 数据接口,执行自然语言处理任务,按字符数收费;2)ChatGPT Plus提供服务器忙碌时段优先响应等特权,并收取20 美元/人/月的订阅服务费。
原理:AI 大模型里程碑式的胜利
我们看到,ChatGPT 成功的背后,离不开独特训练模型的加持,核心技术采用了监督学习+奖励模型共同进行语言模型训练。拆解来看,训练过程大致分为三个阶段:1)训练监督策略模型;2)训练奖励模型;3)采用近端策略优化进行强化学习。此外,我们发现,ChatGPT 的训练过程存在几个特点:1)采用的是单一大模型;2)采用的是小样本学习方法;3)采用人类反馈来微调监督学习。基于此,我们认为,ChatGPT 的成功,验证了单一大模型实战意义,有望推动人工智能训练向大模型方向演进。
模型:单一大模型加持下GPT 快速迭代
我们认为,GPT 模型强大的语言处理能力,来自底层模型的持续演进。据OpenAI 官网,从GPT-1 到GPT-2、GPT-3,GPT 模型参数量不断提升,从1.17 亿大幅提升至15 亿、1750 亿。而单一大模型的形态是GPT 模型得以快速演进的基础,通过大规模语言预训练的方式,模型迅速积累泛化通用的语言能力。此外,GPT3.5 开始还引入监督学习过程,人类反馈机制的加入在提升模型准确性、真实性的同时,又降低了参数计算量,使得更大规模的AI 学习成为可能。我们认为,随着ChatGPT 用户不断扩张,用户反馈或将带来类似监督学习的效果,GPT 有望在大模型加持下加速进化。
投资建议:模型层,应用层,算力层
我们认为,在中国或将训练出国产的GPT 模型,而GPT 模型算法的开发和训练,具有一定的研发门槛。目前国内在模型层面具备产业基础的相关企业包括:百度、商汤、云从科技等;在应用层持续推出新应用的相关企业包括:科大讯飞、金山办公、同花顺、汉王科技等;在底层基础设施和工具有布局的相关企业包括:寒武纪、景嘉微等。
风险提示:市场需求变动风险,市场竞争加剧风险。本研报中涉及到的公司、个股内容系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。