计算机行业“智能网联”系列报告26-GPT:大模型多模态应用展望
2023-03-13 07:31:35 | 来源:中信证券股份有限公司 | 编辑: |
2023-03-13 07:31:35 | 来源:中信证券股份有限公司 | 编辑: |
(资料图片)
ChatGPT通过大模型突破AI瓶颈,GPT-4多模态应用带动商业化加速。
ChatGPT凭借大算力、大规模数据训练、基于人类知识的强化学习等方式突破AI技术瓶颈,获得超预期的用户体验效果与市场反响。
回顾GPT系列模型演进,GPT-1结合无监督预训练与有监督微调过程,GPT-2突出零样本设定,GPT-3强调上下文学习能力,参数量、训练数据量不断提升。我们预计即将推出的GPT-4或支持多模态应用,开启通往人工通用智能(AGI)之路,并有望控制训练成本,降低使用门槛。目前,ChatGPT已在C端推出ChatGPT Plus订阅计划,B端开放ChatGPT API,且成本降低为0.002美金/1000token,海外多个应用率先接入。我们预计在GPT-4带动下,未来大模型以及多模态模型的商业化应用将进一步加速,带动行业景气度持续向上。
Transformer架构支撑GPT走向多模态,构筑AIGC领域核心基石。
GPT系列模型使用Transformer架构,当前基于Transformer的多模态研究为AI领域研究热点,Transformer已开始打破NLP与CV领域壁垒,有望支撑GPT系列模型走向多模态应用,构筑AIGC领域核心能力基石。我们梳理出GPT的潜在基础能力包括文本生成(分析)、代码生成、对话交互、机器翻译、图像生成、视频生成等。我们认为,前述基础能力将支撑GPT系列模型在通用与垂直领域的应用,典型应用场景如:通用领域—搜索引擎/办公软件,垂直领域—教育/金融/医疗/图像视频等。
通用与垂直场景多点开花,GPT变革内容生成与交互方式。
GPT有望革新各行各业的内容生成与交互方式。基于GPT+文本&代码&对话&翻译&图像&视频,我们看好GPT类技术未来在通用与垂直场景的应用空间。例如,搜索引擎结合GPT将重塑搜索结果呈现方式,多模态的引入带来一站式的文本、图像、视频汇集结果,将大为提升用户信息收集效率,百度文心一言有望引领用户搜索体验的代际变革;在办公软件领域,金山WPS、福昕PDF未来若结合多模态GPT,有望深化用户在流程/事务/知识/创意/协作型等多类工作事项上的智能办公体验,同时支撑产品打开客单价提升空间;讯飞将以AI学习机率先落地类ChatGPT技术,有望在作文辅导、口语学习方面实现跃升;当虹科技具有视频AI建模能力、落地AIGC相关技术,GPT赋能下或进一步深化传媒、安全领域应用。
投资策略:伴随成本下降以及多模态的持续演进,GPT等大模型有望构筑AIGC核心基石,推动AI商业化进程加速和市场天花板打开。
建议持续关注相关领域的AI公司:1)应用层:AI+行业:办公—金山办公、福昕软件,教育—科大讯飞,金融—同花顺、东方财富,医疗—创业慧康、卫宁健康,图像视频—商汤科技、当虹科技、云从科技、格灵深瞳、创新奇智、虹软科技、魅视科技,其他-拓尔思、汉王科技、海天瑞声等;2)基础设施层:海光信息、景嘉微、寒武纪、浪潮信息、工业富联、中科曙光等。
风险提示:AI核心技术发展不及预期风险;科技领域政策监督收紧风险;企业数据安全风险;信息安全风险;行业竞争加剧风险。
关键词: