• 财讯网
  • 主页 > 热点资讯 > 正文

    世界观热点:电子行业动态点评:从谷歌I/O大会看AI大模型产业前沿

    2023-05-12 10:24:38  |  来源:华泰证券股份有限公司  |  编辑:  |  


    【资料图】

    谷歌I/O 大会看点:AI 大模型&轻量化、AI 赋能应用、算力基础设施当地时间5 月10 日,谷歌举行I/O 大会,宣布了AI 大模型、AI 赋能应用、算力基础设施等一系列新进展:1)发布PaLM 2 语言模型,具有更好的多语言和推理能力,并宣布旗下DeepMind 正在研发多模态基础模型Gemini;2)宣布一系列基于PaLM 2 的应用功能更新,包括AIGC 办公工具包DuetAI,支持多模态理解和生成、并与其他应用协同的聊天机器人Bard、以及企业级AI 平台Vertex AI;3)推出新一代超算A3 Virtual Machines。本次I/O 大会上模型轻量化值得关注,PaLM 2 系列模型中体积最小的Gecko 可在手机上运行。我们认为模型压缩技术是实现 AI 大模型在边/端部署的核心技术,将加速 AI 技术与智能终端融合,国内 SoC 设计公司有望深度受益。

    大模型:PaLM 2 多语言能力、推理能力、代码能力提升明显谷歌发布了PaLM 2 语言大模型,基于Pathways 架构,使用TPU v4 和JAX框架训练。PaLM 2 的提升在于:1)多语言能力。训练数据超过100 种语言,能理解、翻译和生成更准确和多样化的文本(含双关语、习语等);2)逻辑能力。在一系列推理、数学任务测试中,PaLM 2 显著优于PaLM,并与GPT-4 相当;3)代码能力。PaLM 2 在 20 种编程语言上进行训练,包括Python 和JavaScript 等流行语言以及Prolog、Verilog 和Fortran 等其他语言。此外,谷歌在PaLM 2 的基础上还训练了用于编程和调试的专业模型Codey,安全知识模型Sec-PaLM 以及医学知识模型Med-PaLM 2。

    模型轻量化:Gecko 可在手机上运行, AI 技术与智能终端加速融合PaLM2 主要包含4 种规格(Gecko、Otter、Bison 和Unicorn),其中体积最小的Gecko 可以在手机上运行,每秒可处理20 个Token,大约相当于16或17 个单词。而在谷歌发布上述支持移动端部署的AI 大模型之前,高通、华为也相继实现了AI 模型在终端的轻量化部署,分别搭载在高通第二代骁龙8 移动平台手机以及华为新一代P60 系列手机上。我们认为模型压缩技术是实现AI 大模型在边/端部署的核心技术,将加速AI 技术与智能终端融合,国内SoC 设计公司有望深度受益。

    大模型应用:PaLM 2 赋能Workspace、Bard、Vertex AI 等功能升级PaLM 2 已应用在超过25 种功能和产品中,包括办公套件Workspace、聊天机器人Bard 等等。其中,Workspace 推出AIGC 工具包Duet AI。Duet AI包括Google Docs 和Gmail 中的智能写作工具、Google Slides 中的文本生成图像、演讲备注以及Google Meet 的会议摘要生成等功能。I/O 大会展示了Bard 支持的文字、代码、图像生成与理解能力,并重点强调了Bard 与谷歌应用,以及外部其他应用的协同能力。ToB 应用方面,Vertex AI 集合了谷歌研发的基础模型,用户可按需调用模型并对模型的参数权重进行微调;此外,Vertex AI 还能够根据内部数据建立企业版本的搜索引擎。

    算力基础设施:谷歌云推出A3 超算

    算力基础设施方面,谷歌云推出了新一代超算——A3 Virtual Machines,采用第4 代英特尔至强可扩展处理器、2TB DDR5-4800 内存以及8 张英伟达H100,专门用于训练和服务AI 大模型。A3 是首个使用谷歌定制设计的200Gbps IPU 的GPU 实例,GPU 间的数据传输绕过CPU 主机,通过与其他虚拟机网络和数据流量分离的接口传输,网络带宽相比A2 增加10 倍,具有低延迟和高带宽稳定性。

    风险提示:AI 及技术落地不及预期;本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。

    关键词:

    上一篇:世界新消息丨银行业4月金融数据:信贷增量回落 存款下降或因流入理财、储蓄险等产品    下一篇:最后一页