世界观热点：电子行业动态点评：从谷歌I／O大会看AI大模型产业前沿

2023-05-12 10:24:38 | 来源:华泰证券股份有限公司 | 编辑: |

【资料图】

谷歌I/O 大会看点：AI 大模型&轻量化、AI 赋能应用、算力基础设施当地时间5 月10 日，谷歌举行I/O 大会，宣布了AI 大模型、AI 赋能应用、算力基础设施等一系列新进展：1）发布PaLM 2 语言模型，具有更好的多语言和推理能力，并宣布旗下DeepMind 正在研发多模态基础模型Gemini；2）宣布一系列基于PaLM 2 的应用功能更新，包括AIGC 办公工具包DuetAI，支持多模态理解和生成、并与其他应用协同的聊天机器人Bard、以及企业级AI 平台Vertex AI；3）推出新一代超算A3 Virtual Machines。本次I/O 大会上模型轻量化值得关注，PaLM 2 系列模型中体积最小的Gecko 可在手机上运行。我们认为模型压缩技术是实现 AI 大模型在边/端部署的核心技术，将加速 AI 技术与智能终端融合，国内 SoC 设计公司有望深度受益。

大模型：PaLM 2 多语言能力、推理能力、代码能力提升明显谷歌发布了PaLM 2 语言大模型，基于Pathways 架构，使用TPU v4 和JAX框架训练。PaLM 2 的提升在于：1）多语言能力。训练数据超过100 种语言，能理解、翻译和生成更准确和多样化的文本（含双关语、习语等）；2）逻辑能力。在一系列推理、数学任务测试中，PaLM 2 显著优于PaLM，并与GPT-4 相当；3）代码能力。PaLM 2 在 20 种编程语言上进行训练，包括Python 和JavaScript 等流行语言以及Prolog、Verilog 和Fortran 等其他语言。此外，谷歌在PaLM 2 的基础上还训练了用于编程和调试的专业模型Codey，安全知识模型Sec-PaLM 以及医学知识模型Med-PaLM 2。

模型轻量化：Gecko 可在手机上运行， AI 技术与智能终端加速融合PaLM2 主要包含4 种规格（Gecko、Otter、Bison 和Unicorn），其中体积最小的Gecko 可以在手机上运行，每秒可处理20 个Token，大约相当于16或17 个单词。而在谷歌发布上述支持移动端部署的AI 大模型之前，高通、华为也相继实现了AI 模型在终端的轻量化部署，分别搭载在高通第二代骁龙8 移动平台手机以及华为新一代P60 系列手机上。我们认为模型压缩技术是实现AI 大模型在边/端部署的核心技术，将加速AI 技术与智能终端融合，国内SoC 设计公司有望深度受益。

大模型应用：PaLM 2 赋能Workspace、Bard、Vertex AI 等功能升级PaLM 2 已应用在超过25 种功能和产品中，包括办公套件Workspace、聊天机器人Bard 等等。其中，Workspace 推出AIGC 工具包Duet AI。Duet AI包括Google Docs 和Gmail 中的智能写作工具、Google Slides 中的文本生成图像、演讲备注以及Google Meet 的会议摘要生成等功能。I/O 大会展示了Bard 支持的文字、代码、图像生成与理解能力，并重点强调了Bard 与谷歌应用，以及外部其他应用的协同能力。ToB 应用方面，Vertex AI 集合了谷歌研发的基础模型，用户可按需调用模型并对模型的参数权重进行微调；此外，Vertex AI 还能够根据内部数据建立企业版本的搜索引擎。

算力基础设施：谷歌云推出A3 超算

算力基础设施方面，谷歌云推出了新一代超算——A3 Virtual Machines，采用第4 代英特尔至强可扩展处理器、2TB DDR5-4800 内存以及8 张英伟达H100，专门用于训练和服务AI 大模型。A3 是首个使用谷歌定制设计的200Gbps IPU 的GPU 实例，GPU 间的数据传输绕过CPU 主机，通过与其他虚拟机网络和数据流量分离的接口传输，网络带宽相比A2 增加10 倍，具有低延迟和高带宽稳定性。

风险提示：AI 及技术落地不及预期；本研报中涉及到未上市公司或未覆盖个股内容，均系对其客观公开信息的整理，并不代表本研究团队对该公司、该股票的推荐或覆盖。

关键词：

上一篇：世界新消息丨银行业4月金融数据：信贷增量回落存款下降或因流入理财、储蓄险等产品　　下一篇：世界滚动:宏观研究：恢复性反弹接近尾声内生动能需外力提振