电子元器件行业:AI大语言模型小型化 打破智能终端性能冗余窘境
2023-05-11 14:12:20 | 来源:国泰君安证券股份有限公司 | 编辑: |
2023-05-11 14:12:20 | 来源:国泰君安证券股份有限公司 | 编辑: |
(资料图片仅供参考)
本报告导读:
WWDC 大会临近,软硬件将迎重大更新或发布。MR新产品发布在即,供应链启动备货。人工智能潜力很大,已整合进多款产品和服务。
摘要:
谷歌PaLM2 全面进化,“大语言模型的小型化”迎重大突破。在谷歌I/O 2023 大会上,推出PaLM 2,改进了数学、代码、推理、多语言翻译和自然语言生成能力。PaLM 2 包含了4 个不同参数的模型,包括壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn),并在特定领域的数据上进行了微调,为企业客户执行某些任务。其中,PaLM 2 最轻量版本Gecko 小到可以在手机上运行,每秒可以处理20个token,大约每秒16 或17 个单词,“大语言模型的小型化”迎重大突破。
小型化模型将打破智能终端性能冗余窘境,终端接口的硬件性能将迎大升级。目前,以手机为代表的智能终端性能冗余,算力需求基本满足目前应用需求场景,导致终端消费者换机动力不足,全球手机总销量下滑明显。而AI 大语言模型的小型化发展,将带来智能终端的再升级。在手机、智能家居、机器人等终端应用上内嵌部署AI 模型,将迎来终端的核心架构的变化,终端推理计算能力要求将大升级,对应存储、传输、执行、感知等硬件需求也将同步升级。
“云端大模型+终端小模型”, AI 发展助推云管端硬件迭代。以OpenAI 为代表的大模型主要在云端进行训练与推理,终端主要负责输入与输出的接口,对终端的形态变化改变较小。以PaLM 2 Gecko为代表的大模型可在手机端进行推理运算,可在本地运行,将带来“个性化”与”私密性“上重大提升。离线的、永远在线的、个性化的、私密安全的LLM 将降低服务成本、加速AI 商业化渗透,相应终端硬件将大幅受益。推荐智能终端产业链,包括苹果MR、手机品牌、智能家居等方向。重点推荐品牌与终端算力芯片相关标的,包括立讯精密、兆威机电、瑞芯微,相关受益标的乐鑫科技、传音控股等。
催化剂。AI 终端发布会。爆款应用推出。
风险提示。AI 产业发展不及预期;AI 终端渗透不及预期。
关键词: