天天动态:科技先锋系列报告261:HUGGINGFACE:AI领域的GITHUB
2023-05-25 16:30:25 | 来源:中信证券股份有限公司 | 编辑: |
2023-05-25 16:30:25 | 来源:中信证券股份有限公司 | 编辑: |
(资料图片)
Hugging Face是一家总部位于纽约的初创公司。起初,该公司打算专注于聊天机器人领域,然而在其业务发展过程中,他们创造出的一款名为Transformers的开源库在机器学习社区引发了广泛关注,致力于成为机器学习届的GitHub。其开放的Hugging Face Hub平台拥有超过20万个模型、3万个数据集和5万个演示,使得全球的机器学习社区成员可以轻松协作完成他们的工作流程。
其中,Hugging Face的Transformers库为NLP领域提供了大量的先进预训练语言模型架构及其调用框架,至今已被下载超过一百万次,GitHub上的星级评价超过24000个。
运营层面:采用了社群驱动的方式,其领英关注者数量超过200,000人。为了保持模型SOTA和推动AI进步, 需要整个领域的专家来共同参与构建了Hugging Face 社区和Transformers库,科研人员把模型集成到Transformers库或者基于Transformer库构建模型。
落地和易用性层面:通过做了一层抽象,屏蔽了Tensorflow和Pytorch的复杂性。Tensorflow工业部署能力强,吸引了偏向产业界的开发者。Pytorch易用性强,吸引了偏学术的开发者,解决了科研到工程落地的鸿沟。
成就:Hugging Face的Transformers库几乎开始成为了NLP SOTA的标准,形成了平台效应,一方面科研想把模型集成到Transformers库,将科研成果用于实践;另一方面,工程人员可以相对低门槛地用上整理好的模型库。同时Transformers库的引流,带动了文本数据集的扩充,初步形成了NLP界的GitHub。
关键词: