本地化部署ChatGLM

2023-09-07 14:23

方案背景

      自ChatGPT发布以来,生成式AI在全球引起了新的浪潮,它影响着各行各业,为世界带来史诗级的智能化发展。然而,类ChatGPT的大语言模型极度依赖算力巨大的服务器,导致目前大部分应用只能通过集中调用API的方式来应用,很难本地化部署。随着大模型适用领域的扩展,大模型登陆边缘设备的需求凸显,越来越多的行业需要把大语言模型应用在专业的领域上。在这个背景下,Firefly推出了基于BM1684X平台的大语言模型本地部署的方案,让边缘设备可配置上一颗真正的“智慧”大脑,应用于各行各业。


1694068060938712.png




一,本地化的ChatGLM-6B大语言模型


(1)具有 62 亿参数

       采用了由清华大学的ChatGLM-6B大语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数, 使用了和 ChatGPT 相似的先进技术,以达到优质的效果。


1694068128497407.png



(2)优化中文对话

      支持中英双语的对话语言模型,并且针对中文问答和对话进行了优化。其开源的训练数据量达到1万亿字符的模型

1694080907126660.png




二,高算力AI边缘计算主机EC-A1684XJD4

      ChatGLM-6B可部署在Firefly旗下产品AI嵌入式主机EC-A1684XJD4中,主机配置了16GB大内存,适用于部分大模型的量化部署,可运行Ubuntu20.04操作系统,并集成最新的SOPHONSDK 3.0.0,可充分发挥BM1684X集成TPU的AI加速能力

1694068146378414.png



商务联系

产品细节和授权请联系  

sales@t-firefly.com