玩大模型门槛高不高呢?

大模型门槛高不高,要分三种情况 大模型领域当中不同类型的玩家

第一种:像谷歌 微软 百度 open ai这样的玩家,从0开始做一个这样的基础大模型这一部分无论是数据还是算力,还是人才的要求都非常高。整个的大模型,他之所以有这样的一个通用的智能化的能力,实际上是它经过了海量的数据的训练,(可能相当于数百万个这样的人,他们一生的阅读量) 另一方面实际上是这种高质量的标注数据,比如说像 OpenAl,他们有大量的这种专业领域的标注员,那么除了数据之外,当然算力的要求也是非常高的,像 Chat GPT这样的一个千亿级别的大模型要连续训练 1000 张 A100 连续训练 100 天这样的一个时间,所以这个成本也非常高(动辄花几千万美金 甚至几亿 几十亿美金购买 GPU)。

【自建基础大模型,算力、算法、数据,,人才要求高】

 

第二种:在已有开源的基础大模型之上,比如 chatglm3、llama2、 阿里通义这样的基础大模型之上,做这种行业的领域大模型,就好比站在巨人的肩膀之上,训练完成之后90%的工作大模型都给你解决了,它所需要的数据量、它所需要的计算量、成本方面就算我们是普通程序员也是可以接受。 电商 量化交易 教育 工业的知识库 天气预测 客服机器人等 都是可以落地的,现在市面招聘99%也都是领域大模型的产品经理、算法工程师。

【行业大模型,基于基础大模型微调,针对性定制】

 

第三种:基于前两类的大模型,在上面开发应用,门降的非常低,整个的创新的速度非常快(在进行模型二次训练的时候顺手就搞定了)

【用大模型开发应用,通过开发工具,降低门槛】

 

大模型本身已经是非常强大了,但是无法满足我们工作需求。所以我们做的是基于基座大模型做模型二次训练 做独有场景 独有数据方向 私有化部署(真正意义上的几何倍率的提高工作效率,成为超级个体,成为大模型全栈工程师)

扫码领红包

微信赞赏支付宝扫码领红包

发表回复

后才能评论