玩大模型门槛高不高呢?
大模型领域当中不同类型的玩家
第一种:像谷歌 微软 百度 open ai这样的玩家,从0开始做一个这样的基础大模型这一部分无论是数据还是算力,还是人才的要求都非常高。整个的大模型,他之所以有这样的一个通用的智能化的能力,实际上是它经过了海量的数据的训练,(可能相当于数百万个这样的人,他们一生的阅读量) 另一方面实际上是这种高质量的标注数据,比如说像 OpenAl,他们有大量的这种专业领域的标注员,那么除了数据之外,当然算力的要求也是非常高的,像 Chat GPT这样的一个千亿级别的大模型要连续训练 1000 张 A100 连续训练 100 天这样的一个时间,所以这个成本也非常高(动辄花几千万美金 甚至几亿 几十亿美金购买 GPU)。
【自建基础大模型,算力、算法、数据,,人才要求高】
第二种:在已有开源的基础大模型之上,比如 chatglm3、llama2、 阿里通义这样的基础大模型之上,做这种行业的领域大模型,就好比站在巨人的肩膀之上,训练完成之后90%的工作大模型都给你解决了,它所需要的数据量、它所需要的计算量、成本方面就算我们是普通程序员也是可以接受。 电商 量化交易 教育 工业的知识库 天气预测 客服机器人等 都是可以落地的,现在市面招聘99%也都是领域大模型的产品经理、算法工程师。
【行业大模型,基于基础大模型微调,针对性定制】
第三种:基于前两类的大模型,在上面开发应用,门降的非常低,整个的创新的速度非常快(在进行模型二次训练的时候顺手就搞定了)
【用大模型开发应用,通过开发工具,降低门槛】
微信赞赏
支付宝扫码领红包
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。侵权投诉:375170667@qq.com