ai模型grok-1介绍,grok-1下载地址

git地址:https://github.com/xai-org/grok-1.git

Grok-1是一款基于混合专家系统(Mixture-of-Experts,MoE)技术构建的大语言模型,拥有3140亿参数,远超OpenAI GPT-3.5的1750亿。这是迄今参数量最大的开源大语言模型,遵照Apache 2.0协议开放模型权重和架构。

xAI表示,Grok-1始终由xAI自行训练,其预训练阶段于2023年10月完成。此次发布的是Grok-1预训练阶段结束时的原始基础模型检查点,即该模型未经过针对任何具体应用的微调。

xAI的目的之一就是与OpenAI、谷歌、微软等对手在大模型领域进行竞争,其团队来自OpenAI、谷歌DeepMind、谷歌研究院、微软研究院等诸多知名企业和研究机构。

Grok 在 Apache License 2.0 下发布,允许商业使用、修改和分发。但是,用户必须遵守某些要求,例如复制原始许可证和版权声明并说明他们所做的更改。Grok 拥有 3140 亿个参数,在复杂性和性能方面超越了开源竞争对手。该模型的架构融合了神经网络设计的创新方法,将 25% 的权重用于给定的令牌,以提高效率和有效性。

此前,Grok 只能通过 Elon Musk 的社交网络 X 通过 X Premium+ 付费订阅服务访问。然而,Grok 的开源并不包括其训练数据的完整语料库,也不提供对 X 上可用的实时信息的访问。用户仍然需要订阅 X 的付费版本。

Grok 被定位为 OpenAI 的 ChatGPT 和其他领先的谷歌AI的竞争对手。它以意为理解的俚语命名,被描述为模仿《银河系漫游指南》的人工智能。马斯克将 Grok 定位为比其他谷歌AI更幽默、更不受审查的替代方案,这对担心人工智能审查制度的用户特别有吸引力。

Grok 的发布也是马斯克在针对 OpenAI 的诉讼中的一种立场,指责该公司背离了其非营利协议。

Grok 的开源引起了人工智能社区的好奇和兴奋。技术专家指出了该模型的有趣特征,例如在前馈层中使用 GeGLU 及其标准化方法,包括有趣的三明治范数技术。此版本预计会给其他 LLM 提供商(尤其是竞争对手的开源模型)带来压力,以向用户证明其优势。

总体而言,Grok的开源标志着人工智能技术发展的重大举措。它为企业家、程序员和公司提供了更好的可访问性和机会,可以将这种高级语言模型用于各种应用程序。随着人工智能社区对 Grok 的探索和实验,看看它如何塑造自然语言处理和人工智能进步的未来将会很有趣。

扫码领红包

微信赞赏支付宝扫码领红包

发表回复

后才能评论