Grok-1是马斯克AI创企xAI发布的一款大型语言模型,其参数量达到了3140亿,远超OpenAI GPT-3.5的1750亿,是Llama 2的4倍,被称为“迄今为止全球参数量最大的开源大型语言模型”。Grok-1是一款混合专家模型,其基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调。它采用了3140亿参数的Mixture-of-Experts模型,其中25%的权重在给定令牌上处...
50 55602 0
ChatGLM是一个基于OpenAI的GPT模型框架构建的生成式语言模型,用于聊天和对话任务。它能够理解上下文并生成连贯、自然的回复。这种模型可应用于构建对话系统、智能客服、聊天机器人等,以提供更加交互性和人性化的对话体验。此外,ChatGLM还是清华技术成果转化的公司智谱AI研发的支持中英双语的对话机器人。不过,模型的训练和优化过程需要大量的计算资源和数据,且模型的生成性质也需要进行适当的监督和...
50 56193 0
启动后在浏览器打开http://127.0.0.1:7860
50 56021 0
实现了先进视频生成技术的低成本普及,还提供了一个精简且用户友好的方案,简化了视频制作的复杂性从图像扩散模型到视频扩散模型的三阶段训练。我们提供每个阶段的权重。支持训练加速,包括Transformer加速、更快的 T5 和 VAE 以及序列并行。在对 64x512x512 视频进行训练时,Open-Sora 可将训练速度提高55%。详细信息请参见训练加速。我们提供用于数据预处理的视频切割和字幕工具。...
30 56199 0