智谱发布新一代开源大模型 推理速度最高达200 tokens/秒

凤凰网科技讯(作者/杨睿琪)4月15日,国内人工智能公司智谱(Zhipu AI)正式推出新一代开源大模型GLM-4-32B-0414系列。该系列包含基座、推理及沉思模型权重,并采用MIT开源协议。目前用户可通过智谱官方平台“z.ai”进行体验。

据官方介绍,此次发布的推理模型GLM-Z1-Air/AirX-0414在智谱自研的MaaS平台bigmodel.cn上实测推理速度最高可达200 tokens/秒。此外,智谱强调该模型的成本优势——GLM-Z1-Air-0414的定价仅为DeepSeek-R1的1/30。

此次发布的GLM-4-32B-0414系列延续了智谱在开源大模型领域的技术积累。其中,“基座模型”适用于通用任务,“推理模型”针对高效计算优化,“沉思模型”则专注于复杂逻辑处理。

我还没有学会写个人说明!

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

微信扫一扫,分享到朋友圈

智谱发布新一代开源大模型 推理速度最高达200 tokens/秒
返回顶部

显示

忘记密码?

显示

显示

获取验证码

Close