智谱发布新一代开源大模型推理速度最高达200 tokens/秒

凤凰网科技讯（作者/杨睿琪）4月15日，国内人工智能公司智谱（Zhipu AI）正式推出新一代开源大模型GLM-4-32B-0414系列。该系列包含基座、推理及沉思模型权重，并采用MIT开源协议。目前用户可通过智谱官方平台“z.ai”进行体验。

据官方介绍，此次发布的推理模型GLM-Z1-Air/AirX-0414在智谱自研的MaaS平台bigmodel.cn上实测推理速度最高可达200 tokens/秒。此外，智谱强调该模型的成本优势——GLM-Z1-Air-0414的定价仅为DeepSeek-R1的1/30。

此次发布的GLM-4-32B-0414系列延续了智谱在开源大模型领域的技术积累。其中，“基座模型”适用于通用任务，“推理模型”针对高效计算优化，“沉思模型”则专注于复杂逻辑处理。