你的位置:ky体育官网登录入口网页版(中国)有限公司官网 > 资讯 > 开yun体育网 模子独自“上班”8小时  2025年3月-ky体育官网登录入口网页版(中国)有限公司官网

开yun体育网 模子独自“上班”8小时  2025年3月-ky体育官网登录入口网页版(中国)有限公司官网

时间:2026-04-13 06:49 点击:169 次

开yun体育网 模子独自“上班”8小时  2025年3月-ky体育官网登录入口网页版(中国)有限公司官网

  4月8日,“群众大模子第一股”智谱开盘涨超18%,市值靠拢4000亿港元。胁制收盘,其涨幅有所回落,涨超14%。

  本日,该公司发布了其迄今最智能的模子——GLM-5.1。GLM-5.1大大提高了代码才气,在完成长程任务方面进步尤为权贵。和此前分钟级交互的模子不同,GLM-5.1简略在一次任务中颓靡、抓续地职责长达8小时,时期自主狡计、试验、自我进化,最终请托好意思满的工程级后果。

  与此同期,智谱GLM再度提价10%,编码场景订价追平外洋头部厂商Anthropic,国产模子价钱初次对皆外洋。

模子独自“上班”8小时

  2025年3月,AI安全接洽机构METR淡薄了一个改动行业通晓的测度打算:任务完成时刻线(Task-Completion Time Horizon)——不再揣度模子“多聪惠”,而是揣度它能颓靡完成多万古刻的东说念主类任务。

  这对模子厂商淡薄了更深档次的挑战。在长程任务中保抓清爽输出,模子濒临的不仅仅更大的代码量,而是一连串复杂的工程决策点:主动跑benchmark、定位瓶颈、修改决策、再跑测试。

  模子需要像一个确实的工程师通常,酿成“实验→分析→优化”的好意思满闭环,而不是写完一版代码就停驻来等东说念主打分。

  为此,智谱团队在试验形状上作念了几个要道的治愈,包括彭胀任务经过的试验窗口、异常优化模子的tool use才气。迭代后,GLM-5.1简略在单次任务中抓续、自主地职责长达8小时。

  这意味着,用户寝息的8小时,不错变成模子“上班”的8小时。经过中,模子不错自主狡计、试验、测试,碰壁时主动切换政策,出错后自行诞生,最终请托好意思满的工程级后果。

  以“8小时从零构建Linux桌面”任务为例,用户白昼画好架构草图,睡前交给GLM-5.1,早上醒来已产出好意思满系统。

  历时8小时整,试验1700多步,GLM-5.1在20分钟时产生第一个有酷好的后果,8小时后产出了一套功能完善的Linux桌面系统,包括:好意思满的桌面、窗口处分器、情景栏、诈欺次序、VPN处分器、中翰墨体撑抓、游戏库等,4.8MB的配套文献。这格外于一个4东说念主团队一周的蛊卦职责量。

  智谱时期团队先容,上述任务全程莫得单位测试兜底、莫得代码审查、莫得文档。值得一提的是,它以致给我方的代码写了一个14小时的追思测试——况兼通过了测试。

  已往两年,行业用Benchmark揣度模子有多智能。下一阶段的揣度圭臬应该是“能职责多久”,即模子在长程任务中的抓续发达,颓靡完成东说念主类内行几小时以致几天才能作念完的职责。

  智谱以为,延伸模子的“灵验职责时长”是进步智能体才气的一个基础维度。在这条路上仍然有权贵的时期挑战:怎么克服模子濒临复杂任务的高下文躁急、如安在数千次器具调用后保抓试验的一致性、怎么更早地跳出局部最优,以及更紧要的是如安在莫得详情数值测度打算的任务上建树可靠的自我评估机制。

  “GLM-5.1是咱们在这个方进取迈出的一步,咱们会抓续鼓舞。”智谱默示,其究极标的是全自治智能体(Autonomous Agent),模子7×24小时不阻隔地感知任务、明白标的、试验请托、自我评价与校正、自我进化,从此无需东说念主类介入。

国产模子价钱初次对皆外洋

  让外洋时期社区格外热心的是,在编程才气方面,GLM-5.1的性能初次兑现了与国际头部模子的对皆。

  Claude Opus 4.6由Anthropic蛊卦,该公司年化收入近期初次超过OpenAI,被视为买卖化才气最强的外洋头部厂商。最新业务数据披露,Anthropic年化收入(ARR)已达到300亿好意思元,这高出了OpenAI此前公布的250亿好意思元年化收入。

  在这一布景下,中国开源AI在最中枢的工程才气测度打算上,初次具备与国际先进水平同场竞技的才气。以往国内开源模子常被定位为落伍一方,与国际最强闭源模子的得益恒久存在一定距离。而GLM-5.1这次的榜单收尾,一定进度上冲突了这种固有通晓。

  性能进步的同期,智谱在价钱层面也与外洋厂商看皆。模子团员平台OpenRouter披露,智谱GLM再度提价10%。调价后,GLM-5.1在Coding场景的缓存掷中Token价钱接近Anthropic旗下Claude Sonnet 4.6。

  公开贵府披露,这是国产大模子初次在中枢场景兑现与外洋头部厂商的价钱对皆。

  这一变化超出了不少东说念主的预感——一年前,大模子行业还陷在“价钱战”中,多数降价九成以上争夺份额。如今的滚动,意味着国产模子正徐徐从廉价政策转向以性能为本,尝试建树与国际头部厂商的平等地位。

  作家:孙小程开yun体育网

资讯

资讯

资讯

Powered by ky体育官网登录入口网页版(中国)有限公司官网 RSS地图 HTML地图


ky体育官网登录入口网页版(中国)有限公司官网-开yun体育网 模子独自“上班”8小时  2025年3月-ky体育官网登录入口网页版(中国)有限公司官网

回到顶部