开云(中国)Kaiyun·体育官方网站 登录入口

你的位置:开云(中国)Kaiyun·体育官方网站 登录入口 > 新闻资讯 > 开yun体育网球a的质地是球b的2倍”-开云(中国)Kaiyun·体育官方网站 登录入口
开yun体育网球a的质地是球b的2倍”-开云(中国)Kaiyun·体育官方网站 登录入口
发布日期:2025-11-22 07:46    点击次数:165

开yun体育网球a的质地是球b的2倍”-开云(中国)Kaiyun·体育官方网站 登录入口

智东西

作家 | 李水青

剪辑 | 心缘

智东西11月20日报谈,当天,马斯克的xAI公司推出xAI API的两大更新:快速、低老本、以智能体为中心的新模子Grok 4.1 Fast和智能体器具xAI Agent Tools API。

Grok 4.1 Fast是其迄今为止性能最好的器具调用模子,领有撑捏200万token凹凸文的窗口,它能够准确快速地进行推理并完成智能体任务,尤其擅所长理客户撑捏和财务等复杂的试验应用场景。

▲基于Grok 4.1 Fast搭建撑捏用户改预定的应用(图源:xAI)

该模子在东谈主工智能分析智能指数(AII)中跃升4位,达到第六位,仅次于第五位的Grok 4。其中,其在智能体调用测评𝜏²-Bench Telecom名次榜上以93.3%的得分位居榜首,以更低老本突出了GPT-5.1(high)、Gemini 3 Pro等模子的性能发扬,比Grok 4 Fast提高了27分。xAI还提到,Grok 4.1 Fast在事实性方面更准确,幻觉率比Grok 4 Fast缩小了一半。

▲AII指数情况(图源:Artificial Analysis)

Agent Tools API使智能体能够拜谒及时X数据、汇注搜索、良友代码实施等功能。

Grok 4.1 Fast和Agent Tools API联接使用,使设备东谈主员能够构建特意用于器具调用和智能体搜索的出产级智能体。

智东西第一时刻对Grok 4.1 Fast进行了体验,发现正如xAI所说,其在及时信息检索成果上要比Grok 4 Fast赫然提高,但在经典编程案例发扬上比较Grok 4 Fast出现了“翻车”。这能够是其在追求更高智能体器具调用才能和速率时,亏空了特定维度的模子性能。

订价方面,Grok 4.1 Fast输入价钱为0.2好意思元/百万tokens,缓存输入价钱为0.05好意思元/百万tokens;输出价钱0.5好意思元/百万tokens,Agent Tools API调用价钱5好意思元起/1000次胜利调用。

在12月3日之前,用户两周内不错免费体验以上管事。

▲Grok 4.1 Fast及Agent Tools API订价(图源:xAI)

API地址:

https://console.x.ai/team/default/api-keys

OpenRouter体验地址:

https://openrouter.ai/x-ai/grok-4.1-fast

一、登顶智能体调用榜单,实测编程“翻车”?

Grok 4.1 Fast特意针对试验企业用例而教师,尤其在智能体调用方面提高较大。

通过在模拟环境中进行强化学习教师,Grok 4.1 Fast斗争到了涵盖数十个范围的千般器具。这千般种化的教师使Grok 4.1 Fast在τ²-bench Telecom测试中发扬出色,以更低老本跨越了GPT-5.1(high)、Gemini 3 Pro、Claude 4.5 Sonnet的性能。τ²-bench Telecom是一个极具挑战性的基准测试,用于评估智能体器具在真确客户撑捏场景中的使用情况。

▲Grok 4.1 Fast测评发扬(图源:xAI)

Grok 4.1 Fast尤其擅长器具调用。跟着设备者构建出功能越来越弘大的自主智能体,这些智能体能够进行长期规画并独处运行,模子必须在不甘休速率和老本的前提下提供智能体管事。

Grok 4.1 Fast是xAI的谜底:它是一款兼具前沿器具调用性能、极快推理速率和老本效益的模子。

▲Grok 4.1 Fast测评发扬(图源:xAI)

智能体模子濒临的一个常见挑战是,跟着凹凸文长度的增多,其性能会下落。xAI使用永劫域强化学习教师了Grok 4.1 Fast,并在意强调多回合场景,从而确保其在长达200 万个token的凹凸文窗口中保捏踏实的性能。

▲Grok 4.1 Fast测评发扬(图源:xAI)

智东西第一时刻对Grok 4.1 Fast和Grok 4 Fast进行了对比测试,发现Grok 4.1 Fast在及时信息检索方面发扬赫然优于Grok 4 Fast,但在经典编程问题上却施展失常,不如Grok 4 Fast。

当我输入经典试题:“模拟一个旋转六边形内弹跳球”,如下图所示,Grok 4 Fast在几秒内生成了正确的模拟。

▲Grok 4 Fast实测发扬(图源:智东西)

新版的Grok 4.1 Fast亦然在几秒内完成,却出现了罪责,与领导词条目不符,六角形框成果酷炫,但没出现要津的小球。

▲Grok 4.1 Fast实测发扬(图源:智东西)

当我将测试升级为:“模拟一个旋转六边形内弹跳球,有两个球体积疏浚,球a的质地是球b的2倍”,Grok 4 Fast依然能在几秒之内生成基本正确的模拟。

▲Grok 4 Fast实测发扬(图源:智东西)

但新模子Grok 4.1 Fast径直出现了黑屏情况,莫得一次模拟出条目的实验,况且无法建设胜利。这可能是由于兼顾智能体调用、速率和性能还是一件有挑战的事,但Grok 4.1 Fast是否在智能体和速率优化中亏空了部分维度性能,仍需更多案例来考证。

▲Grok 4.1 Fast实测发扬(图源:智东西)

不外,在需要依赖器具的及时检索信息上,Grok 4.1 Fast比Grok 4 Fast发扬更佳。

当我输入“对于本周xAI的病笃新闻”,如下图所示,Grok 4.1 Fast和Grok 4 Fast的输出耗时齐在几秒之内,但Grok 4.1 Fast输出的信息时效性更强、更全,秘密了“今天Grok 4.1 Fast发布”这条新闻;Grok 4 Fast未秘密到今天的最新动态。

▲Grok 4.1 Fast实测发扬(图源:智东西)

▲Grok 4 Fast实测发扬(图源:智东西)

二、联动智能体器具API,几行代码浏览网页

xAI同期推出了管事器端器具Agent Tools API,使Grok 4.1 Fast能够手脚透顶自主的智能体运行。

只需几行代码,设备者就不错让Grok浏览网页、搜索X帖子、实施代码、检索上传的文档等。

▲仅需几行代码让Grok调用器具(图源:xAI)

这些器具透顶运行在xAI的基础架构上,因此设备者无需再处分API密钥、速率甘休、沙箱或检索管谈。Grok会决定何时以及何如使用这些器具,频繁会在多个回合中并行调用多个器具,直到取得提供最终谜底所需的整个信息。

▲Agent Tools API应用案例(图源:xAI)

Agent Tools API可权贵扩张xAI基础Grok模子的功能,主邀功能包括:

搜索器具:应用及时X和互联网搜索,快速、全面地了解时局和趋势。

文献搜索:智能搜索并检索用户上传文献中的相干文档,并附上援用信息。

代码实施:在安全沙箱中实施Python代码,以分析数据并运行模拟。

MCP器具:无缝连系到外部MCP管事器,从而不错拜谒弘大的自界说第三方器具。

三、擅长及时检索和深度磋商,幻觉率缩小一半

与Agent Tools API联接使用,及时信息检索和深度磋商是Grok 4.1 Fast的一大中枢上风。凭借与X生态系统的集成和网页浏览功能,由xAI API驱动的搜索智能体在基准测试中拿下高分。

X Browse是一个里面基准测试,用于评估智能体在X上的多跳搜索和浏览才能。

Grok 4.1 Fast在事实性方面建设了新的法式,与Grok 4 Fast比较,幻觉率缩小了一半,同期在FActScore评估中仍能达到与Grok 4相当的性能。

▲Grok 4.1 Fast测评发扬(图源:xAI)

xAI将在API上发布Grok 4.1 Fast的两个变体:

grok-4-1-fast-reasoning,可达到最大智能。

grok-4-1-fast-non-reasoning,擅长即时恢复。

接下来的两周,xAI的模子和器具将在部分平台上免费提供:

xAI与OpenRouter配合,免费提供Grok 4.1 Fast。

xAI通过xAI Agent Tools API透顶免费提供整个智能体器具。

结语:聚焦智能体,大模子竞赛升级

当下,AI圈的模子和居品迭代继续齐运转聚焦智能体。这是阛阓需求倒逼技艺升级的体现,当设备者构建出功能越来越弘大的自主智能体,模子就需要提供更好的智能体管事,但又要追究不甘休速率和老本。

马斯克本次推出Grok 4.1 Fast开yun体育网,并配套提供易于集成的Agent Tools API,在一众决策中显得更强调与试验应用场景联接。围绕AI智能体买卖化落地的武备竞赛悄然升级,以xAI这种具备更强应用生态的企业具备上风。但话说回顾,模子性能的踏实依然要津,Grok 4.1 Fast的性能发扬何如,还需要更多实锻练证。



上一篇:开云体育(中国)官方网站继续形成大类钞票在短期的合伙走势-开云(中国)Kaiyun·体育官方网站 登录入口
下一篇:开yun体育网如灵验申购数目与房源数目比例达到1.1:1以上-开云(中国)Kaiyun·体育官方网站 登录入口

友情链接: