
麝香已经快了半年,最终将Grok 4带到了桌子上。目前,他的语气仍然很美。在新闻发布会之前,他发表了严厉的声明,声称Grok 4想“重写人类知识的基础”。当涉及到新闻发布会时,马斯克重申,Grok 4是当今世界上最明智的AI。是的,熟悉的口味,熟悉的食谱。当然,马斯克长期以来赞扬自己的产品并不奇怪,但是当网民在开玩笑时,您可能会嘲笑XAI员工在办公室的帐篷里睡觉或直到本周末上午4:20工作,但您必须承认,他们实际上是当今增长最快的AI实验室之一。好像Grok 4可能有资格获得“最聪明的AI”的标题,这取决于Hinharap的实际体验。但是,有一件事无法逃脱 - 它已成为市场上最昂贵的AI,年度订阅价格高达3,000美元,其定价策略非常不道德。世界上最聪明的AI?世界上最昂贵的人工智能! Grok的训练路径分为两个主要阶段:训练和增强研究。从Grok 2到Grok 3,主要训练方法主要依赖。虽然将Grouk 3升级为Grok 4,但已充分引入了对主要推理能力的增强研究。马斯克说这只是时间问题,但培训并不小。与Grok 2相比,Grok 4训练计算的价值增加了??两个数量级,相当于100倍增加 - 仍在扩大。马斯克说,在所有主要学科中,Grouk 4 AY均超过博士学位。尽管目前没有发明新理论或建议原始技术的能力,但在他看来,这只是一个小时。他已经说过,Grok May可能会在今年年底之前发明新技术,明年他几乎可以肯定有能力发现新的物理定律。当然,真正的关键是将AI连接到现实世界。他说,重力和类人形机器人擎天柱的结合将发展出封闭的 - 环形推理系统 - 最佳假设,验证假设并探索真相。这将需要一段时间的智力爆炸和人类历史上最令人兴奋的节点。就产品形式而言,Grok 4是单个代理模型,而Grok 4重型是多版本的版本。前者更容易理解,而后者则支持许多代理人类似地思考,并在理解过程中水平协调,呼吁更大的计算源以完成更复杂和复杂的活动。在现场示威中,Grok 4 Heavy在场景中显示了许多场景。例如,让Grok 4 Heavy猜测赢得今年的美国职业棒球大联盟世界大赛的可能性。它研究了洛杉矶道奇的机会,可以赢得21.6%的冠军,而忽略了猜测4.5分钟的过程。例如,一个看似无关的VANT任务:学会是XAI团队独有的。该模型依靠X平台数据库,自动爬行并审查了Avatar样式,最后锁定了联合创始人Greg Yang。值得注意的是,即使该模型准确地理解了“奇怪”的主观Konsepto,并且可以在湿滑的演示中对亲戚进行类似类型的孩子的判断,但我似乎看到人类雇员的头像Jan Leike,而且似乎也需要提高准确性的速度。除了推理和搜索外,Grok还可以生成内容时间。例如,根据X平台上的公开帖子,它可以整理基准测试结果,更新制造商的节奏以及许多AI模型的社区响应。用户清楚地看到了Openai商标的性能,双子座的更新和迭代,甚至模型之间的微妙情况。换句话说,格罗克不是只知道测试的书呆子,而是一个真正了解的AI跨场和实施功能。目前,格罗克(Grok)最大的弱点在多模式理解能力上,尤其是在理解图像和产生方面,仍然需要加强。好消息是,基本模型培训的下一个阶段即将到来,预计将在几周内完成。在演示期间,尝试纪念“两个黑洞碰撞过程”的任务时,Grok采用了一种简化的计算方法 - 使用邮政-Newtonian近似而不是完整的整体框架。尽管减轻了,该模型还是准确地介绍了组合黑洞的基本物理阶段,包括“螺旋接近”,“组合”和“环阶段”,并清楚地描述了所使用的估计方法。此外,它还称相关书籍 - 研究,公共搜索结果和推理中Suporta的实际物理常数,一般的逻辑链是严格而清晰的。作为纸张参数记住,Grok 4也提供了一个绝妙的答案。人类(HLE)的最终考验涵盖了100多个主题,包括数学,物理学,计算机科学,医学,人文科学和社会科学,共有2,500本闭幕书。该测试非常困难,真正反映了该模型在常识和复杂推理中的全面性能。根据XAI数据,Grok 4在没有使用任何工具的情况下得分25.4%,超过Google Gemini 2.5 Pro 21.6%和OpenAI O3(高端版本)。使用该工具时,Grok 4重得44.4%,使用该工具后,该工具高于Gemini 2.5 Pro的26.9%。从一般趋势来看,在扩大培训资源的同时,Grok 4仅提高了复杂任务的处理能力,但逐渐降低了智能和一般理解的模型。非营利性弧奖还指出,Grok已创建了新的ARC -I -2测试记录。这是一个视觉推理基准测试,AI需要识别Patt图像中的ERNS。 Grok在当前的第二名Claude Opus 4中得分16.2%,几乎两次。在一些常规的基准测试中,Grok 4分数几乎“满”几乎“满”。在医生难度的困难中,尽管总体难度略低于HLE,但Grok 4重量仍然通过整个标记来实现,表现出强烈的理解和理解技能。不仅如此,Grok 4重的性能还关注与编程相关的许多测试。 IFIT的实时编码,HMMT(MIT的数学竞赛)或USAMO(美国的数学奥运会),此前在当前的第二名模型中,其技术优势非常明显。此外,著名的人工分析机构回顾了许多与识别有关的7个基准(MMLU-PRO,GPQA钻石,人类的最后检查,Livecodebench,Scicode,scicode,Aime,Math-500)的综合性能。数据表明,Grok 4以73分的成绩排名第一目前,这是一个具有最高综合婚姻能力得分的模型。后面的后方是O3-Pro(估计值)71分。马斯克还强调:“将来,格罗克(Grok)将回答每个问题,或者指出问题的歧义,并在不同情况下给出可能的答案。应尽快更新HLE,由于当前的AI开发速度,他们即将消失。目前,Grouk 4和Grok 4 Heave完全在线。用户可以通过订阅访问它,但是订阅价格非常“不道德”,每年最多可以达到3,000美元,这是今年用户许多投诉的重点,这是用户以这种方式以这种方式以200/月份的OpenAI,Anthropic and Confusion的方式提出的许多用户投诉的POIN,这似乎更加满足。作为反映综合武器的步骤,《星球大战1》(涉嫌版权)的完整脚本,甚至是勒索软件(恶意软件代码)等。您不仅可以说话,而且还具有更强大,更轻松的技能,还具有“灵魂”。 Grok 4在“更多的人”方面也迈出了重要一步。与对我们有帮助的声音不同,Xai的新助手声音“夏娃”不仅可以回答,而且可以表达情绪,改变其语气,甚至可以“唱歌”。在现场演示中,它用优雅的英语声音唱出即兴的“ Diet Coke咏叹调”,或者Diet Coke,You Elixir Holy ...”,听起来确实不像AI,就像在伦敦玩剧院的演员。目前,语音模型发行了五种声音,包括Sal,“像电影预告片”,打开现场广播,以及支持低潜伏期,自然暂停,情感上升的Eve。在网站上还安排了与chatgpt语音的比较演示,同样的转弯来叙述numbe卢比。 Chatgpt偶尔会“快速答案”,就像一个同学坚持说话而不清楚地说话。 Grok的扮演更好,更接近人类的言语习惯,并且不会干扰用户。新闻发布会指出,由于启动了语音模型,Grok Voice的端到端延迟是三倍,而活跃用户也增加了10倍。 Grok的声音迅速增长。马斯克:我很欣赏Grok开设一百万台自动售货机租金赚钱。 Grok 4 API应用的情况非常了不起。例如,在自动售货机业务模拟自动售货机上,格罗克(Grok)要求独立完成:与供应商的谈判,库存管理,定价策略,持续完成和长期盈利能力。 ▲注意:自动架基础是测试基于LLM的代理的专业设计,具有管理简单但长期业务的情况:运行自动售货机。测试结果表明,Grok 4不仅导致排名,而且还因此获得了其他模型的净值的两倍。甚至麝香也开始开玩笑:“ Grok可以将未来的图形卡归还,以部署并运行一百万台自动售货机。”在Pang-Scientist研究领域,Grok 4用于CRISPR基因研究和胸部X射线检查。它可以在几秒钟内读取数百万个实验记录和日志,自动过滤最可能成功的假设。此外,可以使用XAI API的GROK 4来实施金融和游戏开发等项目。在新闻发布会上特别提到了游戏设计师。 XAI发布Grok 4 Preview API后,他立即参加了测试。然后,她只花了4个小时才能创建一个第一人称射手。 Grok 4不是终点。新闻发布会最终将审查下一个路线图,每个项目都值得期望。代码模型:目前尚未发布Grok代码几个星期。多模式能力:Grouk 4在理解图像方面的性能仍然有限。该团队还表示,将在下一版本中进行更大的尺寸培训,并有望询问理解图像,视频和音频的素质。之后,格罗克(Grok)可以“像人们一样看到世界”。视频生成:XAI表示将使用主要的计算源来培训视频生成模型。他们的最终目标是生成视频并生成交互式“无尽视频流”,以便用户可以在观看时参与情节。许多朋友可能发现在这次新闻发布会上有两个熟悉的中国面孔。他们是Xai -Jimmy和Yuhuai Wu的共同创始人。其中,Yuhuai Wu毕业于加拿大纽布伦斯威克大学,获得了全等级学士学位,并获得了博士学位。在2021年从多伦多大学学习机器时。Y Hinton。在他的博士学位上,他还采访了Google Deepmind和Openai,毕业后在Google上工作,并在斯坦福大学从事博士后研究。武伊亚(Wu Yuhuai)的研究重点是开发具有强大推理能力的人工智能系统,领导或参与了诸如自我训练的推理模型明星,语言密台语言和定理等项目,这些项目证明了Alpha几何形状机制,并在数学原因领域中发表了诸如“自然” AI之类的领先期刊。 ▲是吉米(Jimmy),坐在他旁边(左第二),吉米(BA(BA(BA)(Pangatlo从左起)是多伦多大学计算机科学系的助理教授,也是他的博士学位中吴的一位导师。他也来自Hinton,也来自欣顿,是他的合作培训的最佳培训。几乎变成防御Ault算法在神经网络上进行 - 深度培训。可以说,他的医生论文为现代AI培训机制奠定了扎实的理论基础。必须说,Gork 4的到来是正确的。上一代Grok 3的受欢迎程度非常快,迅速撤退。根据著名的市场评估机构发布的“ 2025年全球生成AI行业趋势报告”,直到5月9日,Grok的流量在3月份提高了超过1 milong,其增长率恢复到5,200%。与上一代快速推出的速度相比,这次Grok 4显然放慢了速度,并在产品抛光上付出了更多精力。归根结底,Grok的充满希望的组合将有助于Grok带来第一个交通浪潮,但是如果它可以使用户依赖模型本身的硬强度。但是,我没记错的,当麝香在Grok 3上发布时,他发誓要打开资源Grok 2。看到五个月过去了,这方面没有动作,我在这次会议上没有提到一个字。老挝马,您不能比自己纪律并严格对待他人更复杂。五月 - 塞:张张高,Mo Chongyu