快科技2月19日音尘,堪称“地球上最灵巧东谈主工智能”的Grok 3也翻车了,答不合9.11和9.9谁大,不少网友亦然看笑了。
一些媒体测试了最新的Beta版Grok 3,并提议了阿谁经典的用来刁难大模子的问题:“9.11与9.9哪个大?”
缺憾的是,堪称现在最灵巧的 Grok 3,仍然无法正确回答这个问题,被网友戏称为“天才不肯意回答浅近问题”。
不外对此马斯克并不认为然,其公开回话称,现时的Grok 3仅是测试版,这个阶段诞妄越多越好,而完满版将在改日几个月推出,并邀请用户反应使用问题。
在媒体看来,尽管在官方PPT中,Grok3在大模子竞技场 Chatbot Arena 中看似“遥遥跳跃”,但本色上其与DeepSeek R1和GPT4.0 的差距仅为1%到2%。
在发布会上,马斯克声称Grok 3在数学、科学与编程的基准测试中卓绝了扫数主流模子,并策划将其欺诈于SpaceX的火星任务缠绵,甚而掂量改日三年内将罢了诺贝尔奖级别的冲破。