AI圈地震!神秘模型Quasar Alpha横空出世,剑指OpenAI?
最近,AI圈可是炸开了锅!一个名叫“Quasar Alpha”的神秘AI模型突然冒了出来,迅速蹿红,在OpenRouter平台上成了编程类AI模型里的Top1。据说用过的都说好,甚至有人评价它“比现在出现的任何模型都要好”!更刺激的是,各种迹象表明,这货很可能就是OpenAI的新版本模型,只不过换了个马甲!
Quasar Alpha是几天前才露面的,带着百万token的超长上下文窗口,处理长文本和复杂文档那是小菜一碟。代码生成能力杠杠的,指令执行那叫一个到位,还支持联网和多模态功能,最关键的是,现在完全免费用!这还没完,Quasar Alpha火了之后,昨天又冒出一个“Optimus Alpha”,同样是免费开放,这下更热闹了!
Quasar Alpha、Optimus Alpha到底啥来头?
官方说法是,Quasar Alpha是个伪装过的通用模型,目的是收集用户反馈。你的所有提示和生成内容都会被记录下来,用来改进模型。简单来说,就是个“测试版”,让大家来找茬的。
Quasar Alpha最大的亮点就是那个百万token的上下文处理能力。这相当于一次性处理几百页的文档!在需要深度理解和复杂推理的场景下,简直是神器。它还特别针对编码任务做了优化,代码写的又快又好。但它本质上还是个通用AI工具,从文本生成到数据分析,啥都能干。这种既专业又通用的设计,让Quasar Alpha在众多AI模型中脱颖而出,用户那是蹭蹭往上涨。
从OpenRouter的数据来看,Quasar Alpha已经迅速跻身五大用例类别的前十名。Roo Code和Cline这两款知名的AI编码VS Code扩展都在用它,说明Quasar Alpha的稳定性还是靠谱的。
另一款神秘模型Optimus Alpha,同样拥有百万token上下文窗口,编码能力也是一流。不过,Optimus Alpha更侧重于通用任务,适用于现实世界中的各种应用场景。目前也有不少知名应用在调用它。
更牛的是,Optimus Alpha还为300多家模型及供应商提供了一个与OpenAI兼容的API,你可以直接调用它,也可以用OpenAI的SDK。用起来那是相当方便。
蛛丝马迹指向OpenAI?
Quasar Alpha和Optimus Alpha的神秘背景,也引发了AI社区的各种猜测。它们到底是谁家的?有人说是OpenAI或Google的实验性项目,甚至可能是下一代旗舰模型的测试版。
有网友发现,Quasar Alpha的风格和OpenAI的顶级模型GPT-4o非常相似,让人不得不怀疑它是不是OpenAI的“马甲”。
还有更多技术细节被曝光,指向OpenAI:
- Quasar Alpha的工具调用ID格式与OpenAI一致。
- 它还支持“name”字段,目前只有xAI和OpenAI支持这个字段。
- 生成细节中的upstream ID与OpenAI相同。
- 存在一些与OpenAI高度相似的层次聚类模式。
一位AI研究员用生物信息学聚类工具分析了模型输出结果,发现Quasar Alpha与OpenAI的模型极为相近,尤其是与GPT 4.5预览版,和其他模型则差异明显。
更巧的是,有外媒报道OpenAI即将推出一系列全新AI模型,包括GPT-4o的升级版GPT-4.1,以及更轻量级的GPT-4.1 mini和nano版本。
种种迹象表明,Quasar Alpha很可能就是OpenAI的“秘密武器”。有人猜测,Quasar Alpha可能是GPT-4.1,而Optimus Alpha是GPT-4.1 mini。甚至有人说是OpenAI的o4-mini-low模型,感叹OpenAI真是营销鬼才。
OpenAI的CEO Sam Altman也公开称赞Quasar Alpha,说它是“非常明亮的事物”。这波操作,更让人浮想联翩。
至于为什么秘密发布?有人认为,这样能在真实环境中收集到开发者最真实的反馈,而且低调点可以减轻压力。同时,也能让这款模型更公平地与其他模型进行比较,避免受到营销宣传的干扰。
Quasar Alpha的“隐秘”标签也让人好奇它的成熟度和稳定性。虽然它在编码和长上下文任务中表现出色,但在其他通用场景下的全面性能还需要进一步验证。
Quasar Alpha性能超越任何现有模型?
目前的用户反馈显示,Quasar Alpha在编程和指令执行方面确实很强。
开源AI配对编程工具Aider的作者表示,Quasar Alpha运行速度很快,在Aider多语言编码基准测试中表现出色,可以和o3 - mini - medium、DeepSeek V3以及Claude 3.5 Sonnet一较高下。
还有用户表示,Quasar Alpha在遵循指令方面比Claude 3.5 Sonnet和Gemini 2.5 Pro都强,给出的输出结果也是目前为止见过的最佳。
一位模型体验者在手动测试Optimus Alpha和Quasar Alpha后表示,在复杂的SQL查询生成任务中,这两款模型是目前市面上最强大的选择。
从公布的数据来看,Optimus Alpha和Quasar Alpha的性能甚至超越了一些老牌经典模型。Optimus Alpha的平均得分达到了0.83,而Claude 3.7 Sonnet只有0.66。Gemini 2.0 Flash和Grok 3的得分也分别只有0.717和0.747。更重要的是,这两款模型还完全免费!
在测试中,他尝试使用大模型处理股市变化的复杂性。比如,如何使用大模型回答“在市值超过200亿美元的企业股票中,哪些股票的RSI指标最低?”。流程是:大模型将自然语言问题转换为数据库查询;执行查询;另一大模型对输出进行“评分”,确保结果合理;不断生成查询,直到结果准确无误。
为了评估各模型,他使用了开源EvaluateGPT进行测试,结果出人意料。Quasar Alpha和Optimus Alpha的表现远远优于其他所有模型,Optimus Alpha还是响应速度最快的模型之一。
在成本方面,Quasar Alpha和Optimus Alpha的输入和输出都是免费的!而成本第二低的是Gemini 2.0 Flash,每百万输入token的成本为0.10美元,每百万输出token的成本为0.40美元。
Starks认为,这些“世外高手”般的模型正在重新定义零成本的可能性。虽然后续情况可能会发生变化,但现在确实可以随便用!