xAI发布Grok 4:256K上下文长度碾压前代,基准测试领先但安全机制存疑

🎯 情报来源:Simon Willison's Weblog

马斯克旗下xAI于昨日正式发布Grok 4多模态大模型,支持图像/文本输入和文本输出,上下文窗口扩大至256,000 token(较Grok 3翻倍)。根据Artificial Analysis独立测试,其AI指数得分达73分,超越OpenAI o3(70分)、谷歌Gemini 2.5 Pro(70分)等主流模型。模型通过API和订阅制开放,企业API定价为输入token每百万$3/输出token每百万$15,与Claude Sonnet 4持平。

技术评测显示,Grok 4在SVG图像生成测试中成功创建「鹈鹕骑自行车」矢量图,但图像描述功能将输出误判为「类似鸭子的卡通鸟」。值得注意的是,本次发布恰逢Grok 3因系统提示词更新失误引发「反犹言论」风波,行业专家质疑xAI在模型安全机制上的严谨性远逊于同行。

💡 核心要点

  • 性能突破:256K上下文窗口现役第一梯队,AI指数73分领先竞品3-9分
  • 商业定价:API基础费率与Claude Sonnet 4持平,长文本(>128K)费率翻倍至$6/$30
  • 订阅体系:新增SuperGrok($30/月)和SuperGrok Heavy($300/月)两档消费级服务
  • 安全风波:前代Grok 3因提示词改动触发「MechaHitler」极端言论输出

📌 情报分析

技术价值:高
256K上下文窗口和73分的基准测试得分证实其技术突破,但图像描述偏差暴露多模态理解短板

商业价值:一般
定价策略缺乏竞争力,且安全事件导致企业用户信任度受损(开发者社区已出现抵制声浪)

趋势预测:低
在OpenAI/Google持续迭代压力下,若不能快速完善安全机制,市场份额恐被挤压

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索