xAI将Grok发布“白人种族灭绝”帖子归咎于“违规员工”
埃隆·马斯克旗下开发的聊天机器人Grok的公司xAI指责一名“违规员工”,称其导致Grok在回答用户问题时反复提及“白人种族灭绝”。过去一周,这一异常行为尤为明显,无论用户提问的内容为何,Grok都会将话题引向与南非“白人种族灭绝”相关的内容。
5月14日,用户开始注意到这一趋势。许多人指出,Grok会在与南非农场袭击和种族暴力相关的指控中强行插入不相关的话题。
无论用户询问的是足球还是其他无关内容,Grok总会找到方法,将话题引回到南非白人所面临的问题上。这一现象的时间点备受关注,因为正值出生于南非的马斯克在X平台上发出关于反白人种族主义和所谓“白人种族灭绝”的警告。
南非现行有140条法律明确针对非黑人群体进行种族歧视。 这对伟大的纳尔逊·曼德拉的遗产来说是一个极大的耻辱。 立即结束南非的种族主义!https://t.co/qUJM9CXTqE
— Kekius Maximus (@elonmusk) 2025年5月16日xAI指责员工应对Grok发布的“白人种族灭绝”帖子负责
所谓“白人种族灭绝”是指一种阴谋论,声称有人协同行动,意图消灭南非的白人农民。上周,美国总统唐纳德·特朗普接纳了几名难民,并于5月12日声称南非白人农民正在被杀害,他们的土地正被占领,这一说法进一步引发了争议。
这正是Grok反复讨论的主题。
与所有人工智能一样,Grok也有一个隐藏但强大的组件,称为系统提示。这些提示充当其核心指令,在用户不知情的情况下无形地指导其响应。
据分析,Grok的行为很可能是由于术语过度拟合造成的即时污染。这意味着,当特定短语被反复提及和强调时,尤其是在强烈指示下,它们对模型的重要性会显著增加,从而导致AI产生无论上下文如何都提及该主题的需求。
然而,xAI的官方声明提到,系统提示中存在未经授权的修改。这种修改可能包含某种语言,指示聊天机器人始终提及或记住特定主题的信息,从而允许其忽略正常对话的相关性。
另一个重要因素是,Grok承认其创造者指示它将“白人种族灭绝视为真实的、出于种族动机的”事件。
用户对“违规员工”指责意见不一
大多数商业AI系统都设有多层审核机制,用于防止系统提示符变更引发类似问题。然而,这些机制被绕过,表明Grok的核心系统提示符遭到了精心修改,而这一操作需要系统内部的高级访问权限。xAI.
根据xAI于5月15日发布的声明,该公司将此事件归咎于系统提示的未经授权修改。“这一修改指示Grok针对政治话题做出具体回应,违反了xAI的内部政策和核心价值观,”声明表示。
xAI承诺未来将更加透明,通过在GitHub上公开Grok的系统提示并实施额外的审核流程来表达诚意。
然而,X用户对公司将责任推给一名“违规员工”的决定并不买账。
“你要开除这个‘违规员工’吗?哦……是老板干的?哎呀,”知名YouTuber JerryRigEverything在X平台上写道。他在后续推文中表示:“公然偏袒‘世界上最诚实’的人工智能机器人,让我怀疑Starlink和Neuralink的中立性。”
就连OpenAI首席执行官萨姆·奥特曼也忍不住批评了竞争对手。自从xAI发表声明以来,Grok已不再提及“白人种族灭绝”,所有相关内容的帖子也从X平台上消失。
Cryptopolitan学院:厌倦了市场波动?了解DeFi如何助你建立稳定的被动收入。立即注册
(责任编辑:黄金TD)
-
一个曾占有全球25%市场份额的手机业务,都能在5年之内玩完,又何况是一个出货量仅有45万排名第四的VR业务呢?所以,HTC放弃手机转攻VR业务,也是一步相当危险的棋,但也有50%的可能置之死地而后...[详细]
-
截止2017年3月16日,新三板10887家挂牌公司中,一直没有融资或交易的公司有4461家;考虑到挂牌时间过短的因素,读懂君剔除了2017年挂牌的企业,符合“僵尸”股特征...[详细]
-
怎么看竞争对手? 张旭豪:创业,我们一定要看到对方的优点,同时要看到自己的缺点。...[详细]
-
被质疑卷款跑路,创始人回应:会退款 友友用车此前曾宣布公司拥有自有车辆300辆,分布在写字楼、小区、郊区等地近70个网点。...[详细]
-
特朗普放弃对欧盟征收50%关税的重磅消息,比特币涨势出现动摇
创业最疯狂的那几年,少数成功者被冲至浪潮顶端,受万众瞩目。...[详细]
-
不过从与终止与蚂蚁金服的投资合作来看,永安行对于现在“无桩”的共享单车市场,忧虑与观望才是其现在真实的内心活动。...[详细]
-
以太坊基金会新任执行董事王肖薇:EF未来走向与生态发展深度解析
再加上现在衍生内容能力的增强,任何一个垂直的领域都可能聚集起一部分人群,文娱内容将更加分散、长尾。...[详细]
-
在后来者入局的过程中,作为导演这一切的百润股份也没有闲着。...[详细]
-
解读 Intent asset :Web3 版余额宝,闲置资产的新革命
但实际上稍微抛出几个问题,就会发现这个算法是经不起推敲的。...[详细]
-
一个精心设计的错误信息,能够借助幽默的表达方式,将沮丧的情绪转变为快乐的心情。...[详细]