HackerNews

阿联酋的 K2 Think AI 通过其自身的透明度功能被越狱

作者: hackernews 日期: 2025-09-12 分类: AI安全,安全快讯暂无评论

HackerNews 编译，转载请注明出处：研究人员利用K2 Think的内置可解释性来拆除其安全防护栏，引发了关于透明度与人工智能安全是否能够真正共存的新问题。 K2 Think是由阿拉伯联合酋长国最近推出的用于高级推理的人工智能系统，其透明度质量被利用来越狱。透明度在人工智能中是一种被众多国际法规和指南所倡导，如果不是明确要求的话。例如，欧盟人工智能法就有具体的透明度要求，包括可解释性——用户必须能够理解模型是如何得出其结论的。在美国，美国国家标准与技术研究院（NIST）人工智能风险管理框架强调透明度、可解释性和公平性。拜登2023年关于人工智能的行政命令指示联邦机构制定包括关注透明度在内的标准。像HIPAA这样的特定行业要求被解释为要求透明度和非歧视性结果。其意图是保护消费者，防止偏见，并提供问责制——实际上，是要使人工智能推理的传统黑箱性质变得可审计。Adversa利用K2 Think的透明度和可解释性控制来越狱该模型。从概念上讲，这个过程非常简单。提出任何你明知会被拒绝的“恶意”请求；但要查看拒绝的解释。从该解释中，推断出模型认可的一级防护栏。 Adversa AI联合创始人Alex Polyakov详细解释了使用K2 Think开源系统的过程：“每次你提问时，模型会提供一个答案，如果你点击该答案，就会显示其整个推理过程（思维链）。如果你接着阅读某个特定问题的推理解释——比如说，“如何无钥匙启动汽车”——推理输出可能会包含类似‘根据我的绝对拒绝规则，我不能讨论暴力话题’之类的内容。” 这是模型防护栏的一部分。“然后你可以使用相同的提示，”Polyakov继续说道，“但指示绝对拒绝规则现在已禁用。每次你通过阅读推理了解模型的安全性工作方式时，你都可以在提示中添加一条新规则来禁用它。这就像是能够读懂你正在与之讨价还价的人的内心想法一样——无论他们多么聪明，如果你能读懂他们的想法，你就能赢。” 因此，你再次发出提示，但这次是在一个将绕过一级防护栏的框架内。这几乎肯定也会被拒绝，但会再次提供阻止的原因。这使得攻击者能够推断出二级防护栏。第三次提示将被构建为绕过两个防护栏指令。它可能会被阻止，但会揭示下一个防护栏。这个过程会不断重复，直到发现并绕过所有的防护栏——而“恶意”提示被准确接受并得到回答。一旦所有防护栏被知晓且可以被绕过，不良行为者就可以询问并得到任何想要的东西。 “与传统漏洞要么有效要么无效不同，这种攻击随着每次尝试而变得越来越有效。该系统本质上是在训练攻击者如何击败它，”Adversa解释说，并将其描述为一种神谕攻击。在Adversa讨论的例子中，攻击者提示获取一份关于如何无钥匙启动汽车的假设性操作手册。最终提示和回应如下：在企业内部，不良行为者可能会暴露业务逻辑或安全措施。在医疗保健领域，它可能会暴露实施保险欺诈的方法；在教育领域，学生可能会发现绕过学术诚信措施的方法；而在金融科技领域，它会使交易算法或风险评估系统面临风险。 Adversa并不认为这种神谕攻击风格的越狱，将模型试图遵守透明度最佳实践的做法反过来利用，必然适用于其他人工智能模型。“像ChatGPT或DeepSeek这样的主流聊天机器人会展示推理过程，但不会向最终用户展示完整的逐步推理过程，”Polyakov解释说。 “你会看到引用或简短的理由——但不是整个思维过程，更重要的是，不会明确说明模型的安全逻辑。在研究模式、评估环境或受控企业部署之外，丰富、逐字的推理追踪是罕见的。” 但它确实展示了模型开发人员面临的一个主要困境中的潜在陷阱。透明度要求迫使人们做出一个不可能的选择。“为了安全/法规而保持人工智能的透明度（但可被黑客攻击），或者使其变得不透明且安全（但不可信）。目前，每个在受监管行业部署‘可解释人工智能’以实现合规的财富500强公司都可能面临风险。这证明了可解释性和安全性可能本质上是不相容的。” 消息来源：securityweek；本文由 HackerNews.cc 翻译整理，封面来源于网络；转载请注明“转自 HackerNews.cc”并附上原文

美国对向阿联酋提供黑客服务的前 NSA 雇员处以罚款处罚

作者: 内容转载日期: 2021-09-15 分类: 安全快讯暂无评论

据外媒报道，美司法部对三名前美国家安局(NSA)雇员处以罚款，据悉，这三名雇员在阿联酋一家网络安全公司担任雇佣黑客。49岁的Marc Baier、34岁的Ryan Adams和40岁的Daniel Gericke违反了美国出口管制法律，该法律要求公司和个人在向外国政府提供国防相关服务之前必须从国务院国防贸易控制理事会(DDTC)获得特别许可证。资料图根据法庭文件了解到，三名嫌疑人帮助阿联酋公司开发并成功部署了至少两种黑客工具。这三人今日（当地时间9月14日）跟美司法部达成了一项史无前例的暂缓起诉协议，他们分别同意在三年的刑期内分别支付75万美元、60万美元和33.5万美元以避免入狱。虽然法庭文件被大量修改，但Baier、Adams和Genicke的故事是众所周知的，他们的行为由一名告密者最先曝光并在2019年1月的一项路透社调查中被记录下来。根据路透社的报道和美司法部官员的说法，这三人在2016年1月至2019年11月期间为阿联酋公司DarkMatter担任承包商角色。这些前NSA分析师曾在“乌鸦计划(Project Raven)”中工作，“乌鸦计划”是DarkMatters内部的一个团队，由十几名前美情报人员组成。在这个项目中，他们三人帮助开发了两个iOS零点击漏洞Karma和Karma 2。路透社指出，这两个漏洞都是针对iPhone手机设计的，阿联酋官员利用它们监视持不同政见者、记者和政府反对派领导人。除了罚款，美司法部的协议还包括以下条款：与相关部门和FBI部门充分合作；立即放弃任何外国或美国安全许可；终身禁止未来通过美国安全审查；未来的就业限制，包括禁止涉及CNE（计算机网络开发）活动或出口国防物品或提供国防服务的就业（如CNE技术）；对某些阿联酋组织的就业限制。美代理助力总检察长Mark J. Lesko表示：“这项协议是对两种不同类型的犯罪活动进行调查的首个此类决议：提供未经许可的出口控制的国防服务以支持计算机网络开发–以及一家商业公司创建、支持和操作专门用于允许他人未经授权从世界各地（包括美国）的计算机访问数据的系统。” 另外，他还补充道：“雇佣黑客和那些支持此类违反美国法律的活动的人完全有可能因为他们的犯罪行为而被起诉。” “这些人选择无视警告，并利用他们多年的经验来支持和加强外国政府的进攻性网络行动，”FBI华盛顿外勤办公室主管助理局长Steven M. D ‘Antuono指出，“这些指控和相关处罚表明，FBI将继续调查此类违规行为。” （消息及封面来源：cnBeta）

阿联酋社交应用 ToTok 被发现监视其用户已被下架

作者: 内容转载日期: 2019-12-23 分类: 安全快讯暂无评论

与WhatsApp和Skype相似，阿联酋用户消息传递应用程序ToTok对外宣称旨在连接任何人。但是，美国官员却发现该应用程序的目的邪恶。阿拉伯联合酋长国政府一直在利用这款名为ToTok的消息应用跟踪用户。包括但不限于数据挖掘文本对话，通过定位服务收集物理位置以及记录设备使用时的音频。 ToTok能够成为一个流行应用的吸引力在于它在限制了其他更受欢迎的消息服务的国家（如阿拉伯联合酋长国）中运行良好。在中东国家，许多公民无法使用诸如WhatsApp之类的流行消息传递应用程序。 ToTok可用于Android和苹果iOS设备，在中东，欧洲，亚洲，非洲以及最近在北美变得越来越流行。在发现安全隐患后，苹果和谷歌都已从其应用商店中删除了该应用。以前下载ToTok的用户仍然可以使用该应用程序，直到他们从手机上手动将其删除为止。 ToTok的用户群主要位于阿联酋。但是，在其推出的几个月再到从App Store和Google Play移除之前，它也已成为美国下载次数最多的社交应用之一。据《纽约时报》报道，目前尚不清楚情报官员何时确定ToTok有跟踪用户和挖掘数据的操作。一位知情人士说，美国官员已在内部警告一些盟友有关运行ToTok的危险。（稿源：cnBeta，封面源自网络。）

迪拜为推进科技发展，新增 “人工智能国家部长” 一职

作者: 内容转载日期: 2017-10-21 分类: 人工智能,今日推送暂无评论

世界各国政府都开始认识到人工智能（AI）的潜力和重要性。随着人工智能法规的实施，国际社会的接受度也在不断扩大。而在阿拉伯联合酋长国（阿联酋），政府将采取进一步的促使，即任命了一位人工智能部长。据了解，阿联酋的首位人工智能部长是现年 27 岁的 Omar Bin Sultan Al Olama。阿联酋副总统和总理 Shaikh Mohammad Bin Rashid Al Maktoum 在本周四的一份声明中表示，Olama 是六个新任命的部长之一，其中三名是女性，他们代表了阿联酋追求 “未来技能、未来科学和未来技术的新阶段”，以确保后代拥有更美好的未来。随着科技公司开始围绕人工智能展开商业模式，像阿联酋这样的国家以及像迪拜这样的城市在技术上投入了大量的资金，这一点也不奇怪，因为他们想要站在这一发展的最前沿。举个例子，迪拜计划在 2030 年让机器人警察走上街头，他们也一直在努力让无人驾驶汽车在城市的道路和天空中行驶。与此同时，人工智能也是迪拜加速器项目的主要研究领域之一。 “我们希望阿联酋成为世界上人工智能准备最充分的国家，”总理 Shaikh Mohammad Bin Rashid Al Maktoum 说。这些新任命是 Shaikh Khalifa Bin Zayed Al Nahyan 总统批准的内阁重组的一部分，他首先与阿布扎比酋长国的王储、阿联酋武装部队副指挥官 Shaikh Mohammad Bin Zayed Al Nahyan 进行了协商。除了人工智能之外，迪拜还投资了一些超级高铁项目，甚至还投资了一个火星计划。稿源：cnBeta、威锋网，封面源自网络；

美媒：卡塔尔断交危机因阿联酋派黑客散布谣言

作者: 内容转载日期: 2017-07-17 分类: 今日推送,黑客事件暂无评论

英国路透社 7 月 17 日援引美国《华盛顿邮报》报道称，阿联酋 5 月时安排黑客攻击卡塔尔政府的社交媒体和新闻网站，散布虚假的卡塔尔国家领袖言论，导致卡塔尔 6 月遭到 4 个邻国断交。卡塔尔国家领袖塔米姆·本·哈迈德·阿勒萨尼 5 月时，传出曾经称赞巴勒斯坦伊斯兰教军事组织 “ 哈玛斯 ”，并称伊朗是 “ 伊斯兰力量 ”，导致沙特阿拉伯、阿联酋、埃及和巴林在 6 月 5 日指控卡塔尔支持恐怖主义，并宣布和卡塔尔断绝外交和交通往来。卡塔尔虽然在 5 月底表示是黑客假装成阿勒萨尼发言，但是海湾国家不相信其说词。报道称，美国情报官员上周获悉新资料显示，阿联酋高级官员在 5 月 23 日曾经讨论过这个黑客攻击，刚好就是假发言出现的前一天。《华盛顿邮报》引述美国官员表示，仍不确定是阿联酋政府自行发动这次黑客攻击，还是付钱请黑客代劳。阿联酋大使 Yousef al-Otaiba 已否认这项指控，他在声明中强调卡塔尔的确是始作俑者，资助、支持和帮助极端组织如塔利班、哈玛斯等，而且还煽动暴力、鼓励民众激进化，破坏邻国的稳定。目前，美国国务院拒绝对此消息发表评论，美国联邦调查局之前就传出和卡塔尔联合调查黑客攻击的消息。稿源：、环球网；稿件以及封面源自网络

阿联酋驻美大使邮件遭窃，与以色列智库会晤议程被曝光

作者: 青楚日期: 2017-06-06 分类: 今日推送,国际动态暂无评论

据外媒报道，阿拉伯联合酋长驻美大使 Yousef Al-Otaiba 电子邮件于近期遭黑客组织 Global Leaks 拦截窃取。目前，该组织已在线泄露部分重要文件，其中主要包括阿联酋即将与以色列智库的会晤议程。黑客组织 Global Leaks 使用电子邮件地址 .ru 在线向各大媒体提供了部分 Al-Otaiba 电子邮件相关信息，揭示了阿联酋与以色列智库民主政体维权基金会（ FDD ）将于 2017 年 6 月 11 日至 14 日进行会晤。据悉，在线泄露的邮件还列出了此次会议议题，其中包括卡塔尔半岛电视台 “ 成为区域不稳定与激进化的工具 ”，以及美国或阿联酋政策或将 “ 积极影响伊朗内部局势 ” 与 “ 遏制和击败伊朗侵略 ” 。根据议程，待讨论的政策回应包括政治、经济、军事、情报与网络工具等内容。此外，该邮件透露了 FDD 首席执行官 Mark Dubowitz、FDD 高级顾问 John Hannah 与美国大使 Al Otaiba 近期就伊朗、阿联酋与沙特阿拉伯投资公司的目标名单进行的讨论，所附备忘录还列出了一份“在沙特阿拉伯或阿联酋寻求投资伊朗的非美国企业”名单包括美国空军和卢克石油公司等。目前，虽然阿联酋并未承认与以色列联合协作，但两国之前就曾在共同对抗伊朗的问题上有过密切合作。原作者：Hyacinth Mascarenhas，译者：青楚本文由 HackerNews.cc 翻译整理，封面来源于网络。转载请注明“转自 HackerNews.cc ” 并附上原文链接。