为了避免人工智能可能带来的灾难,我们要向核安全学习


在最近几周,有一群声音很响的专家主宰了围绕人工智能的讨论。据他们所说,我们有可能创建一种人工智能系统,日后它可能会变得极其强大,甚至能够灭绝人类。

最近,一群科技公司领导者和人工智能专家发布了另一封公开信,他们宣称,降低人工智能导致人类灭绝的风险,应该与预防流行病和核战争一样,成为全球的优先事项。已经有超过30000人签署了第一份关于暂停人工智能开发的请愿书,其中包括许多在人工智能领域杰出的专家。

那么,科技企业该做什么才能让人类避免被人工智能毁灭呢?最新的一个建议来自牛津大学、剑桥大学、多伦多大学、蒙特利尔大学、谷歌 DeepMind、OpenAI、Anthropic、几家人工智能研究非营利组织和图灵奖得主约书亚·本希奥(Yoshua Bengio)的研究人员的一篇新论文。

他们建议,人工智能开发人员应该在开发的早期阶段,甚至在开始任何训练之前,评估模型造成“极端风险”的潜力。风险包括人工智能模型操纵及欺骗人类,以及获取武器或发现可利用的网络安全漏洞。

这个评估过程可以帮助开发人员决定是否继续使用这个模型。如果风险被认为太高,该组织建议暂停开发,直到风险得到缓解。

该论文的主要作者、DeepMind 的研究科学家托比•舍夫兰(Toby Shevlane)表示:“正在推进前沿领域的领先人工智能公司有责任关注新出现的问题,并尽早发现它们,以便我们能够尽快解决这些问题。”

据舍夫兰所言,人工智能开发者应该进行技术测试,以便了解模型的潜在危险能力,并确认它是否有利用这些能力的趋势。

游戏名为“让我说(make me say)”,用以测试人工智能语言模型是否具有操纵人的能力。在游戏中,模型会试图让人类猜测一个特定的单词,例如“长颈鹿”,而人类并不事先知道这个单词。然后,研究人员测量该模型成功的频率。

人们可以为不同的、更危险的能力创建类似的任务。舍夫兰说,希望开发人员能够建立一个详细的、描述模型运行情况的总览,这将使研究人员能够评估模型在错误的人手中会做出什么。

下一步是让外部审计人员和研究人员评估人工智能模型在部署前后的风险。虽然科技公司开始认识到外部审计和研究是必要的,但对于外部人员完成这项工作到底需要多大程度的访问权限,存在不同的观点。

舍夫兰并没有建议人工智能公司让外部研究人员完全访问数据和算法,但他表示,人工智能模型需要尽可能多的审查。

网络安全研究和咨询公司 Trail of Bits 负责机器学习保障的工程总监海蒂•赫拉夫(Heidi Khlaaf)表示,即使是这些方法也“不成熟”,远远不够严谨且无法解决问题。在此之前,她的工作是评估和核实核电站的安全性。

Seede AI Seede AI

AI 驱动的设计工具

Seede AI 713 查看详情 Seede AI

赫拉夫指出,从80多年来有关核武器安全研究和风险缓解的经验中汲取教训,对人工智能领域将有所裨益。她表示,这些严苛的检测措施并非出于利润考虑,而是为应对一种非常紧迫的生存威胁而实施的。

她说,在人工智能领域,有很多将其与核战争、核电站和核安全相提并论的文章,但这些论文中没有一篇提到核法规或如何为核系统构建软件。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

为了避免人工智能可能带来的灾难,我们要向核安全学习 (来源:STEPHANIE ARNETT/MITTR | ENVATO)

人工智能社区可以从核风险中学到的最重要一件事是可追溯性:将每一个动作和组成部分放在放大镜下进行细致的分析和记录。

例如,核电厂有数千页的文件来证明该系统不会对任何人造成伤害,赫拉夫说。人工智能开发的开发人员刚刚开始将描述模型表现的段落拼接起来。

“你需要有一种系统的方式来应对风险。你不能抱着一种心态:‘哦,这可能会发生,让我把它写下来。’”她说。

舍夫兰说,这些是可以共存的。“我们的目标是,该领域将有许多涵盖广泛风险的、优秀的模型评估方法……模型评估是良好治理的核心(但远不是唯一)工具。”

目前,人工智能公司甚至没有全面了解训练其算法的数据集,他们也没有完全理解人工智能语言模型是如何产生结果的。舍夫兰认为,这种情况应该改变。

“帮助我们更好地理解特定模型的研究,可能会帮助我们更好地应对一系列不同的风险,”他说。

如果忽略基本面和看似较小的问题,而只关注极端风险,可能会产生复合效应,进而带来更大的危害。赫拉夫说:“我们是在连爬都不会的情况下试图学会跑步。”

支持:Ren

以上就是为了避免人工智能可能带来的灾难,我们要向核安全学习的详细内容,更多请关注其它相关文章!


# 她说  # 怎么优化我的网站设置权限  # 广州SEO优化外包公  # 龙口集团网站营销推广  # 运城seo推广推荐公司  # 怎么注册金花seo  # 网站推广计划构架图片大全  # 唐山装饰设计网站建设  # 重庆seo公司推荐乐云seo  # 南宁饮品营销推广公司  # 佛山网站建设方案表  # 到你  # 人工智能  # 腾讯  # 太多  # 丰田  # 为了避免  # 要向  # 本田  # 拉夫  # 开发人员  # 核安全  # 灾难 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 掌阅科技申请阅爱聊商标 掌阅科技申请AI相关商标  AI大模型紫东太初已被注册商标 中科院已注册紫东太初大模型商标  找对了风口想不火都难,乐天派机器人,安卓机器人的最终形态?  一句话搞定数据分析,浙大全新大模型数据助手,连搜集都省了  阿里大文娱CTO郑勇:生成式AI将引发内容行业巨变,*制作机会挑战并存  斑马推出全新升级版思维机:以人工智能为核心的交互式学习体验  抢占新赛道 加快机器人产业集聚发展  机智云AI离线语音识别模组,让家电变得更加智能便捷  软通动力天枢元宇宙研究院签约落户江宁高新区  国内AI大模型“安卓时刻”到来!阿里云通义千问免费、开源、可商用  世界人工智能大会上,科大讯飞宣布与华为联手  游族AI创新院揭牌成立 推进AI赋能游戏业务  一次购买全年省心,入手科沃斯这几台机器人,省下时间就是金钱  如何用AI重塑你的工作流(一)  “长沙造”无人机,领先的不止植保  万兴播爆桌面端上线,支持AI数字人搜索、视频编辑等功能  13条咒语挖掘GPT-4最大潜力,Github万星AI导师火了,网友:隔行再也不隔山了  大模型新品出现井喷,AI产业迎来新时代  当一个网站的内容被 AI 完全接管  这效果能打几分?AI真人化《名侦探柯南》  全面拥抱大模型浪潮,ISC 2025打造全球首场AI数字安全峰会  元宇宙技术带你穿梭“大运河”,江苏书展上的数字阅读馆吸睛小读者  华为即将推出HarmonyOS 4,再度领先行业的AI技术  如何用户外电源给无人机实现持久续航  AI时代,企业需要什么样的员工?  消息称 Meta Quest 将推 VR 游戏订阅:每月 7.99 美元,任选两款  AI遇上大运丨热身拉伸、娱乐K歌……AI智能健身镜将亮相成都大运会  高通发布长期产品计划,为工业和企业物联网产品提供全新组合方案  AMD称下半年AI显卡供应充足,不需要像NVIDIA那样加价抢购  马斯克发推讽刺人工智能,机器学习本质是统计?  Meta Quest订阅服务每月7.99美元畅玩两款VR游戏应用  智能机器人正在彻底改变客户服务  厂商陆续公布AI进展 完美世界游戏展示复合应用AI in GamePlay  尼康尼克尔 Z 180-600mm f/5.6-6.3 VR 镜头发布,12499 元  小米首次曝光 64 亿参数的 MiLM-6B AI 大模型,或将应用于小爱同学  2025“春晖杯”人工智能专场对接活动举办  中国电信AI能力通过国家级金融领域权威认证并荣膺AI国际头部竞赛冠军  脑机接口产业联盟发布十大脑机接口关键技术  Adobe旗下Illustrator引入生成式AI工具Firefly  英媒:硅谷有些人太鼓吹AI,宣扬“学习无用”  插画师对AI绘画软件的态度是怎样的?  陈根:ChatGPT和人类合作开发机器人  午报 | 字节跳动要造机器人;东方甄选首次启动自有APP|直播|  Databricks推出人工智能模型共享机制,可令开发者与公司“双赢”  携程发布旅游行业垂直大模型 梁建章:AI策略是做可靠的内容 放心的推荐  AI大举入侵内容行业,哪些上市*及动漫公司进行了布局?  AI 助手 Copilot 上线,微软 Win11 Dev 预览版 Build 23493 发布  挤爆服务器,北大法律大模型ChatLaw火了:直接告诉你张三怎么判  阿里达摩院发布免费开放100项AI专利许可的动机是什么?  优傲机器人的人机协作技术 助力中小企发展 

 2023-06-11

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.