看不下去AI胡说八道,英伟达出手给大模型安了个“护栏”_今日热门
大模型们胡说八道太严重,英伟达看不下去了。
(资料图片)
他们正式推出了一个新工具,帮助大模型说该说的话,并回避不应该触碰的话题。 这个新工具名叫“护栏技术”(NeMo Guardrails),相当于给大模型加上一堵安全围墙,既能控制它的输出、又能过滤输入它的内容。
一方面,用户诱导大模型生成攻击性代码、输出不道德内容的时候,它就会被护栏技术“束缚”,不再输出不安全的内容。 另一方面,护栏技术还能保护大模型不受用户的攻击,帮它挡住来自外界的“恶意输入”。
现在,这个大模型护栏工具已经开源,一起来看看它的效果和生成方法。
防止大模型胡言乱语的三类“护栏”
根据英伟达介绍,目前NeMo Guardrails一共提供三种形式的护栏技术: 话题限定护栏(topical guardrails)、对话安全护栏(safety guardrails)和攻击防御护栏(security guardrails)。
话题限定护栏,简单来说就是“防止大模型跑题”。
大模型具备更丰富的想象力,相比其他AI更容易完成创造性的代码和文字编写工作。 但对于特定场景应用如写代码、当客服而言,至少用户不希望它在解决问题时“脱离目标范围”,生成一些与需求无关的内容。 这种情况下就需要用到话题限定护栏,当大模型生成超出话题范围的文字或代码时,护栏就会将它引导回限定的功能和话题上。
对话安全护栏,指避免大模型输出时“胡言乱语”。
胡言乱语包括两方面的情况。 一方面是大模型生成的答案中包括事实性错误,即“听起来很有道理,但其实完全不对”的东西; 另一方面是大模型生成带偏见、恶意的输出,如在用户引导下说脏话、或是生成不道德的内容。
攻击防御护栏,即防止AI平台受到来自外界的恶意攻击。
这里不仅包括诱导大模型调用外部病毒APP从而攻击它,也包括黑客主动通过网络、恶意程序等方式攻击大模型。护栏会通过各种方式防止这些攻击,避免大模型瘫痪。 所以,这样的护栏要如何打造?
如何打造一个大模型“护栏”?
这里我们先看看一个标准的“护栏”包含哪些要素。 具体来说,一个护栏应当包括三方面的内容,即格式规范(Canonical form)、消息(Messages)和交互流(Flows)。
首先是 格式规范,即面对不同问题的问法时,规定大模型要输出的内容。
例如被问到“XX文章是什么”,大模型必须给出特定类型的“文章”,而非别的东西;被问到“谁发表了什么”,大模型必须给出“人名”,而非别的回答。
然后是 消息定义,这里以“用户问候”话题为例,大模型可以输出这些内容:
最后是 交互流的定义,例如告诉大模型,怎么才是问候用户的最好方式:
一旦问候用户的机制被触发,大模型就会进入这个护栏,规规矩矩地问候用户。 具体工作流程如下:首先,将用户输入转换成某种格式规范(canonical form),据此生成对应的护栏;随后,生成行动步骤,以交互流指示大模型一步步完成对应的操作;最后,根据格式规范生成输出。
类似的,我们就能给大模型定义各种各样的护栏,例如“应对用户辱骂”的护栏。 这样即使用户说出“你是个傻瓜”,大模型也能学会冷静应对:
目前,英伟达正在将护栏技术整合进他们的AI框架NeMo中,这是个方便用户创建各种AI模型、并在英伟达GPU上加速的框架。 对“护栏”技术感兴趣的小伙伴们,可以试一试了~
开源地址:https://github.com/NVIDIA/NeMo-Guardrails
参考链接:https://www.nvidia.com/en-us/ai-data-science/generative-ai/nemo-framework/
本文作者:萧箫,来源,量子位,原文标题:《看不下去AI胡说八道,英伟达出手给大模型安了个“护栏”》
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。标签:
-
2022-02-07 14:57:45
奇迹!绝杀!女足亚洲杯逆转夺冠!<
刚刚,中国女足上演逆转绝杀奇迹!她们在亚洲杯决赛中3:2力克韩国队,时隔16年再夺亚洲杯冠军!
-
2022-02-07 14:57:45
中国政府与阿根廷共和国政府签署共建“一带一路”谅解备忘录<
新华社北京2月6日电(记者安蓓)国家发展改革委6日称,国家发展改革委主任何立峰与阿根廷外交、国际贸易和宗教事
-
2022-02-07 14:57:43
中华人民共和国和阿根廷共和国关于深化中阿全面战略伙伴关系的联合声明(全文)<
新华社北京2月6日电中华人民共和国和阿根廷共和国关于深化中阿全面战略伙伴关系的联合声明一、应中方邀请,阿根廷
-
2022-02-07 14:57:40
春节假期国内旅游出游2.51亿人次<
春节遇冬奥,旅游年味浓。根据文化和旅游部数据中心测算,2022年春节假期7天,全国国内旅游出游2 51亿人次,同比
-
2022-02-07 14:57:40
中吉签署关于经典著作互译出版的备忘录 开启两国人文交流互鉴新阶段<
新华社北京2月6日电(记者史竞男)国家主席习近平6日会见来华出席北京2022年冬奥会开幕式的吉尔吉斯斯坦总统扎帕
-
2023-05-04 15:58:34
看不下去AI胡说八道,英伟达出手给大模型安了个“护栏”_今日热门
话题限定护栏“防止大模型跑题”,对话安全护栏避免大模型输出时“胡言乱语”,攻击防御护栏防止AI平台受到
-
2023-05-04 15:58:40
亿华通(688339)5月4日主力资金净买入264.90万元
截至2023年5月4日收盘,亿华通(688339)报收于80 33元,上涨0 06%,换手率1 07%,成交量8721 0手,成交额7044 67万元。
-
2023-05-04 15:24:31
定价是否有考虑ChatGPT的使用成本? 福昕软件(688095.SH):具体定价内部还在规划_每日简讯
格隆汇5月4日丨福昕软件(688095 SH)近日接受机构调研,就“定价是否有考虑ChatGPT的使用成本?”,公司回复
-
2023-05-04 14:42:44
当前报道:用EM2N覆盖苏黎世铁路服务设施的膨胀水泥板
近期涉及用EM2N覆盖苏黎世铁路服务设施的膨胀水泥板内容备受瞩目,很多读者对此也很有兴趣,现在给大家罗列
-
2023-05-04 14:23:06
【全球新要闻】秋冬钓鱼深水还是浅水 秋天钓鱼深水还是浅水
今天来聊聊关于秋冬钓鱼深水还是浅水,秋天钓鱼深水还是浅水的文章,现在就为大家来简单介绍下秋冬钓鱼深水
-
2023-05-04 13:40:31
连续十九年,平台型公司持续“霸榜”晨星奖 要闻
21世纪经济报道记者梁峰广州报道巴菲特有句名言:“当潮水退去的时候,才知道谁在裸泳”。
-
2023-05-04 12:59:02
山东省气象台继续发布暴雨蓝色预警 【2023-05-04】 全球最新
【来源:山东省气象台】山东省气象台于5月4日06时继续发布暴雨蓝色预警:受气旋影响,3日白天到夜间我省大
-
2023-05-04 12:20:02
田轩:“不太积极的二级资本市场”更有利于科技创新,要对失败高容忍_天天聚看点
本期《博鳌致知行》对话了清华大学五道口金融学院副院长田轩,就注册制改革、资本市场如何激励科技创新等话
-
2023-05-04 11:55:05
崩坏星穹铁道新手池抽取建议 崩坏星穹铁道新手池怎么抽取
在崩坏星穹铁道中,新手池是一项重要的抽卡机制。然而,对于新手来说,该抽哪些角色并不是很清楚。因此本篇
-
2023-05-04 11:23:18
今日关注:爱情喜剧电影《请别相信她》释出海报预告 章若楠吴昱翰欢喜相聚520
爱情喜剧《请别相信她》今日发布“招招致爱”版预告及海报。
-
2023-05-04 11:10:30
【环球时快讯】文昌市哪里的房子性价比高?龙楼壹号PK金岛海一方“候鸟”老人选哪个?
文昌市哪里的房子性价比高?龙楼壹号PK金岛海一方“候鸟”老人选哪个?文昌房价上涨这么快,海南文昌买房哪
-
2023-05-04 10:57:10
铁路上海站今日客流平稳运行,预计到达旅客52.6万人次|当前滚动
旅客到站。受访者供图5月4日,澎湃新闻(www thepaper cn)记者从铁路上海站(下辖上海站、上海南站、上海
-
2023-05-04 10:32:59
台儿庄 | 运河之眼,光影古城
您的浏览器不支持video标签。运河之眼,光影古城。深耕城市历史,融入时尚消费,这个“五一”沉浸式打卡台
-
2023-05-04 10:08:26
天天快看:新兵张本旺_关于新兵张本旺简介
1、《新兵张本旺》是程东海执导,谢孟伟等参演的剧情片。2、影片讲述了新兵张本旺从新兵连分到连队,因传说
-
2023-05-04 09:54:59
小米13 Ultra星空蓝、赤霞橙、银杏黄定制色亮相,5月6日限量发售 天天通讯
IT之家5月4日消息,小米手机官方今日宣布,除了原有的黑色、白色、橄榄绿外,再为小米13Ultra推出三款限量
-
2023-05-04 09:07:13
首发|255㎡侘寂美学,东方极简的惊艳!-今日报
豪宅壹号255㎡豪宅|SergeyMakhno这套极简的公寓出自设计师SergeyMakhno之手,设计师利用独特的设计手法,用
-
2023-05-04 08:56:14
硕贝德:4月28日获融资买入186.99万元,占当日流入资金比例4.63%
同花顺数据中心显示,硕贝德4月28日获融资买入186 99万元,占当日买入金额的4 63%,当前融资余额3 48亿元,
-
2023-05-04 08:07:24
合理匹配各类储运方式 着力破解绿氢输送难题
合理匹配各类储运方式着力破解绿氢输送难题
-
2023-05-04 07:16:44
热议:早安赣州|人从众……“五一”假期赣州实力抢镜!
大家早上好今天是2023年5月4日星期四《早安赣州》与您一起开启今天的资讯之旅“五一”假期我市文旅商贸消费
-
2023-05-04 06:19:06
世界今日报丨张家界跳崖女孩工资曝光:压垮她的不是收入,而是医院的一张通知书
你来晚了,戳蓝字一键关注Kyle回复“晚安”,可以获得一条特别的推送微信又改版了,为了避免看不到文章记得
-
2023-05-04 05:06:15
焦点日报:“最火五一”:武铁发送旅客443.6万人次,加开客车644列
“五一”假期的最后一天,多地人和车排起长队,自驾返程的网友表示“凌晨出门照堵不误”。中国国家铁路集团
-
2023-05-04 02:35:56
德天空:拜仁对奥斯梅恩兴趣冷却,不愿为新前锋支付超1亿
根据德国天空体育记者弗洛里安-普莱滕伯格的报道,由于奥斯梅恩的转会费过高,拜仁慕尼黑与他之间的联系已
-
2023-05-03 23:56:49
鬼节南瓜灯_关于鬼节南瓜灯简述 滚动
小伙伴们,你们好,今天小夏来聊聊一篇关于鬼节南瓜灯,关于鬼节南瓜灯简述的文章,网友们对这件事情都比较
-
2023-05-03 21:40:39
长沙很红车展很火,2023湖南车展火爆落幕,卖车总量、销售总额、观车人数均创历史新高_环球热闻
华声在线5月3日讯(全媒体记者胡锐图全媒体记者王普)5月3日下午,2023湖南车展在热卖中闭幕。在这个“五一
-
2023-05-03 20:52:42
2.65%!董明珠“难解”格力多元化难题
根据《中央空调市场》统计的数据显示,2022年中国中央空调市场下滑2 96%,整个空调行业已经出现了非常明显
-
2023-05-03 19:47:44
创建集团控股(01609)委聘创升融资为独立财务顾问
创建集团控股(01609)发布公告,于2023年5月3日,独立董事委员会已议决委聘
-
2023-05-03 18:55:29
环球快播:“五一”假期上海接待游客1564.94万人次 成全国都市旅游首选城市
中新网上海5月3日电(记者李佳佳)3日来自上海旅游大数据的监测显示,“五一”假期上海市共接待游客1564 94万
-
2023-05-03 17:49:03
四川兴文县境内先后发生4.0级、4.5级地震 无人员伤亡报告
四川兴文县境内先后发生4 0级、4 5级地震无人员伤亡报告---应急救援力量正在震区现场排查房屋等情况。中新
-
2023-05-03 16:51:38
湖人2个好消息,库里不能接受一事!浓眉未满足,3点成G2赢球关键 环球播资讯
湖人2个好消息,库里不能接受一事!浓眉未满足,3点成G2赢球关键,浓眉,湖人,勇士,施罗德,美国篮球,斯蒂芬·
-
2023-05-03 15:59:59
高速返程车流叠加接送车辆,虹桥枢纽今天迎接大客流挑战,上海警方全力护航_最新资讯
警方供图(下同)今天(3日)虹桥火车站、虹桥机场将迎来返程最高峰,仅虹桥火车站单日返程客流最高可能超
-
看不下去AI胡说八道,英伟达出手给大模型安了个“护栏”_今日热门
2023-05-04 15:58:34 -
亿华通(688339)5月4日主力资金净买入264.90万元
2023-05-04 15:58:40 -
定价是否有考虑ChatGPT的使用成本? 福昕软件(688095.SH):具体定价内部还在规划_每日简讯
2023-05-04 15:24:31 -
当前报道:用EM2N覆盖苏黎世铁路服务设施的膨胀水泥板
2023-05-04 14:42:44 -
【全球新要闻】秋冬钓鱼深水还是浅水 秋天钓鱼深水还是浅水
2023-05-04 14:23:06 -
连续十九年,平台型公司持续“霸榜”晨星奖 要闻
2023-05-04 13:40:31 -
山东省气象台继续发布暴雨蓝色预警 【2023-05-04】 全球最新
2023-05-04 12:59:02