我们能不能相信人工智能?

2023-06-13 中科院物理所

科学无国界

我们是知识的搬运工

福利时间

今天我们将送出由图灵新知提供的优质科普书籍《白话机器学习算法

文科生也看得懂的算法及数据科学入门书!本书用通俗易懂的人类语言以及大量有趣的示例和插图讲解10多种前沿的机器学习算法。内容涵盖k均值聚类、主成分分析、关联规则、社会网络分析等无监督学习算法,以及回归分析、k最近邻、支持向量机、决策树、随机森林、神经网络等监督学习算法,并概述强化学习算法的思想。

只要你认真阅读下面的这篇文章,思考文末提出的问题,严格按照 互动:你的答案 的格式在评论区留言,就有机会获得奖品!

作者:John Pavlus

翻译:Nothing

审校:loulou

众所周知,计算机很多时候可以给我们的问题一个很好的答案,但我们并不理解它是如何得到这些答案的。Been Kim一直在开发一个“面向人类的翻译器(translator for humans)”,这样我们就可以知道人工智能何时会失效。

Been Kim

如果一个医生告诉你需要做手术,你会想知道为什么,而且你会期望自己可以理解这个解释,即使你从未上过医学院。谷歌大脑(Google Brain)的科学家Kim认为,我们应该对人工智能抱有更高的期望。作为“可解释”机器学习(“interpretable” machine learning)的专家,她希望开发能够向任何人解释自己的人工智能软件。

自从大约十年前人工智能兴起以来,人工智能背后的神经网络技术使用其日益强大的学习和识别数据模式的能力,已经改变了从电子邮件到药物开发的每一件事。但这种能力带来了一个问题:现代深度学习网络的复杂性使之能够成功地学会如何驾驶汽车和发现保险欺诈,但即便是人工智能专家也无法了解它内部工作的机制。如果一个神经网络被训练来识别像肝癌和精神**症这样的病人——就像2015年纽约西奈山医院的“深度病人(Deep Patient)”**一样——我们不知道神经网络关注的是数据的哪些特征。这种“知识”被加诸于许多层的人工神经元上,每层都有成百上千的连接。

随着越来越多的行业试图用人工智能实现自动化或增强他们的决策能力,这种黑箱理论似乎显示出根本性的**。美国***高级研究计划局(DARPA)的“XAI”项目(用于“可解释的人工智能”)正在积极研究这个问题,可解释性已经从机器学习研究的边缘转移到了它的中心。Kim说:“人工智能正处于这个关键时刻,人类正试图考察这项技术是否对我们有益。”“如果我们不解决这一可解释性问题,我认为我们就不应该继续使用这项技术。我们可能会放弃它。”

Kim和她在Google Brain的同事最近开发了一个名为“概念激活向量测试(TC**)”的**,她将其描述为“面向人类的翻译器”,该**允许用户询问黑匣子人工智能一个特定的高层次概念在其推理中发挥了多大作用。例如,如果一个机器学习**已经被训练识别图像中的斑马,那么一个人可以使用TC**来确定**在做出决定时对“条纹”概念给予了多少权重。

可解释性是什么意思,它为什么如此重要,Kim一一给出了解答。

“可解释性”这个词到底是什么意思?

可解释性有两个分支。一种是科学的可解释性:如果你把神经网络作为研究对象,那么你就可以进行科学实验来真正理解关于模型的细节、它的反应以及诸如此类的事情。

可解释性还有第二个分支,我主要关注的是人工智能的可解释性。你不必了解模型的每一个细节。但是,只要你能够理解并足够安全地使用该工具就可以了,这就是我们的目标。

你为什么能对一个你不完全理解其工作原理的**有信心呢?

我给你打个比方。假设我后院有一棵树,我想砍掉它。我可能会用电锯来做这项工作。现在,我不完全理解电锯是如何工作的。但手册上说,“这些是你需要小心的事情,以免割到你的手指。”所以,根据这本手册,我宁愿用电锯也不愿用手锯,手锯的原理容易理解,但会让我花五个小时来砍树。

你知道“切割”是什么,即使你不完全知道完成这个动作的机制是什么。

对。第二个可解释性的第二个分支是:我们能充分理解一个工具,以便安全地使用它吗?我们可以通过确认工具中反映出的人类已有的知识来形成这种理解。

“反映人类知识”如何使人工智能更容易理解?

这有另一个例子。如果医生使用机器学习模型来进行癌症诊断,医生会想知道,该模型有没有利用数据中我们不想涉及的随机性。确保这一点的一种方法是确认机器学习模型正在做医生会做的事情。换句话说,证明医生自己的诊断知识已经反映在模型中。

因此,如果医生在判断一个细胞是否变成了癌细胞,他们可能会在标本中寻找一种叫做“融合腺(fused glands)”的东西。他们还可以考虑患者的年龄,以及患者过去是否接受过化疗。这些都是医生诊断癌症时关心的因素。如果我们能证明机器学习模型也注意到了这些因素,那么模型就更容易理解了,因为它反映了医生作为人类会具备的知识。

这就是TC**所做的吗?它揭示了机器学习模型使用哪些高级概念来做出决策?

对。在此之前,可解释性方法只解释了在输入数据的特征上,神经网络做了什么工作。也就是说,如果您有图像,每个像素都是一个输入参数。事实上,Yann Lecun(一位早期的深度学习先驱,目前是Facebook的人工智能研究主管)说,你可以查看神经网络中的每个节点,并查看每个输入的数值。这对电脑来说没问题,但人类不会这样做。我不会告诉你,“哦,看看100到200像素,RGB值是0.2和0.3。”我只会说,“有一张狗的照片,它的毛发真的很蓬松。”这就是人类交流的方式——利用概念。

TC**如何把输入的数据转化成概念?

让我们回到使用机器学习模型的医生的那个例子,这个机器学习模型已经被训练为将细胞样本的图像按照可能存在的癌症分类。作为医生,你可能想知道“融合腺体”的概念对预测癌症有多重要。首先,你收集一些图像,比如20个,其中有一些含有融合腺体的细胞。现在你将这些标记的示例**模型中。

那么TC**内部所做的就是所谓的“敏感性测试”,当我们将这些包含融合腺体的图片放入模型,癌症阳性预测的概率会增加多少?你可以将其输出为一个介于0和1之间的数字,这是你的TC**得分。如果概率增加,证明这是模型的一个重要概念。如果没有,这就不是一个重要的概念。

“概念”是一个模糊的术语。有没有TC**不能处理的概念?

如果你不能使用数据表达你的概念,那么它将无法工作。如果你的机器学习模型是在图像上训练的,那么这个概念必须是可视化的。比如说,我想用视觉表达“爱”的概念,这真的很难。

TC**本质上是为了建立对人工智能的信任,而不是真正的理解它吗?

不是,我们从认知科学和心理学的研究中知道,人类很容易上当受骗。这意味着欺骗一个人去相信某件事其实很容易。机器学习可解释性的目标与此相反。它告诉你一个**是否安全,重要的是找到**而不是建立信任。可解释性的重点是揭示人工智能推理中的潜在**。

它怎么能暴露自己的**?

你可以使用TC**向经过训练的模型测试相关的概念。回到医生使用人工智能进行癌症预测的例子,医生们可能会突然想,“这台机器似乎倾向于对带有蓝色阴影的图像给出患有癌症的预测。我们认为不应该考虑这一因素。”因此,如果带有“蓝色”的TC**分数很高,这就成为这个机器学习模型的一个**。

TC**是针对无法解释的机器学习模型设计的。为什么不让**从一开始就可以解释呢?

可解释性研究的一个分支,侧重于建立反映人类推理方式的固有可解释模型。但我的看法是:现在你在任何地方都有人工智能模型,这些模型已经被构建,并且已经得到重要应用,而从一开始我们就没有考虑过可解释性。这就是事实。谷歌就有很多这样的情况!你可以说,“可解释性是非常有用的,让我为你建立另一个模型来取代你已有的模型。”那好吧,祝你好运。

那你怎么办?

我们仍然需要判断这项技术是否适合我们。这就是我为什么研究“后训练(Posttraining)”的可解释性方法。如果你有一个别人给你的模型,而你不能改变它,你如何去为它的行为生成解释,以便你可以安全地使用它?这就是TC**工作的意义所在。

你相信如果没有可解释性,人类可能会放弃人工智能技术吗?考虑到它的强大功能,你真的认为这是现实的可能性吗?

是的。专家**(智能计算机程序**)就是这样。在20世纪80年代,我们确定他们比人工*作人员执行某些任务更便宜。但现在谁在使用专家**呢?没有人。之后我们进入了人工智能的冬天。

因为人工智能铺天盖地的宣传和资金的大量投入,现在看起来不太可能放弃人工智能。但从长远来看,我认为人类可能发现——也许是出于恐惧,也许是因为缺乏证据——这项技术不适合我们。这也是可能的。

原文地址:

https://www.quantamagazine.org/been-kim-is-building-a-translator-for-artificial-intelligence-20190110/

互动问题

【互动问题:有哪些你并不知道原理却用得很开心的工具?】

请大家严格按照 互动:问题答案的格式在评论区留言参与互动,格式不符合要求者无效。

截止到本周四中午12点,点赞数前三名的朋友将获得我们送出的图书一本。

编辑:loulou

近期热门文章Top10

↓ 点击标题即可查看 ↓

1. 首届黑洞PS大赛来袭!为了这张「高糊」的图,我国科学家做出了啥贡献?

2. 物理学四大神兽,除了“薛定谔的猫”还有谁?

3. 地下多大的金矿才能影响到单摆实验?| No.149

4. 为什么用木棍打衣服就可以洗干净衣服?| No.150

5. 为了替你出气,我们给讨厌的杨柳絮来个「以暴制暴」

6. 玩扫雷还有什么技巧?科学家的玩游戏方法你绝对想不到

7. 在我国,没有任何一张地图能告诉你你的真实位置

8. 在客户鱼嘴里提供服务的小清洁虾、清洁鱼,是怎么知道自己不会被吃掉的呢?

9. 你以为土拨鼠只会尖叫?其实它可能正在骂你

10. 你知道为了测博尔特的速度,我们有多努力嘛?


相关股票:
相关概念: 人工智能 保险

崛起的中科系,被改变的我国芯片产业格局

当前,以芯片为代表的信创产业逐步成为国家科技竞争力的重要标志。在国产CPU产业强势崛起的过程中,你首先想到的会是哪几企业?答案有很多,但“中科系”的提及率绝对很高。作为国家战略科技力量,“中科系”旗下

芯片战场丨芯片领域三箭齐发 英特尔跑步突围

21世纪经济报道记者倪雨晴 圣何塞报道在硅谷源泉之一的圣何塞,英特尔CEO帕特·基辛格(Pat Gelsinger)正在带领英特尔加速奔跑。当地时间9月19日,2023英特尔on技术创新大会于美国加利

OPPO重启芯片业务?国产芯片或需告别“单打独斗”

财联社9月19日讯(记者 唐植潇)近日有消息称,OPPO将会重启芯片业务,并且“有部分员工已经回流,加入到了车载业务之中”。记者就此事向OPPO方面进行核实,对方表示“不予置评”。特百惠(我国)数字与

600亿颗芯片!我国巨头正式宣布,美媒:**也没料到制裁这么快

我国芯片市场与美国依赖我国的集成电路市场一直以来都是一个巨大的市场,拥有庞大的需求和巨大的增长潜力。我国的电子消费市场一直在迅速增长,包括智能手机、电视、电脑和各种智能设备等,这些设备都需要高性能的芯

最新手机芯片天梯图:A17、华为麒麟9000S,排在什么位置?

近日,最火的两颗芯片分别是苹果的3nm芯片A17 Pro,虽然很多人吐槽它较上一代提升不明显,但论性能,可以碾压任何安卓芯片,甚至是领先2代的。另外一款芯片,则是华为麒麟9000S,当然,这颗芯片工艺

韩国芯片连续13个月暴跌,尹锡悦指责我国不采购,外媒:自食其果

据韩国媒体称,韩国的半导体出口额已经连续暴跌13个月了,比去年同比下降了28%左右。韩国政府急的焦头烂额。尹锡悦政府竟直接甩锅我国,话里话外都是指责,他认为韩国半导体卖不出竟是我国的原因,我国应该帮助

我国突破芯片瓶颈将影响全球秩序?美国很担心,指出我国关键弱点

我国在芯片半导体领域一直深受美国的**,通过贸易制裁的方式阻止高端芯片进入我国市场。这样的举措一度造成我国芯片领域发展断档,不过随着我国科技企业近几年的突破,目前我国已经在芯片制造方面取得了重大的成果

没有他,我国芯片发展至少要**十年?

前几天,华为一声不响的上线了mate60系列,带着麒麟芯片9000s强势回归,吸引了全世界的目光。而华为麒麟芯片**背后,我们不该忘记这位老人—张汝京。我国半导体之父,为回**造芯片,被开除**户籍,

陈清泰:未来汽车颠覆传统,50%以上的零部件体系面临重构

【有车以后 资讯】“未来汽车对传统汽车的颠覆性,使传统零部件体系的50%以上都面临重构。”12月16日,在全球智能汽车产业峰会(GIV2022)上,我国电动汽车百人会理事长陈清泰指出,智能汽车的价值链

「姿势」一辆汽车由多少个零件组成?保证你说不清...

投稿点这里汽车有多少个零件?其实这个问题并没有一个十分确切的标准答案...据估计,一般轿车约由1万多个不可拆解的**零部件组装而成。结构极其复杂的特制汽车,如F1赛车等,其**零部件的数量可达到2万个

全球最大的10家汽车零部件供应商 都是世界500强 无我国企业

【卡车之家 原创】美国《财富》**每年发布的世界500强排行榜,是以营业收入数据对全球企业作出排名的榜单。2017年“世界500强”榜单中,汽车制造商和零部件厂商共占据33席(除去大型工程车辆企业),

汽车零部件企业哪家强?除了博世**还有这些名字你一定耳熟能详

文:懂车帝原创 李德喆[懂车帝原创 行业]9月18日,由《我国汽车报》主办,罗兰贝格协办的2019汽车零部件“双百强”企业发布会在江苏南京举行。在两份榜单中,博世、**、电装位列2019全球汽车零部件

汽车零部件行业现状及产业链

行业现状(Reference:产业运行 | 2021年汽车工业经济运行情况)中汽协预测:2022年我国汽车销量达到2700万辆,新能源销量超过550万辆(Reference:乘用车市场信息联席会)以乘

全球十大汽车零部件供应商,核心技术都被他们垄断,自主遗憾缺席

提到电影,我们会想到张艺谋、冯小刚,而很少会想到幕后的制作人;提起流行乐,我们会想到周杰伦、萧敬腾,而很少会想到背后的作词人。台前台后,一幕之别,知名度往往相差甚远。车界又何尝不是如此,知名车企我们都

高清汽车各零部件构造图,看完你就是汽车专家!

2023世界移动通信大会即将举行,大批中企强势回归!

来源:环球时报 【环球时报记者 倪浩 陶震 环球时报驻德国特约记者 青木】经过3年疫情后,全球最具影响力的通信展今年有望再现往日盛况。2月27日至3月2日,由全球移动通信**协会(GSMA)主办的20

太空新赛道:6G时代的卫星通信,究竟是什么?

近日华为、苹果争相推出手机卫星通信功能,成为一大亮点,不少手机厂商也将目光投到卫星通信。放眼未来,手机直连卫星的卫星通信服务将是大势所趋,也是6G时代的重要标志。华为以“北斗三号”为依托,率先把“卫星

光纤#光纤通信

国内企业在光通信产品的参数测试过程中,通常使用国外的先进测试设备。然而,这些测试仪器之间往往是孤立存在的,需要手动调试仪器并通过旋钮、按钮和人眼观察波形或数据。这不仅*作繁琐易出错,而且测试效率低下。

龙头20cm涨停,7天股价翻倍!一文看懂卫星通信前世今生及产业链

卫星通信概念股华力创通今日再度强势拉升,截至发稿,该股股价20cm涨停,7个交易日累计涨幅近113%,现报23.52元续刷阶段新高,总市值155.9亿元。消息上,有媒体从供应链获悉,Mate 60 P

工信部:目前我国尚不具备实现网络层面的移动通信号码归属地变更的条件

针对网友提出的“电话号码归属地更改”建议,工信部近日给出了官方回复。此前,有网友在人民网留言板向工信部留言称,“现在电话都是实名制,电话号绑定的***及一些主流的软件较多,更换号码后造成一系列问题

AD
更多相关文章