《你看起来好像……我爱你》是一本写给普通人了解AI的趣味科普书,作者贾内尔沙内,拥有一个电子工程学专业的博士学位以及一个物理学硕士学位。本书结集自她在自己的网站上撰写的关于人工智能的妙趣横生的文章,关于人工智能可以做什么、不能做什么,以及它为什么已经影响了我们生活的方方面面。作者在书中举了大量例子来讲述人工智能的相关实验,是带领读者走近AI世界的一场可爱导览。本文为该书序言《人工智能无处不在》,由澎湃新闻经中信鹦鹉螺授权发布。
教一个AI(人工智能)调情,绝对不是我常做的事情。
当然,我做过很多奇怪的人工智能项目。在我的博客“怪奇人工智能”上,我曾经训练过一个AI来给猫取名字——其中有一些不太成功的案例,比如叮当先生或者呕吐者,我还让一个AI来生成新的菜谱,其中一些菜谱会用到去皮迷迭香和破碎的玻璃作为原料。不过,教AI说一些人类的甜言蜜语是一件完全不同的事情。
人工智能是通过样本来学习的——在我们的情境中是研究一些已有的搭讪俏皮话,然后用它们生成更多全新的话语。问题在于:我的电脑屏幕上的训练数据集是一些我从互联网上各处收集的俏皮话,而且它们全都很糟糕。它们当中包括油腻俗气的双关语和带有侮辱性的含沙射影。一旦我训练了一个人工智能程序模仿它们,只要点击一下按钮,这个程序就会生成成千上万个糟糕的俏皮话。同时,就像一个易受外界影响的孩子一样,它不会知道哪些语言应该模仿,哪些不应该模仿。这个人工智能程序会从一块对搭讪俏皮话一无所知(甚至不知道英语是什么)的白板开始,从这些样本中学习,尽最大努力来模仿它发现的所有规律,当然也包括样本中粗俗的部分。人工智能没办法知道哪些话是好的。
我考虑过放弃这个项目,但是我需要写一篇博文,同时我已经花费了许多时间来收集这些用作样本的俏皮话。所以我开始训练程序。这个人工智能开始寻找样本中的规律,发明并检验一些可以帮助它预测哪些字母应该按照何种顺序出现在俏皮话中的规则。最终,训练结束了。带着一点儿诚惶诚恐的意味,我命令这个人工智能程序生成一些语句:
你一定是一个三角形?因为你是这里唯一的东西。
嘿,宝贝,你会成为一把钥匙吗?因为我能够忍受你的嘟嘟声。
你是一根蜡烛吗?因为你看起来真热辣。
你真美,你对我和宝贝说蝙蝠。
你看起来像个东西,我爱你。
我感到又惊又喜。这个人工智能的虚拟大脑(复杂度大概相当于一条蠕虫)没有能力辨别数据集的各种细节,比如厌女症和粗俗。它尽全力应付它设法发现的规律……然后获得一种完全不同——也许更好——的答案,来解决逗笑陌生人的问题。
尽管对我而言,它能生成话语已经是一种引人注目的成功了,但对于那些关于人工智能的知识大多来自新闻头条和科幻小说的人来说,我的人工智能伙伴表现出的乱无头绪也许会让他们感到惊讶。我们常常见到一些公司声称人工智能可以像人类一样区分语言中各种细微的差异,甚至做得更好,或者人工智能将很快在许多工作领域代替人类。新闻界发布消息说,人工智能很快会无处不在。这些说法是正确的——同时也是大错特错的。
事实上,人工智能已经无处不在了。我们在互联网上的体验取决于人工智能,它决定了我们能看到哪些广告,它推荐视频,同时检测社交媒体上的机器人和恶意网站。许多公司使用人工智能来进行简历筛选,判断该面试哪些应聘者,也会用人工智能来判断是否应该批准某项贷款申请。自动驾驶汽车中的人工智能已经驾驶了上百万英里(它们在陷入困惑时偶尔需要人类营救)。我们已经把人工智能应用在我们的智能手机中,它们会识别我们的语音指令,自动给相片中的人脸归类贴标签,甚至会在视频中加一个让我们看起来长着兔子耳朵的滤镜。
但是不需要多长时间,我们就会体会到,这些我们每天都在使用的人工智能并非完美无缺。广告投放程序会不停地给我们推送我们买过的靴子的广告。垃圾邮件过滤器有时会让明显的骚扰邮件通过,或是在最不合时机的关头过滤掉一封至关重要的邮件。
因为我们日常生活中的许多部分受到算法的支配,这些人工智能的“怪癖”除了造成不便,还开始带来一些严重的后果。视频网站YouTube(优兔)上的推荐算法会把人们引向观点更加两极化的内容,短短几次点击之间,人们就会从主流新闻被引导到去观看仇视社会的群体和阴谋家的视频。在假释、贷款和简历筛选方面帮助人类决策的算法是中立的,但是它们也可能像它们要替代的人类那样充满偏见——有时更甚之。人工智能控制的监控没有办法收受贿赂,但它们在被要求做某件事时,也无法出于道德原因而提出反对。研究者发现,一些看起来无足轻重的细节,比如一块小小的贴纸,就可以让一个图像识别的人工智能认为一把枪是一台烤面包机,而安全性能不足的指纹识别器被主人的指纹愚弄的概率是77%。
人们经常兜售人工智能比实际上更能干的观点,号称他们的人工智能可以完成一些只有科幻小说中才会出现的情景。另一些人则自卖自夸他们的人工智能公正不阿,尽管它们的表现明显地带有偏见。同时,通常人们声称的人工智能所做的工作,实际上都是人类居于幕后在工作。作为这个星球上的消费者和公民,我们得避免上当受骗。我们需要理解我们的数据是如何被人工智能使用的,理解我们使用的人工智能究竟是什么。
在“怪奇人工智能”博客上,我花了不少时间用人工智能做了一些有趣的项目。这意味着让人工智能模仿一些不同寻常的事物,比如俏皮话。另外,我想试试能不能让它们走出舒适区,比如我给一个图像识别算法展示电影人物阿纳金天行者的图片,然后询问它看到了什么:它回答说阿纳金天行者是一棵树,接着便开始和我争论起来。从我的经验来看,我发现,即便是最直截了当的任务也可能使人工智能失效,就像你和它开了一个玩笑。但是事实证明,和人工智能开这样的玩笑——交给它一项任务,然后看着它不知所措——是一种了解人工智能的绝佳途径。
事实上,就像我们将在本书中看到的,人工智能算法的内部构造往往是如此复杂和怪异,以至于观察人工智能的输出可能是唯一一种我们能用来探索它理解了什么、哪里出现了问题的工具。当你让一个人工智能程序画一只猫或者写一个笑话时,它犯下的错误和它在处理指纹或医学影像时犯的错误是类似的,只是当它画出的猫有6条腿、讲的笑话里没有包袱的时候,你可以更容易知道它出了问题。另外,这些错真的很好笑。
在我尝试让人工智能走出它们的舒适区,进入我们的世界时,我曾经让人工智能去写一篇小说的第一行、在不同寻常的场景中识别绵羊、写一份菜单、给豚鼠取名字,通常得到的结果都非常奇怪。但是从这些实验中,你可以学到许多有关人工智能的优缺点的知识——以及哪些事情它不太可能在你我的有生之年做到。
这是我学到的:
人工智能奇怪之处的五点原则:
人工智能的缺点不是因为它们太聪明,而是因为它们不够聪明。
人工智能的脑力大概相当于一条蠕虫。
人工智能并没有真正理解你想让它解决的问题。
人工智能会完完全全按照你告诉它的指令来执行。或者,它至少会尽全力去做。
人工智能会选择最容易的路径。
那么,让我们一起进入人工智能的奇怪世界吧!我们将会了解到人工智能是什么——以及它不是什么。我们会知道它擅长什么,在哪里一定会失败。我们会知道为什么未来的人工智能也许长得不太会像《星球大战》中的机器人那样,反而会更接近一群昆虫。我们将会知道为什么自动驾驶汽车在世界毁灭、丧尸横行时不太适合用来逃跑。我们将会知道为什么你永远也不应该自愿去测试一个分拣三明治的人工智能,同时我们将会遇到行走的人工智能,它不想做任何事只想行走。在这个过程中,我们将会知道人工智能如何工作,如何思考,为什么它将使世界变得更怪异。
《你看起来好像……我爱你:AI的工作原理以及它为这个世界带来的稀奇古怪》,[美]贾内尔沙内著,余天呈译,中信出版集团鹦鹉螺年4月。