破解 AI 时代的焦虑 —— 从人机交互到人机协同创作

这是 4 月做的一次分享。大概是我做过的分享中，现场讨论气氛最热烈的一次了。

最近抽空整理成文章，希望大家可以继续讨论这个有趣、有争议的话题。

为什么分享这个话题呢？

我做了好多年交互设计的工作，所以学习和工作一直有一个离不开的主题——人机交互（Human-Computer Interaction）。

人机关系的演进

什么是人机交互？我把它简单理解为：

人如何与机器或是某个复杂系统的沟通和互动过程。

更为完整的版本，请看我在知乎上的回答什么是交互设计？

比如，鼠标就是一个解决人和机器互动问题的经典产品。

现在大家都觉得鼠标再平常不过了，但是在当年，Douglas Engelbart 的这一项发明，极好地解决了人们在图形化计算机界面操纵屏幕元素的问题。为了表彰这项发明以及在人机交互领域的开拓式贡献，Douglas Engelbart 在 1997 年获得了「计算机界的诺贝尔奖」——图灵奖。

For an inspiring vision of the future of interactive computing and the invention of key technologies to help realize this vision. – Turing Award Citation

人和机器的对话、交互一直在演进。这也从一个侧面反映了人创造工具的历史：

人创造的工具越来越多样、复杂、强大。想想看，今天我们在手机上能完成多少事情。

于是，有人慢慢感到这种发展速度似乎不大对劲……奇点要来了，AlphaGo 也出现了。

随着深度学习热潮的演进，大家发现，以前为了让机器智能化而不得不做的很多工作，比如，符号化、标准化、模块化、输入大量专家知识、需要庞大的训练数据集、要做苦脏累的特征工程等等，现在都简化了。基本上，只要目标足够清晰、可操作，训练数据和计算资源足够，机器学习产生的结果就可以满足要求。

我个人也经历了一次切身的体验。

今年年初在上 Udacity 的 Deep Learning Nano Degree 课程的时候，最后一个实践项目，是基于人脸图像库，用生成对抗网络（GAN）算法自动生成人脸。

虽然在学习过程中，早已对算法能实现的结果有所预期。但是当我把程序放到 AWS 的 GPU 上面跑了不到二十分钟，看到结果时还是忍不住隐隐感到机器的强大和压迫。

这是最开始几个训练迭代生成的模糊不清的轮廓：

这是十几分钟训练结束后生成的人脸：

说一点儿都不焦虑是假的。

何况各种媒体还铺天盖地强化这种焦虑，今天是一百零八种会被机器取代的工作，明天是哪个比赛机器又战胜了人……

于是大家经不住会问：

似乎只有像诗词、小说、爵士乐、即兴表演这些领域，机器看起来就是不太擅长。

但，也不好说。

Paul 是一个专门给人画肖像画的机器。从 2011 年至今已经创做了非常多的作品。看起来非常有艺术感，不是吗？

有时候在焦虑之余，又忍不住会想：这种焦虑到底从何而来？

如果看过莱考夫「我们赖以生存的隐喻」的同学都知道，隐喻 Metaphor 对我们的影响有多么大。仔细想想，感到机器的威胁，是不是也源于人机关系的一些基本隐喻？

我们基本上都是以一种对立或一分为二的方式来看待这些基本词汇：

看到这些词汇，我们会下意识地觉得它们是对立关系。逻辑、精确、冰冷的工程思维，怎么跟想象、感性、个性、创作融为一炉呢？

这大概就是问题所在了。

隐喻和可能

语言有边界。这是语言能高效传递信息的代价之一。

所以，打破语言或者说概念的界限，也许就是找到新出路的起点。

（PS. 在心理咨询中，咨询师很重要的一部分工作，是帮助来访者呈现问题、reframe 问题，而不是直接插手去替他解决问题。）

其实早在 50 多年前，就有人探讨过人机关系的「未来简史」。

美国心理学家和计算机科学家 Licklider 在 Man-Computer Symbiosis 这篇论文中，讨论人跟机器的关系存在什么样的可能性，提出「人机共生」的概念。

快 60 年过去了，技术的发展让「蠢机器」第一次有可能成为人类的「好基友」，我们为什么首先感到的是焦虑而不是兴奋呢？

还记得 2016 年，在 AlphaGo 战胜李世石后，跟安猪老师在大理有过一次讨论。当时我的感慨是，为 AlphaGo 的胜利感到挺开心的，但并不是因为我是技术的脑残粉，而是因为我觉得到了这个时候，人不得不去面对这样一个问题：

人到底擅长什么？

也就是说，当接受生物智能无法跟上非生物智能的发展时：

人到底有哪些可以让机器「羡慕」（当然，机器不会有这种情绪）的天赋呢？

至今我还没有答案，但我想，大概会包括：直觉、洞察力、探索和意外的创造。人欣赏「意外」的审美、运用「意外」的创造力，应该会长期秒杀机器。

人跟机器最大的区别到底是什么？

我一直在问自己这个问题。

意图，可能是现阶段人跟机器最大的差别。

人因为时间、空间、认知方面的三大局限，因为生命时长极其有限、可触达的空间极其有限、工作记忆（内存）极其有限，决定了人类的一些基本 drive 和价值观。人的美妙与荒谬，可能都来自于两行二选一的核心代码：

Be numb/sober and Duplicate

Be insane/self-distroying and Love

所以我（naive地）认为，突破时间、空间、认知限制，渴望无限，是人类物种永恒的追求，换一个词来概括，那就是——意图。

我们在基本意图上发展出复杂的能力，会体会微妙的情感，会追求意义，会审美、表达、共情，会讲故事和构建社会关系……

而机器，无所不能，但就是没有意图！

这样看来，现在难道不是人类最好的时代吗？有一个毫无私心、任劳任怨、潜力无限的助手，为什么我们担心的是被助手取代，而不是兴高采烈地放开手脚去创造呢？

人机关系的新阶段

无论技术如何发展，人类从来没有停止过创造。

这是用 Google DeepDream 算法生成的作品：

DeepDream 网站的首页，已经为人机关系的新时代做了注脚：

艺术家们一直在尝试探索人机关系，可能是这样的：

也可能是这样的：

上图是一位叫做 Dragan iLiC 艺术家的项目，人充当机器的笔刷，由机械臂控制着人去作画。

在分享的现场，这张图引发了热烈的讨论。有的小伙伴表示，这样做的目的到底是什么，她看不出任何意义。有的小伙伴认为这是对人机关系一种悲观的表达。有的小伙伴的态度则更为中立而开放……

我想，这恰恰就是艺术家的目的吧：激发人们的反思与讨论。并不存在对与错，只是 raise questions，这也许就是最大的善意。

音乐，人机协同即将爆发的领域？

最近关注音乐和技术结合的领域比较多，越来越觉得音乐也许会迎来人机共创的繁荣时期。

音乐本身是符号化、形式化非常强的「语言」。音乐的规律经过数百年的研究和沉淀，几乎已经没有太多规律上的「未知和秘密」，更多的变化会来自文化思潮影响下的风格探索。

算法作曲早已不是什么新鲜事，基于 AI 自动生成音乐已经有很多成熟的应用。甚至是在对即兴表演要求相当高的爵士乐，也已经有人机共同即兴表演的尝试。比如 Al Biles 教授的 GenJam 项目，从 2005 年至今，已经演出过数十场。

GenJam’s Journey_腾讯视频

而去年的 Qosmo AI DJ 项目也展示了人类 DJ 和 AI DJ 一起 Jam 的效果~

AI DJ Project 人工智能 DJ 与人类合作打碟_腾讯视频

何以解忧？

这是最坏的时代

也是最好的时代

这取决于我们现在每做的一个决定、每投入的分分秒秒。

回到主题，如何破解 AI 时代的焦虑呢？

以下是 00 给（自己）的解药：

回归创造者的使命，装备上创造所需要的心、眼、脑、手，去看去爱去体验。知识可以学习，但智慧更多是一种体验。把技术当成伙伴和切磋的对手，去行动，去试验，去创造。

最后

人机关系的演进

隐喻和可能

人机关系的新阶段

音乐，人机协同即将爆发的领域？

何以解忧？

Ref