Liang FANG’s Blog My Thoughts On Everything

致报道人工智能记者的若干忠告

人工智能作为当前热门领域,充斥着太多「专家」和「洞见」。作为从业者,我们不希望人工智能又如前两次那样再次落入低谷,因此需要向公众传达尽量真实、准确的信息,近日看到纽约大学 Julian Togelius 教授的《Some advice for journalists writing about artificial intelligence》一文,深有感触,特翻译出来与大家共勉。

fake news (题图来自 Geek Diaries


亲爱的记者朋友们,

当你撰写关于人工智能的文章时,我想就如何撰写得更好、更真实提供一些建议。我写这篇文章是因为在报纸和杂志上看到了太多关于 AI 的非常糟糕的文章。其中有一些毫无意义,近乎错误信息,另一些则捕捉到了一些信息,但充满了误解。不,我不会提供具体例子,但任何在 AI 领域工作并关注相应新闻的人都可以提供很多这样的例子。当然也有很多好的文章,但好/坏文章的比率显然存在改善空间。

首先,我能理解。你正撰写的是一个进展非常迅速的领域,充满了专业术语和有着宏大愿景的热情群体。考虑到所有这些兴奋,一定有很多可写的,但你对这个领域知之甚少(甚至一无所知)。你对 AI 的了解也许和我对制革厂的了解差不多。但是,制革厂演进得非常缓慢,涉及到非常具体的材料和工艺,AI 则在以惊人的速度发展,里面涉及到的词语很少是你能接触或是看到的实物。你有一种感触,必须把最新的进展在它们被取代之前现在就写出来,但很难看出从哪里可以破译出那些 AI 研究人员所描述的奇怪的东西。而且,你想要写一些可读性好、点击率高的东西,你又没有太多时间。这真的不容易。

所以,为了更关键和更高质量的 AI 报道,这里有一些需要谨记的事项,以及一些具体的建议。其中有一些是基于我在接受不同技术熟练度记者访谈时的经验,他们对我观点的接受程度也不一。是的,我们都在试图推销一些东西,就连我们这些象牙塔里的乖戾之人也在向你推销。更多内容下面会谈到。

谨记:AI 是一个大领域,用到了非常广泛的主题和方法。主要的 AI 会议(如 IJCAI、AAAI、ICML 和 NIPS)有成千上万的与会者,他们中的大多数其实只了解会议所讨论内容的一小部分。当我参加其中一项会议时,我也许能够跟上 20% 的演讲,并从中有所收获。我也许有些悲观,但很难发现有人能与广泛的子领域都保持同步,诸如约束传播(constraint propagation)、深度学习(deep learning)和随机搜索(stochastic search)。

建议:不要以为和你谈话的研究人员知道「当前 AI 的发展近况」。更重要的是,如果有人说他知道当前 AI 的发展近况,那么需要假设他们只是知道全局中的一小部分。需要向另一个 AI 领域的研究者进行再次确认(double check)。

谨记:没有所谓「一个人工智能」这样的东西。AI 是一套方法和思想的集合,可以构建软件实现一些人类大脑的功能。研发人员开发新的 AI 方法(并使用已有的 AI 方法)构建出令人印象深刻的软件(有时也包括硬件),诸如玩游戏或画猫。然而,你可以放心地假设同样的系统不能同时玩游戏和画猫。事实上,我还没有听说过基于 AI 的系统能做一系列不同的任务。即使是同样的研究人员,在基于同样的思想为不同的任务开发系统时,他们会构建不同的软件系统。当记者写下「X 公司的 AI 已经可以开车,但现在还可以写诗」时,他们掩盖了这些是不同系统的事实,似乎有些机器已经拥有了通用的智能。事实上并没有。

建议:不要使用「一个 AI」或「一个人工智能」这样的词。时刻要询问系统的局限是什么?例如,玩 Space Invaders 和 Montezuma’s Revenge 的是否用的同样的神经网络(提示:不是)。

谨记:AI 是一个古老的领域,很少有想法是真正全新的。当前,极好的但有些过热的深度学习的进步其实源于 20 世纪 80 年代和 90 年代的神经网络研究,而那些研究又是基于 20 世纪 40 年代以来的思想和实验。多数时候,前沿研究包含了许多方法的微小变化和改进,这些方法甚至产生于这些研究人员出生之前。反向传播,这种为当今大部分深入学习提供支撑的算法,已有数十年的历史,是由多人独立发明的。当 IBM 的「深蓝」战胜 Garry Kasparov,证明计算机比人类更擅长下棋时,软件的核心是 Minimax 算法,最初由 Alan Turing 在 20 世纪 40 年代首次提出。Turing,作为人工智能和计算机科学两大领域的先驱之一,在 1950 年发表了论文「论计算机器与智能」(On Computing Machinery and Intelligence)。虽然该文章最引人入胜的是图灵测试,但它也包含了人工智能许多关键思想的种子。

建议:阅读 Turing 1950 年的论文。它阅读起来相当轻松愉快,没有数学符号,任何技术术语也都可以被轻易忽略。令人惊叹的是,许多人工智能的关键想法已经就位,尽管当时还处于萌芽阶段。在撰写令人兴奋的新晋成就故事时,咨询一位老年或至少中年的 AI 研究人员。有些人在 AI 变冷之前已经开始了 AI 研究,或者甚至在它还没变冷之前,所以他已经面临过一次完整的 AI 炒作周期。有可能这个人可以告诉你这个新的进步是基于哪个旧的想法所做的(轻微)改进。

谨记:研究人员总有一些想要推销的东西。显然,那些从事某种创业活动的人正在寻求增加公司估值以及被投资或收购的机会。那些学术界的人在寻求演讲邀请、引用和晋升等等。那些在大公司工作的人则希望对某些可能与实际结果有关或无关的产品感兴趣。

建议:不要相信炒作。接触一下其他研究人员,那些你正撰写的人没有向你引荐的,询问那个人是否相信他们的主张。

谨记:多数「人工智能」实际上是人类的聪明才智。研发人员专注于针对特定领域(例如机器人、游戏或翻译)开发 AI 应用是有原因的:当构建系统来解决问题时,系统中包含了许多关于实际问题的知识(「领域知识」)。这可能包括向系统提供特殊输入,使用特殊准备的训练数据,手工编码部分系统,甚至重构问题以使其更容易。

建议:若想理解一个「AI 解决方案」的哪个部分是自动的,哪一部分是由高明的人类领域知识编码而来的,一个好方法是询问这个系统在一个略微不同的问题上将会有何种表现。

我的这篇文章最好到此为止,因为现有的文字可能已经听起来有太多抱怨。看,我并没有抱怨,我甚至几乎已经老了。我并不想给人留下现在的 AI 并没有多少令人兴奋的进步的印象。事实上,有足够多的真正进展可供报道,我们并不需要以旧充新的衍生研究来拼凑报道。让我们试着诚实、关键和准确,好吗?