2021 年度的斯坦福 AI Index 报告正式发布,从七大版块出发,探讨了过去一年中的 AI 总体发展情况。
由斯坦福大学发起的人工智能指数(AI Index)是一个追踪 AI 动态和进展的非营利性项目,旨在全面研究 AI 行业状况,旨在促进基于数据的 AI 广泛交流和有效对话。
刚刚,AI Index 正式发布了 2021 年度报告。
报告下载地址:https://aiindex.stanford.edu/report/
2021 AI Index 报告极大地扩展了可用数据量,并与大量外部组织合作校准数据、深化该报告与 Stanford HAI 的联系。该报告还从多个方面展示了 COVID-19 对 AI 发展的影响。例如「技术表现」章节探讨了 AI 初创公司如何利用机器学习技术加速 COVID 相关药物研发;「经济」章节表明 AI 招聘和私人投资并未受到新冠大流行的严重影响,仍处于增长态势。
该报告从研发、技术表现、经济、教育等多个维度探讨了过去一年的 AI 发展,得出了如下重要结论:
对 AI 领域的私人投资额呈现显著增长,其中「药物、癌症、分子学、药物研发」获得最大比例的投资——138 亿美元,是 2019 年的 4.5 倍;
中国在学术工作方面的成绩超过美国。多年前,中国的 AI 期刊发表文章数量即超过美国,现在中国首次在期刊引用量上也占据了优势。不过在过去十年中,美国的 AI 会议论文(及高被引论文)数量仍超过中国;
合成媒体(deepfake)数量大增,文本、图像、视频合成方面都出现了突破。这显示了 AI 的飞快发展,但也引发了人们对其滥用、误用的潜在担忧;
AI 应用的伦理挑战引起 AI 社区的更多关注。2015-2020 年间涉及伦理及相关关键词的论文数量增长迅速;
AI 领域面临多样性挑战。2019 年,美国 45% 的 AI 博士新生是白人,仅有 2.5% 是非裔美国人,3.2% 是西班牙裔。目前,AI 研究者正在努力提升该领域的多样性;
自 2017 年加拿大发布国家 AI 战略后,多个国家采取了类似措施,截至 2020 年有 30 多个国家发布了国家 AI 战略;
更多 AI 博士选择进入工业界,而不是留在学术界,离开学界进入企业的教授数量也在持续增长;
企业主导了 AI 研究者的常用工具,如企业开发的软件库(谷歌的 TensorFlow 和 Keras、Facebook 的 PyTorch)成为 GitHub 上最热门的框架;
政府对 AI 领域的兴趣继续增长,如美国政府斥资数十亿美元投入 AI 的民用与非民用。美国国会提及「AI」的次数是上一届国会的三倍;
监控技术呈现出快速、廉价的特点,得到越来越广泛的使用。2020 年图像分类、人脸识别、视频分析、语音识别等技术取得显著进展,用于大规模监控的技术快速成熟。
该报告共包括「研发」、「技术表现」、「经济」、「AI 教育」、「AI 应用的伦理挑战」、「AI 多样性」、「AI 政策与国家战略」七个部分。以下将介绍每个章节的核心内容。
第一章:研发
报告首先从「同行评审 AI 论文」、「AI 期刊论文」、「AI 会议论文」、「AI 专利」、「arXiv 论文」五个部分概述了 AI 领域的论文发表情况。
同行评审论文数量猛增
自 2000 至 2019 年,同行评审 AI 论文数量增长了约 12 倍,同期同行评审论文占所有论文发表量的比例从 2000 年的 0.82% 增长到 2019 年的 3.8%。
中国 AI 期刊论文被引量首超美国
就 AI 期刊论文而言,2020 年发表的 AI 期刊论文数量是 2000 年的 5.4 倍。其中,2020 年当年发表的 AI 期刊论文数量就比 2019 年增长了 34.5%,大大超过 2018 至 2019 年的涨幅(19.6%)。
2000-2020 年 AI 期刊论文发表数量。
其中,中国的 AI 期刊论文发表数量最多(占比 18.0%),超过美国(12.3%)和欧洲(8.6%)。这对于中国而言并非首次。
2000-2020 年不同地理区域的 AI 期刊论文发表数量占世界总量的比例。
值得一提的是,2020 年中国的 AI 期刊论文被引量首次超过美国。不过,在过去十年中,美国的 AI 会议论文引用量仍超过中国。
2000-2020 年 AI 期刊论文引用量的占比情况,中国以 20.7% 的比例首次超过美国(19.8%)。
AI 会议快速发展
过去十年,AI 会议论文数量呈迅猛增长态势。2020 年,AI 会议论文数量占所有会议论文的比例已高达 20.2%。
2000-2020 年,AI 会议论文发表数量占所有会议论文的比例。
2019 年,中国的 AI 会议论文发表数量占比超过美国。然而,从 AI 会议论文被引用量来看,美国在过去 21 年中持续占据主导地位。2020 年,美国以 40.1% 的比例名列第一,中国则以 11.8% 的比例位居第二,二者差距仍然很大。
2000-2020 年不同地区的 AI 会议论文发表数量的占比情况。
2000-2020 年不同地区的 AI 会议论文被引用量的占比情况。
arXiv 论文发表情况
除了传统的期刊和会议以外,预印本平台的论文发表也很重要。过去 6 年中,arXiv 平台上的 AI 相关论文增长了五倍多,从 2015 年的 5478 篇增长到 2020 年的 34,736 篇。其中中国的 arXiv 论文发表总数仍逊色于美国和欧洲,不过从占比情况来看,中国正在奋起直追。
2015-2020 年,不同地区在 arXiv 上发表 AI 论文数量的占比情况。
就 arXiv 上的六个 AI 细分领域而言,2015-2020 年间,机器人学 (cs.RO) 和机器学习 (cs.LG) 论文数量增长最快,分别增长了 11 倍和 10 倍。2020 年,机器学习与计算机视觉 (cs.CV) 占比最高,分别为 32.0% 和 31.7%。2019-2020 年,增长最快的类别是计算与语言 (cs.CL) 和机器人学 (cs.RO),论文数量分别增长了 35.4% 和 35.8%。
此外,得益于数据和算力的发展,深度学习论文数量飞速增长。
2010-2019 年,arXiv 平台上深度学习论文的发表数量。
新冠疫情促使 AI 会议参会人数暴涨
由于新冠疫情的影响,大多数 AI 会议以线上的形式举行,参会人数出现了很大增长。2020 年,该报告统计的九个会议的参数总人数几乎翻了一番。
2010-2020 年,参加大小型 AI 会议的人数。
大公司参与度高,或加剧计算鸿沟
有研究表明,大型科技企业对 AI 顶会的参与度有所增加。研究者认为学术界算力的不均匀分布(即「计算鸿沟」)将加剧深度学习时代的不平等。大型科技企业拥有更多资源来设计 AI 产品,但其多样化程度逊色于较小型的机构,而这引发了对 AI 偏见及公平性的担忧。下图展示了大企业在 10 个 AI 顶会中的参与度,这或许会加速计算鸿沟。
2000-2019 年,大型科技企业的 AI 会议论文数量占比情况。
TensorFlow 仍是最流行的 AI 软件库
除了论文、会议情况以外,该章节还介绍了 AI 开源软件库。其中谷歌开发的 TensorFlow 框架仍然是最流行的 AI 软件库,其次是 Keras 和 PyTorch。
2014-2020 年,AI 库的流行程度(按照 GitHub 星数来计算)。
第二章:技术表现
本章概括了计算机视觉、语言、语音、概念学习、推理等多个 AI 子领域的技术进展。
AI 生成一切
目前,AI 系统可以合成高质量的文本、语音和图像,甚至人类都很难辨别真伪。这将带来大量 AI 下游应用,并促使研究者投入到生成模型检测技术的研究中。下图展示了过去两年中生成模型的进展:
2018-2020 年生成模型在 STL-10 数据集上的 FID 得分。
2014-2020 年 GAN 人脸生成技术进步。
计算机视觉的产业化
计算机视觉在过去的十年里取得了巨大的进步,这主要归功于机器学习技术(特别是深度学习)的应用。新的数据显示,计算机视觉正在产业化:在一些最大的基准上,表现开始趋于平缓,这表明社会需要制定和商定更难的基准,以进一步获得测试表现。
与此同时,企业正在投入越来越多的计算资源,比以往任何时候都以更快的速度训练计算机视觉系统。同时,用于已部署系统的技术(如用于分析视频静止帧的目标检测框架)正在迅速成熟,这表明将进一步部署 AI。
ImageNet 挑战的 TOP-1 准确率变化。
COCO 密集姿态估计挑战的平均精度变化。
NLP 评估指标
自然语言处理的迅速发展产生了 AI 系统,其语言能力显著提高,已开始对世界产生有意义的经济影响。谷歌和微软都在他们的搜索引擎中部署了 BERT 语言模型,而从微软到 OpenAI 等公司也开发了其他大型语言模型。
这一点可以从在 SuperGLUE 上获得人类水平性能的系统的快速兴起看出。SuperGLUE 是为响应早期 NLP 进展(超越 GLUE 评估的功能)而开发的 NLP 评估套件。
SuperGLUE 基准。
SQUAD 1.1 和 SQUAD 2.0 的 F1 SCORE 变化。
GPT-3 在 42 个基准上的表现。
AI 推理问题
大多数技术问题的度量都显示了在固定的基准上,即每个时间点最佳系统的性能。针对 AI 指数开发的新分析提供了一些指标,这些指标考虑到了一个不断发展的基准,并考虑到随着时间的推移,将一组系统的总体性能的一部分归因于单个信用系统。这些分析适用于两个符号推理问题:自动定理证明和布尔公式的可满足性。
2016-2020 年解决所有 400 个实例的总时间(布尔满足问题)。
1997-2020 年解决的问题百分比(自动定理证明)。
机器学习变革医疗保健和生物学领域
机器学习正在改变医疗保健和生物学领域。DeepMind 的 AlphaFold 应用深度学习技术在数十年来的蛋白质折叠生物学挑战中获得重大突破。
2006-2020 年 CASP 最佳团队在自由建模中的预测准确度。
科学家们用机器学习模型来学习化学分子的表示,以便制定更有效的化学合成计划。AI 创业公司 PostEra 在疫情期间利用基于机器学习的技术加速推进与 COVID 相关的药物发现。
PostEra:Moonshot 提交的药物总数。
第三章:经济
AI 的兴起不可避免地提出了这样一个问题:这些技术将在多大程度上影响企业、劳动力和更广泛的经济?AI 最近取得的进展和突破为企业提供了大量利益和机遇,从自动化提高生产率、使用算法为消费者定制产品到大规模分析数据等等。
然而,AI 带来的效率和生产率的提高也包含巨大的挑战:企业必须寻找和留住技能型人才以满足其生产需求,同时要注意采取措施来降低使用 AI 的风险。此外,COVID-19 大流行给全球经济带来了混乱和持续的不确定性。私营企业是如何依赖和扩展 AI 技术来帮助企业渡过这一最困难的时期的?
AI 生物获最多投资
药物、癌症、分子、药物发现是 2020 年私人 AI 投资额最大的一个项目,超过 138 亿美元,是 2019 年的 4.5 倍。
2019 年与 2020 年 AI 全球私人投资的领域分布。
AI 人才招聘仍在继续增长
巴西、印度、加拿大、新加坡和南非是 2016 年至 2020 年 AI 招聘增长最快的国家。尽管出现了 COVID-19 大流行,但所有采样国家 2020 年的 AI 雇佣人数仍在继续增长。
2020 年 AI 招聘指数的国家分布情况。
2016-2020 年 AI 招聘指数在不同国家的变化。
AI 私人投资趋势
越来越多的 AI 私人投资集中到少数的初创企业。尽管受到疫情影响,但 2020 年私人 AI 投资额较 2019 年增长了 9.3%,增幅高于 2019 年(5.7%),不过新成立的公司数量连续三年处于下降趋势。
2015-2020 年全球新增 AI 公司数量。
2015-2020 年度 AI 基金公司的私人投资额。
AI 道德问题的受关注度
麦肯锡的一项调查显示,尽管越来越多人呼吁解决 AI 使用相关的道德问题,但业界在解决这些问题的努力上非常少。例如,AI 的公平性等问题仍然受到很少公司的关注。此外,与 2019 年相比,2020 年将个人或个人隐私风险视为相关风险的公司较少。
2020 年机构认为与采用 AI 技术相关的风险比例。
2020 年机构采取措施以缓解 AI 带来的风险比例。
AI 领域投资受疫情影响了吗?
尽管疫情导致了经济衰退,麦肯锡的一项调查中有一半的受访者表示冠状病毒对他们在 AI 领域的投资没有影响,而实际上有 27% 的人表示他们的投资有所增加。不到四分之一的企业减少了对 AI 的投资。
疫情期间的 AI 投资变化。
美国的 AI 岗位比例有所下降
从 2019 年到 2020 年,美国的 AI 岗位比例有所下降,这是 6 年来的首次下降。在美国发布的 AI 岗位总数也下降了 8.2%,从 2019 年的 325724 个职位减少到 2020 年的 300999 个职位。
2013-2020 年按国家划分的 AI 职位。
第四章:AI 教育
随着 AI 成为经济活动越来越重要的驱动力,越来越多的人想要了解它并获得从事该领域工作的必要资格。同时,工业界对 AI 的需求不断增长,吸引越来越多的教授离开教育界,进入私营企业。本章重点介绍 AI 人才变化趋势。
世界顶尖大学加大对 AI 教育的投入
2020 年进行的一项 AI 指数调查显示,过去四年中,世界顶尖大学加大了对人工智能教育的投入。在过去的四个学年里,在本科和研究生阶段教学生构建或部署实用 AI 模型所需技能的课程数量分别增加了 102.9% 和 41.7%。
AI 博士毕业生选择
计算机研究协会(CRA)的一项年度调查显示,过去 10 年,北美更多的 AI 博士毕业生选择在工业界工作,选择学术界工作的较少。
具体而言,在过去十年中,选择进入业界工作的 AI 博士比例增加了 48%,从 2010 年的 44.4% 增至 2019 年的 65.7%。相比之下,进入学术界的 AI 博士比例下降了 44%,从 2010 年的 42.1% 降至 2019 年的 23.7%。
AI 专业在 CS 博士中的比例
根据 CRA 的调查,在过去 10 年中,美国 AI 相关博士占 CS 博士学位总数的比例从 14.2% 上升到 2019 年的 23% 左右。与此同时,其他以前比较流行的计算机科学博士的受欢迎程度有所下降,包括网络、软件工程和编程语言。与 2010 年相比,编译器专业获得博士学位的人数有所减少,而 AI 和机器人 / 视觉专业的博士人数则大幅增加。
AI 教师转行业界
在经历了两年的增长之后,北美地区从大学 AI 教职人员转到业界发展的人数从 2018 年的 42 人下降至 2019 年的 33 人(其中 28 人是终身教职,5 人是非终身教职员工)。
2004 年至 2019 年间,卡内基梅隆大学的人工智能教师离职人数最多(16 人),其次是佐治亚理工学院(14 人)和华盛顿大学(12 人)。
AI 博士中的国际学生
2019 年,北美 AI 博士中的国际学生比例继续上升,达到 64.3%,相比 2018 年增长 4.3%。在外国毕业生中,81.8% 的国际学生选择留在美国,8.6% 的人选择在美国以外的地方工作。
除此以外,在欧盟,绝大多数专业的 AI 学术课程是在硕士级别教授的;机器人技术和自动化是迄今为止本科生和硕士项目中最常教授的课程,而机器学习(ML)在专业短期课程中占主导地位。
第五章:AI 应用的伦理挑战
随着 AI 对人类生活的影响日益深刻,其所面对的伦理挑战也越来越明显。各种技术的应用可能会导致意想不到的负面影响,比如隐私侵犯;基于性别、种族 / 民族、性取向、性别身份的歧视;以及不透明决策等问题。打造负责任的、公平的 AI 创新,从来没有像今天这样重要。
报告的第五章首先介绍了近期颁布的大量 AI 原则和框架文件,以及与 AI 道德问题相关的媒体报道,然后回顾了在 AI 会议中提出的道德相关研究、全球各地大学计算机系开设的道德课程。此外,报告还讨论了人脸识别技术偏见方面的研究。
学术会议中的道德 AI
如图 5.3.1 所示,自 2015 年以来,向 AI 会议提交的论文里,标题含有伦理相关关键词的数量大幅增加。
但近年来,在主流 AI 会议中与伦理相关关键词匹配的论文标题的平均数量依然很低。图 5.3.2 展示了六个主流会议所有出版物中伦理相关关键词匹配的平均数量。
媒体报道中的道德 AI
如图 5.2.1 所示,在 2020 年最受关注的新闻话题中,与 AI 道德指导及框架有关的文章名列榜首,随后是研究与教育、人脸识别等。
2020 年,与 AI 道德应用相关的五大新闻最受关注:
欧盟委员会 (European Commission) 发布关于人工智能的白皮书(5.9%);
谷歌解雇道德研究人员 Timnit Gebru (3.5%);
联合国成立人工智能道德委员会 (2.7%);
梵蒂冈的人工智能伦理规划 (2.6%);
IBM 宣布退出人脸识别业务 (2.5%)。
第六章:AI 领域的多样性
AI 领域的多样性问题存在已久,当前 AI 研究者仍以男性为主,且在种族、民族、性别认同和性取向方面缺乏多样性,学术界和行业界皆是如此。这加剧了 AI 系统现有的不平等。
报告的第六章介绍了 AI 人才和学术界的多样性统计。鉴于该方面公开的数据较少,关于 AI 多样性问题对社会及技术发展影响程度的统计、分析、评估都会受到限制。从学术界和产业界获得更多的数据,对于衡量该问题的严重程度以及解决问题至关重要。
近年来,AI 博士毕业生和计算机科学终身教授的女性成员比例一直很低。根据计算机研究协会 (CRA) 的一项年度调查,北美 AI 博士项目的女性毕业生占所有博士毕业生的平均比例不足 18% 。
一项 AI 指数调查显示,在世界各地大学的计算机系中,女性教师仅占全部终身制教师的 16% 。
此外,根据 CRA 的 Taulbee 调查,2019 年新增的美国居民 AI 博士生中,白人 (非西班牙裔) 所占比例最高(45.6%) ,其次是亚洲人 (22.4%),非洲裔美国人(非西班牙裔,2.4%)和西班牙裔(3.2%)占比很低。
第七章:AI 与国家战略
未来几十年,AI 将重塑全球竞争力格局,为早期实践者带来强大的经济和战略优势。报告的第七章介绍了全球 AI 政策制定的概况,对当下各国家和地区的 AI 战略进行了梳理。此外本章还介绍了美国对 AI 领域的公共投资,以及立法机构、中央银行和非政府组织如何应对日益增长的 AI 技术政策框架需求。
自加拿大 2017 年发布了全球第一个国家级人工智能战略以来,截至 2020 年 12 月,已有其他 30 多个国家和地区发布了类似文件。中国在 2017 年发布了《新一代人工智能发展规划》,这是世界上最全面的人工智能发展战略之一。
2019 年 2 月,白宫发布《美国人工智能倡议》,将联邦政府 AI 研发的投资需求列为优先事项,确保 AI 技术的安全开发、测试和部署的技术标准。该倡议还强调要培养一支 AI 人才队伍,并表示将致力于与国际伙伴合作,提升美国在 AI 领域的领导地位。然而,这项倡议缺乏项目时间线细节,目前尚不清楚是否会有更多致力于 AI 的研究或其他实际内容。
政府对 AI 的关注度依然高涨,美国政府在 AI 的民用和非民用方面投入了数十亿美元。在本届国会中,AI 的提及量是上一届的三倍。
2019 年和 2020 年的综合数据表明,创新与技术、国际事务和国际安全、工业和监管等主题是美国人工智能政策文件的主要关注点。
AI Index 联合主席 Jack Clark 表示:「从数据中可以清楚地看到,2020 年人工智能对世界产生的影响更加重要,技术仍将以飞快的速度向前发展。」
「这份报告还向我们强调,政府需要投入更多的资金来收集有关 AI 的数据,研究者需要为新一代 AI 系统开发更难的测试。各种维度的文献分析表明,在人工智能发展方面,美国和中国已经成为彼此对等的国家。」