open我们需要怎样的人工智能?是时候来一场讨论了

open我们需要怎样的人工智能?是时候来一场讨论了
文章插图
艾达·拉芙蕾丝,19世纪女英国的一位女数学家,诗人拜伦之女,在一份1843年出版的笔记中针对查尔斯·巴贝奇设计的世界上第一台可编程计算机提出建议,对机器进行编程以计算伯努利数的数据输入,这个最终遗憾留于纸上的设想被认为是第一个计算机程序。
103年后,美国人莫克利和艾克特发明了世界上第一台通用计算机“ENIAC”。1971年,Kenbak Corporation的Kenbak-1诞生,人类历史上首次个人电脑的普及迹象出现。
然后是2.97亿台,这是2020年全年全球PC市场的出货量数据。全球互联网的年耗电量在2017年已经超过2万亿度电,接近美国整个国家年用电量的一半,需要200个三峡大坝高负荷运转来抵兑。今时今日,日常的工作与生活已无法远离计算机。
与此同时,一个疑问在近几年屡次回头看向那位178年前的女性先驱:未来,程序员会消失吗?
人工智能站在这个天平的另一侧,机器代替人类思考的浪漫幻想在经历过几次低潮后,在21世纪的第二个10年里再度进入蓬勃发展的阶段。诸如Open AI Codex和Github Autopilot的出现则让那个虚无缥缈的发问越来越有了些逼近现实的味道。
今年八月Open AI发布最新技术Codex API,这个技术指向自然语言与代码之间的转化。OpenAI表示Codex API已经支持包括Python、JavaScript、Ruby等多种主流编程语言。可以将简单的自然语言(比如英语)转变成代码并且代替用户执行。这意味着毫无编码基础的普通人只要能用规则的人类语言给出需求,相应的程序就能被编写出来。
在编程技术的早期,使用汇编语言是编程的常态,之后这种繁琐的“低级语言”被另一种“高级语言”替代,也就是Python、Java、C、C++、这样的编程语言,这在编程效率,可读性以及与人类正常思维逻辑的贴近上更进一步。而“高级语言”之后的下一步趋势则是低代码或无码,开发者的工作进一步简化为顶层的决策者,不同经验水平的开发人员通过图形用户界面,使用拖放式组件和模型驱动逻辑来创造应用程序。低代码到无码的进一步开发降维,则几乎完全依赖于人工智能的发展。
open我们需要怎样的人工智能?是时候来一场讨论了
文章插图
Codex API是人工智能最新的进展之一,在其他更多子领域里,诸多突破性的进展同样正在出现。
ImageNet,一个包含近200个类别,近1500万张图像的数据集,常被用于计算机视觉下目标识别等领域的人工智能算法训练。ImageNet下的训练包含Top-1和Top-5两个准确率标准,即识别结果中第一顺位或前五顺位中包含正确答案的概率。
斯坦福大学《人工智能指数 2021 年度报告》中的数据显示,谷歌大脑团队的模型使用ImageNet预训练数据的最新系统在Top-1准确度在2021年1月达到了90.2%的最高准确率。而在2012年12 月,当时的系统每10次尝试中会出现4次错误。
这种精确性的提升与训练时间的缩短同时发生,MLCommons(一个非盈利性机器学习开放组织)组织举办的使用公共(残差网络)架构训练ImageNet网络的竞赛显示,ImageNet上的训练时间从2018年末的6分钟下降到2020年7月份的47秒。
Cityscapes是另一个关于城市街道场景的语义理解图片数据集,包含5000张高质量、像素级标注的图像和20000张每周标记的图像,用于深度神经网络的模型训练。语义分割是计算机视觉中的核心问题之一,场景理解基于静态2D图像、3D数据甚至体数据的识别能力,这极大约束着计算机视觉技术能在多大程度被运用进现实场景。近几年Cityscapes上的像素级语义标注任务挑战显示,2020年的参赛者基于交并比(IoU) 的分割准确度平均值比起2014年大幅提高了35%。