open我们需要怎样的人工智能？是时候来一场讨论了创新团队|技术|气象|预报|雷达

文章插图
艾达·拉芙蕾丝，19世纪女英国的一位女数学家，诗人拜伦之女，在一份1843年出版的笔记中针对查尔斯·巴贝奇设计的世界上第一台可编程计算机提出建议，对机器进行编程以计算伯努利数的数据输入，这个最终遗憾留于纸上的设想被认为是第一个计算机程序。
103年后，美国人莫克利和艾克特发明了世界上第一台通用计算机“ENIAC”。1971年，Kenbak Corporation的Kenbak-1诞生，人类历史上首次个人电脑的普及迹象出现。
然后是2.97亿台，这是2020年全年全球PC市场的出货量数据。全球互联网的年耗电量在2017年已经超过2万亿度电，接近美国整个国家年用电量的一半，需要200个三峡大坝高负荷运转来抵兑。今时今日，日常的工作与生活已无法远离计算机。
与此同时，一个疑问在近几年屡次回头看向那位178年前的女性先驱：未来，程序员会消失吗？
人工智能站在这个天平的另一侧，机器代替人类思考的浪漫幻想在经历过几次低潮后，在21世纪的第二个10年里再度进入蓬勃发展的阶段。诸如Open AI Codex和Github Autopilot的出现则让那个虚无缥缈的发问越来越有了些逼近现实的味道。
今年八月Open AI发布最新技术Codex API，这个技术指向自然语言与代码之间的转化。OpenAI表示Codex API已经支持包括Python、JavaScript、Ruby等多种主流编程语言。可以将简单的自然语言（比如英语）转变成代码并且代替用户执行。这意味着毫无编码基础的普通人只要能用规则的人类语言给出需求，相应的程序就能被编写出来。
在编程技术的早期，使用汇编语言是编程的常态，之后这种繁琐的“低级语言”被另一种“高级语言”替代，也就是Python、Java、C、C++、这样的编程语言，这在编程效率，可读性以及与人类正常思维逻辑的贴近上更进一步。而“高级语言”之后的下一步趋势则是低代码或无码，开发者的工作进一步简化为顶层的决策者，不同经验水平的开发人员通过图形用户界面，使用拖放式组件和模型驱动逻辑来创造应用程序。低代码到无码的进一步开发降维，则几乎完全依赖于人工智能的发展。

文章插图
Codex API是人工智能最新的进展之一，在其他更多子领域里，诸多突破性的进展同样正在出现。
ImageNet，一个包含近200个类别，近1500万张图像的数据集，常被用于计算机视觉下目标识别等领域的人工智能算法训练。ImageNet下的训练包含Top-1和Top-5两个准确率标准，即识别结果中第一顺位或前五顺位中包含正确答案的概率。
斯坦福大学《人工智能指数 2021 年度报告》中的数据显示，谷歌大脑团队的模型使用ImageNet预训练数据的最新系统在Top-1准确度在2021年1月达到了90.2%的最高准确率。而在2012年12 月，当时的系统每10次尝试中会出现4次错误。
这种精确性的提升与训练时间的缩短同时发生，MLCommons（一个非盈利性机器学习开放组织）组织举办的使用公共(残差网络)架构训练ImageNet网络的竞赛显示，ImageNet上的训练时间从2018年末的6分钟下降到2020年7月份的47秒。
Cityscapes是另一个关于城市街道场景的语义理解图片数据集，包含5000张高质量、像素级标注的图像和20000张每周标记的图像，用于深度神经网络的模型训练。语义分割是计算机视觉中的核心问题之一，场景理解基于静态2D图像、3D数据甚至体数据的识别能力，这极大约束着计算机视觉技术能在多大程度被运用进现实场景。近几年Cityscapes上的像素级语义标注任务挑战显示，2020年的参赛者基于交并比(IoU) 的分割准确度平均值比起2014年大幅提高了35%。