上科大、IEEE Fellow 虞晶怡:我眼中的城市元宇宙 |第四届中国人工智能安防峰会

上科大、IEEE Fellow 虞晶怡:我眼中的城市元宇宙 |第四届中国人工智能安防峰会
文章图片
作者|李溪
编辑|余快
2021年12月11日 , 由雷峰网&AI掘金志主办的第四届中国人工智能安防峰会 , 在深圳正式召开 。
本届峰会以「数字城市的时代突围」为主题 , 会上代表城市AIoT的14家标杆企业 , 为现场和线上观众 , 分享迎接数字城市的经营理念与技术应用方法论 。
作为上午场的开场嘉宾 , 虞晶怡从深度学习的角度 , 从建模、渲染以及隐私保护三个方面分享了对未来城市元宇宙的理解 。
虞晶怡提到 , 他所研究的计算机视觉领域一个非常重要的任务 , 就是完成物理世界向数字世界的映射 。 为了完成这个映射 , 产生了非常多的概念 , 比如最早的数字孪生 , 到现在的元宇宙 。 但无论是什么概念 , 归根到底需要解决几个核心问题:
三维建模如何完成?图像分析如何完成?隐私保护如何完成?
虞晶怡教授从四个方面出发阐述了对以上问题的理解:
计算成像、三维重建、智能融合、隐私保护 。
2D计算成像 。 过去几年 , 编码成像取得了很大的进步 。 在图像质量方面 , 利用编码成像可以在高速和离焦的情况下获得更好的图像 。
虞晶怡指出 , 做智慧城市离不开三维重建 。 计算机视觉界已经做了很多年 , 其中最为出色的解决方案来自谷歌的“一日建模” 。 具体有三个步骤:通过针对大量图像进行位置猜测 , 再通过特征提取获取精确的相机位置 , 再对图像特征进行匹配和三维确认 , 最后得到模型 , 这个方式在大规模城市重建中非常常用 。
基于神经网络深度学习的最新方法 , 即2D+3D融合 。 因为很多智慧城市模型并不精确 , 将城市进行三维重建后 , 把二维的贴图与三维模型融合 , 可以得到多视角视频 。
最后 , 虞晶怡教授着重分享了隐私保护 , 他认为重建做得无论多好 , 最重要的是保护隐私 。
以下是虞晶怡演讲全文 , 雷峰网AI掘金志作了不改变原意的整理与编辑:
今天给大家分享一个我认为非常有意思的话题 , 主题叫《ThefutureofMetaCity:Modeling , Rendering , andPrivacyProtection》 , 讲讲我眼里的元城市 , 我会从深度学习的角度分享如何建模、如何渲染 , 以及最重要的如何保护个人隐私 。
上科大、IEEE Fellow 虞晶怡:我眼中的城市元宇宙 |第四届中国人工智能安防峰会】大家讨论的智慧城市是什么?这是一件很有意思的事情 。 我记得很多年前王坚博士跟我有个讨论 , 他想要知道智慧城市的一个功能 , 比如“你能不能告诉我现在马路上有多少辆车在开?”
这个问题听上去好像很简单 , 其实很复杂 , 虽然我们已经有大量摄像头 , 但每个摄像头只能看到城市中很小一部分的车辆 , 如何统计出它们分别在什么位置 , 如何计算出有多少车辆是非常大的挑战 。
我研究的领域是计算机视觉 , 其中一个非常重要的任务是完成从物理世界向数字世界的映射 。 完成了这个映射 , 大家就可以玩各种概念 。 而从最早的数字孪生到现在的元宇宙 , 归根到底 , 需要解决几个核心问题:
三维建模怎么完成?图像分析怎么完成?隐私保护怎么完成?
今天的演讲主要分为四个部分:计算成像、三维重建、基于神经网络深度学习的最新方法、隐私保护 。
计算成像/2D高清图像/智能视觉
第一部分 , 所谓的2D高清图像 , 就是传统的计算成像 。 过去二十年我一直在做计算成像 , 设计了各种各样的相机系统 。
相机系统本身很复杂 , 有很多组成部分 , 比如相机的镜头、快门、闪光灯、光圈以及各相机阵列 。 得益于计算成像 , 在获取图像之后可以通过各种计算方法对图像进行进一步的分析 , 基于此 , 我们已经可以做很有意思的事情了 。