盲人软件,盲人创业者曹军介绍


盲人软件,盲人创业者曹军介绍

文章插图
今天是“国际盲人日” 。自1984年成立以来,包括中国在内的世界各国都为盲人组织了各种活动来表达他们的关心 。今年盲日前夕,百度推出度莱特(百度小明)展示了用科技改变盲人生活的想法:在黑暗中,只有通过触摸,我们才能感知世界的日子或过去,“一个微笑的24岁女人”、“一把漂亮的红色椅子”和“100%纯果汁”.在这些科技之眼的帮助下,生活中的物体和场景从图像变成了声音,帮助盲人朋友变得越来越多 。
早在2007年,百度公司就推出了百度盲道:视障人士在线阅读信息、参与社区互动、听歌、访问互联网其他相关网站的专用入口 。该功能将百度新闻搜索、百度网页搜索、百度MP3搜索、百度贴吧、百度知道、百度百科、好123网站导航升级为盲版,页面设计充分考虑了视障人士的需求,方便他们使用 。
2013年,盲人开发团队负责人曹骏致信百度CEO李彦宏,希望能得到百度的资金和技术支持,开发一款盲屏阅读软件 。在百度团队的帮助下,曹骏的公司成功开发了读屏软件,帮助盲人使用手机 。
【盲人软件,盲人创业者曹军介绍】在与盲人接触的过程中,百度公益工作人员发现了更多制约盲人日常生活的问题,如人民币不易被盲文识别、包装大小相近的药盒无法区分等,希望通过技术和人工智能来解决 。于是,百度公益联合百度研究院、IDL深度学习实验室,将这些盲人的现实生活需求转化为驱动力,尝试通过图像识别、大数据等技术,打造一款专门为盲人服务的硬件 。
努力没有白费 。今年9月8日,百度推出了DuLight,展示了百度用科技改变盲人生活的理念 。技术进步为杜勒特的诞生提供了基础 。除了原有的独立手机应用之外,DuLight还加入了轻量级的新硬件,成功完成了向全系列盲人个人助理操作系统的转型 。此时,它将被用作盲人的新生活助手和新搜索服务的启动门户 。
依托百度大脑的图像识别、人脸识别、语音识别、深度学习等核心技术,DuLight已经被制作成盲人日常生活的个人助手,帮助盲人朋友了解周围环境,识别物体、人和硬币 。此外,它还可以帮助盲人在紧急情况或特殊情况下发起实时远程视频援助 。
面对纯牛奶、果汁等触摸无法分辨的产品,通过度莱特的图像识别功能,只需对准物品拍照,度莱特就能准确快速地将物品信息传递给盲人;纸币的大小差别不大,盲文也不够清晰,无法查出手里有多少钱 。通过图像识别功能,即使只扫过硬币的一角,DuLight也能准确报告硬币的面值,帮助盲人朋友支付购物费用;老朋友已经来到前线,但他们不知道自己是谁 。很难通过声音说出对面陌生人的大致年龄和身份 。这些麻烦可以在杜立德的帮助下顺利解决 。
在一些复杂的场景中,比如一个人在家需要寻找特定的药物时,或者在路况复杂的路段需要过马路时,盲人朋友总是不知所措 。如今,通过DuLight,你可以一键发起远程视频协助,向朋友寻求帮助 。得到帮助后,帮助者会从盲人朋友那里得到同样的视角,用实时语音帮助解决问题 。
此外,在产品设计上,通用界面设计和界面辅助工具相互配合,方便视障群体更好地识别屏幕上的文字和图像 。DuLight还实现了盲人友好语音的交互命令和对话,根据用户需求和语言命令执行相应功能,为用户提供可调节的语音播报速度,充满人性化 。触控硬件功能识别的工业设计也使得硬件外观的质感设计更加合理,方便盲人通过触摸调整视角 。
据百度企业社会责任经理陆健介绍,度莱特目前还处于研发初期,后期会通过不断迭代,加入更先进的技术和功能,更好地为盲人服务 。
秘密
1.图像识别
图像识别技术是指通过计算机识别图像内容并提取语义信息的过程 。典型的任务包括目标识别、目标检测、图像分类和标记等 。它在图像数据的智能分析和管理中起着至关重要的作用 。
经过长期的努力,百度构建了一个比较完整的图像识别系统,不仅可以有效地处理特定对象(如人脸、字符或商品)的检测和识别,还可以实现图像分类和标注、基于对话的图文综合理解识别、主观图像质量评估等应用 。
ze:15px;">2.人脸识别
人与人之间大量的互动让人脸识别成了最为实用的图像识别细分领域 。相比于无领域限制的图像识别,聚焦在人脸上的识别技术显然能够做到更加精准与高效 。
百度现有的人脸识别技术已经具备了很强的识别用户的能力,这项技术可以对用户的性别、年龄、面部表情等特征进行辨识,还可以区分不同的用户 。
3.语音识别
Dulight采用领先的DNN声学模型,使得语音识别更加精准 。基于大量语言模型建立起来的语音识别系统,能够实现更好的人机互动 。海量文本语料做基础,同时对文本库进行实时更新,提升语音识别的效率和质量 。(于文)