您的位置:首页 >智能机器人 >

用声音信号为盲人引路 让AI做你的眼睛

2020-12-16 08:55:50    来源:科技日报

“我们应该激励更多为视障人士创新的技术成果,让其尽早转化成真正让视障人士受益的产品,这需要构建一个良好的创新生态。”

日新月异的科技力量正为视障人士“重见光明”带来希望。

11月底,谷歌表示,其研发的一款人工智能系统,能够帮助视障人士独立参加跑步比赛。据悉,依靠该系统,视障人士不需要依靠人类向导或导盲犬自己便可以跑完全程。那么,这款人工智能系统如何让视障人士参加跑步比赛?近年来在帮助视障人士恢复视力等方面,人工智能有哪些阶段性成果?目前这些产品距离应用还有多远?

用声音信号为盲人引路

现在很多崇尚健身的人喜欢挑战马拉松,而盲人如何参与跑完“半马”或“全马”呢?一位公益组织人员介绍,盲人要参加此类比赛,需陪跑者的帮助。为了方便跑步,盲人和陪跑者之间有1条牵引绳,分别套在各自的手腕上,如同牵手跑步。为了确保盲人在跑步中万无一失,有时需要两位陪跑者。但是,盲人平时训练时,随时找个陪跑者似乎不太现实。

最近,不少城市开始允许导盲犬进入地铁、公交车。然而,国内导盲犬的数量十分有限,据统计,截至2017年,导盲犬的数量仅为116只,比大熊猫还稀少,而需要导盲犬服务的视障人士却多达800万人左右。每训练一只导盲犬需要耗费12万元—15万元,导盲犬的寿命约为十几年,视障人士即使有幸排到一只,但当它退役之后,视障人士又该如何外出,也是个值得思索的问题。

谷歌开发的这套系统似乎让我们看到了希望。“这个系统,不需要让视障人士依靠人类向导或导盲犬即可自己跑完全程。”远望智库AI事业部部长、图灵机器人首席战略官谭茗洲说。

据介绍,这个应用程序使用人工智能模型来识别道路上的一条画线,并推断出跑步者与这条线的关系。如果跑步者离线太远,该应用程序就会向他们佩戴的骨导耳机发送信号,播放令人不快的噪音。声音是哪只耳机发出的、音量有多大,都能让跑步者知道他们需要移动的方向及其离终点有多远。

谭茗洲解释道,这有点像汽车上使用的接近警报,当汽车离可能发生碰撞的地方越近时,警报的声音就会越大,频率也会越快。使用谷歌的这个系统,跑步者需要把一部安卓手机与经设计的腰带绑在腰上。这款应用程序不需要连接互联网即可工作,而且还可考虑多种光照和天气条件。显然,若在一些社区,专门为视障人士建立带有指引标志的赛道,他们自己便可以安心愉快地奔跑健身。

构建无障碍场景,所感如所见

“视障人士只是眼睛看不见,声音是可以听到的,目前的AI科技让他们真正看见世界不太可能,但可以让他们体验到‘如同看见’的效果。”谭茗洲指出。

如今,许多互联网公司都通过各种方式成功让视障人士与他们提供的服务实现互动,主要方法就是将文本转变成由屏幕阅读器发出的语音。4年前,脸谱公司(Facebook)发起“无障碍倡议”,尝试采用人工智能技术来丰富盲人、聋人和其他残疾人士的用户体验,重点工作之一是重新设计菜单和按钮结构,运用自动口译某些照片和视频的算法使其能为屏幕阅读器所用,为视障用户提供丰富的场景描述。

作为美国一位专业徒步旅行者,视障人士特雷弗·托马斯时不时在脸谱上与粉丝分享其带着爱犬到一些山径和步道徒步旅行的照片和视频。他感慨道:“之前因看不见照片,我对是否使用脸谱无所谓,而现在我无法想象没有脸谱的日子了。”例如,对于旧金山湾落日的照片,含有人工智能技术的屏幕阅读器会如此描述:这张照片含有自然、户外、云朵、草地、地平线、植物或树木;一对夫妇带着孩子站在加州丹麦城著名风车前面的照片,屏幕阅读器诠释:这张照片包括了3个人,微笑,户外。

“显然,这些解释不能对照片进行全面描述,但在没有人工帮助的前提下确实能填补某些空白,视障人士仅需点击阅读器来描述,而无须他人来做解释。”谭茗洲说。

瑞士eyra公司专门为视障人士研发了一种助读设备。据介绍,这个装置由三部分组成:挂在耳朵上面的骨传导耳机及其上面的高清摄像头,还有AI处理器。AI处理器可以将文本转化成有声小说,当然也不用担心噪音干扰的问题,因为是骨传导,可以一定程度上减少噪音干扰,给视障人士的生活带来便利。

今年在拉斯维加斯举办的世界最大消费类电子产品展会上,一款智能手机可以通过语音讲述周围的世界,赋予视障人士和弱视用户更丰富的视觉体验。该应用还可适配智能眼镜,可将用户的智能手机摄像头变成用户的眼睛。据介绍,其利用人工智能识别摄像头指向的视觉信息,包括食品包装、海报和显示屏,比如超市的商品信息、车站的显示投屏、街边的海报。此外,还可以识别记录亲朋好友的面孔,用户可以用其扫描和寻找周围的人和事。

三方面发力,释放科技的人文关怀

据美国劳工部和美国盲人联盟的统计资料表明,目前视障人士可以顺利就业的职业达147种。因此,有学者提出,要想改变视障人士的就业现状,教育是关键一步,特殊教育也需科技化。

目前,很多专为视障人士设计的解决方案,正凸显着人工智能应用的多样化和人性化。那么,如何加速人工智能产品的突破性运用,让冰冷科技释放出人文关怀?

谭茗洲指出,这需要三方面发力。首先要培育创新生态。“在2017年德勤全国创新精英挑战赛总决赛上,一支四川大学在校学生团队研发的一款视障人士Kindle阅读器获奖。”谭茗洲说,我们应该激励更多像这样为视障人士创新的技术成果,不让其沉睡,尽早转化成真正让视障人士受益的产品,这就需要构建一个良好的创新生态。

此外,要解决算力和成本之间的矛盾。谭茗洲介绍,机器学习训练往往要消耗大量的算力,操作中会出现时间上的延迟与信息隐私的安全隐患,这就要将AI算法中的数据上传到云端完成。而要满足终端AI推理运算的实时、可用性需求,就要在本地处理大量的数据,但若在终端本身部署高性能的AI芯片,从成本控制上来看不大现实,在实体场景中部署足够多的边缘AI更具一定可行性。

边缘计算可看作是5G+AI+云计算的绝佳辅助——“神经末梢”。比如AI导盲杖要实现实时交互与判断,看到红绿灯变绿,能够自动判断出“可通行”的状态。运用边缘计算就不必将路灯信息上传到云端,经云服务器层层判断才发出行走的提醒。这无疑大大减少延迟带来的行进风险,也降低云端计算的超负荷。

最后,还需要等待产业环境的全面成熟:基础设施的完善,软硬件基本到位,这样可在终端设备上更好运行深度学习算法。“加强5G智能网络建设,保障云计算及边缘计算的每一个节点高效可靠利用。”谭茗洲指出。

关键词: AI

相关阅读

精彩推送