向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
生态文明如何改变中国?******
(生物多样性大会)生态文明如何改变中国?
中新社昆明10月15日电 题:生态文明如何改变中国?
——专访中国社科院生态文明研究所所长张永生
中新社记者 阮煜琳
在以“生态文明”为主题的2020年联合国生物多样性大会上,“生态文明”“绿水青山就是金山银山”等成为热频词,生态文明又是如何影响并改变着中国?正在昆明参加大会的中国社科院生态文明研究所所长张永生接受中新社记者专访时提出,生态文明正在引领一场全面而深刻的发展范式的转型,在生态文明新发展范式下,中国将进入高质量发展时代。
联合国《生物多样性公约》及第十五次缔约方大会(COP15)主题为“生态文明:共建地球生命共同体”,这是联合国首次以“生态文明”为主题召开的全球性会议。
联合国环境规划署执行主任英厄·安诺生说,此次大会重申了中国对符合生态文明理念的全球生物多样性保护议程的承诺,“绿水青山就是金山银山”的理念已被中国社会广泛接受,这提升了中国在生物多样性保护方面的引领者地位。
发展范式的全面深刻转变
中共十八大以来,中国生态文明建设从认识到实践发生了历史性、转折性、全局性的变化。“绿水青山就是金山银山”已经成为中国全社会的共识,绿色发展理念逐步深入人心。
张永生说,从传统工业文明到生态文明是工业革命以来划时代的变革。中共十八大以来,生态文明被写入宪法、党章,并成为“五位一体”总体布局的重要内容。习近平生态文明思想,正是中国共产党领导中国人民艰辛探索“人与自然和谐共生现代化”的产物。生态文明意味着发展理念和发展范式的全面深刻转变。
“发展的根本目的,是提高人们的福祉”,张永生说,但在传统发展模式下,不仅发展的目的和手段很大程度上本末倒置,而且这种模式还带来了不可持续的全球生态环境危机。人类社会的发展,正面临一个重要的历史关口。
张永生认为,习主席在大会上提出的各国“携手同行,开启人类高质量发展新征程”的倡议,包括“以生态文明建设为引领,协调人与自然关系”等四点内容,都是关于发展的最基本问题的深刻反思,是在中国发展实践和5000年中国传统文化基础上形成的中国智慧。高质量发展道路是对过去传统发展道路的纠偏,即从过去过于国内生产总值(GDP)导向,回到提高人民福祉这个发展的初心。
这种转变在中国如何发生?
据张永生介绍,中国社科院生态文明研究所日前和腾讯联合开展的“数字生态文明实验基地”研究项目,通过1万余份网络问卷调查和350多万份公开热帖和评论样本大数据分析显示,生态文明正全方位深刻地改变中国。
“民众关于环境与发展关系的认识和选择,均在发生重大转变。如调查显示,只有10%左右的民众认为,环境破坏是经济必须付出的代价。在环境与发展之间,绝大部分人不愿意以牺牲环境为代价提高收入”,张永生说。
“但由于现有的发展概念和发展模式大多是在传统工业时代形成,很多人对目前在中国以及全球范围正在发生的这场深刻变革却浑然不觉”,张永生说。
对于这种转变在中国如何发生的,张永生提出,首先,生态文明建设明显提升中国发展质量和民众福祉。在经济因为进入新发展阶段而增速放缓的情况下,民众生活满意度却持续提升。
同时,生态文明正在引领一场全面而深刻的发展范式转型,包括发展理念、美好生活、消费观念、商业模式、就业观念、福祉等概念,均在发生深刻变化。
再者,传统工业时代建立的发展理论,很多都明显同现有事实不符。需要在生态文明新的视角下,对传统工业时代形成的发展理论和现代化概念进行深刻反思和重建。
生态文明绿色发展时代开启
“十四五”时期,中国生态文明建设进入了以降碳为重点战略方向、推动减污降碳协同增效、促进经济社会发展全面绿色转型、实现生态环境质量改善由量变到质变的关键时期。
张永生说,随着生态文明建设的全面推进,传统工业时代形成的发展范式必然发生深刻转变,包括发展理念、发展内容、资源概念、商业模式、体制机制和政策等,均会发生深刻转变。全球范围的碳中和共识与行动,标志着传统工业时代的落幕,一个新的生态文明绿色发展时代的开启。
张永生表示,这种划时代的转变,正好同中国开启全面建设社会主义现代化国家新征程的时间节点相吻合。在生态文明新发展范式下,中国将进入高质量发展时代,实现人与自然和谐共生的现代化。(完)
(文图:赵筱尘 巫邓炎) [责编:天天中] 阅读剩余全文() ![]() 盈彩彩票地图 |