百度将会开放AR平台DuMix AR,公布AI核心技术

vr2Vr2 2017-7-6 669 0

7月5日,百度AI开发者大会(Baidu Create 2017)在北京国家会议中心举行,其中举办了以“开放创新 共襄AI未来”为主题的AI技术与开放平台分论坛。

百度副总裁、百度AI技术与平台体系(AIG)总负责人王海峰在开场致辞中表示,百度在人工智能领域深耕多年,从十七年前百度诞生之日起就开始积累,几乎所有主要人工智能技术都已在百度搜索引擎中得到应用,来自搜索引擎的用户需求、数据和平台,支撑了百度AI技术的快速发展,现在百度人工智能在算法、数据、技术等方面具有领先优势。

“在每天数十亿次用户请求的千锤百炼下,百度的人工智能技术,是真正实用的人工智能技术,”王海峰认为,只有将技术与实际应用相结合,根据用户需求和反馈反复迭代优化,才能打造强大、更具活力的AI技术。

此次,百度多年打造的完整AI技术平台将全面开放。百度的AI能力分为四层。在基础层,是AI算法、大数据、大计算能力。感知层,包括语音、图像、视频、AR/VR等技术。认知层,有自然语言处理、知识图谱及用户画像等。在平台层,基础层、感知层、认知层的技术会平台化,通过百度AI开放平台ai.baidu.com开放,与开发者共享。截至目前,百度AI开放平台上开放的技术能力总共有60个。

视频分析、人脸识别和增强现实技术

此次分论坛上,百度研究院院长林元庆介绍了视频分析与理解、机器人视觉和人脸识别等技术。同时,本次开发者大会还发布了全面的视频语义理解技术,包括视频封面选摘、视频分类、视频比对、细粒度识别、视频审核、视频公众人物识别、视频结构化分析等。此外,林元庆还介绍了世界第一个室外语义分割RGBD视频数据集,以及完整的机器人视觉解决方案。

增强现实(AR)技术作为全新的视觉交互形式,越来越受到营销、娱乐、游戏等行业关注。百度增强现实实验室主任吴中勤现场发布全新DuMix AR开放平台,为开发者提供AR SDK、内容制作工具、云端内容平台和内容分发服务。吴中勤表示,未来百度将提供更多场景的AR行业解决方案,赋能各行各业,共同探索AR价值。

60项开放技术打造能力完整、组合丰富的开放平台

此次宣布开放的语音、自然语言处理、视频、增强现实、机器人视觉等技术,与已经开放的AI技术一起,构成具有60项开放技术的完整的、综合的AI开放平台,为开发者提供形式多样、可定制、可组合的AI技术,满足开发者从API、源码、数据到计算能力的多层次需求。

数据显示,百度AI开放平台语音API外部在线调用量半年增长300%,图像API调用量半年以来保持月增长超200%。

语音技术+自然语言处理让机器更懂需求

语音交互成为人机交互的下一个风口,语音技术需求日益增加。百度语音技术部总监高亮在分论坛现场介绍了本次新开放的远场识别及语音唤醒、定制化语音合成、语音合成音色、 情感语音交互(Emotional CUI)等技术,开发者可以实现不同场景的智能应用,满足用户需求。

百度在开放语音技术,让机器听清用户的同时,更重要的是开放能让机器懂得用户需求的自然语言处理技术。此次分论坛由百度自然语言处理部总监赵世奇详细介绍了能力强大的语言理解与交互技术平台——UNIT。

该平台将开放语言理解技术、交互技术,从百度大数据中自动汲取最有价值的数据提供给开发者使用,为开发者提供多种定制化方案,还首创“训练师”模式,助力开发者训练对话机器人,赋予机器“理解”自然语言,听懂用户需求,以及与用户进行多轮次对话的能力。今年"百度之星"开发者大赛的命题就是基于UNIT平台提供的语言理解与交互技术,“设计和开发一个以对话式人机交互为核心的智能产品”。

在AI技术与开放平台分论坛上,除了发布新开放的核心技术能力,百度杰出科学家徐伟批露了PaddlePaddle的发展路径,宣布百度会开源代码、开放大规模数据集、开放计算能力、开放应用模型库。

本次大会主论坛上,百度集团总裁兼首席运营官陆奇强调,“Apollo强大的生态、DuerOS唤醒万物的能力,都是基于百度大脑,都是用百度大脑来获得越来越多的知识和能力,它们都是基于百度智能云上。”

猜你喜欢:

 

点赞 0 收藏 0
国内最大的 Vision Pro 内容平台 - 创造家

评论 (0)