2019百度 AI开发者大会最硬核:百度大脑奉上前沿技术创新饕餮盛宴

  • 日期:07-27
  • 点击:(1763)


“技术前沿,覆盖范围广,这是一个没有插槽的分论坛”

“技术说明详细,着陆案例就足够了。这是一个“物有所值”的分论坛.

7月3日下午,“百度创建2019”百度AI开发者大会百度脑论坛如期举行。在上午的主要论坛上,百度CTO王海峰正式发布百度脑5.0,实现了历史上最大的跨越式升级。基于算法突破和计算架构升级,实现了AI算法,计算架构和应用场景的集成。它已成为生产软硬AI的平台。

img_pic_1562221857_0.jpg

(百度首席技术官王海峰)

引人注目的“茶碗机械臂”,任性的“中英文自由”,以及智能语音芯片“百度红军”.都给观众留下了深刻的印象,带来了距离人工智能技术与人与人之间这背后隐藏着哪些顶级技术?为什么百度脑5.0称为软件和硬件的AI大生产平台?下午充斥着“技术粉丝”的百度脑论坛一个接一个地亮相。

语音,视觉,语言和知识AI算法创新齐头并进

经过大量升级的百度脑5.0开辟了从深度学习技术的基本层到一般AI功能,应用技术解决方案,定制模型,最终部署和集成,整个人工智能工业应用登陆,标准化的所有流程实现了AI技术的自动化和模块化。

百度脑语音技术一直引领着行业创新,已经在语音识别,语音合成和远场语音交互芯片中提供了成绩单。百度语音技术部高级主管高亮介绍,在识别方面,百度提出了一种多级截断注意模型SMLTA,这是第一个在整个句子之外实现局部注意建模的国际关注模型。这也是世界上第一次。在线语音使用大规模的注意力模型。 SMLTA极大地提高了识别速度,同时提高了识别准确率。在输入法中,有效积的相对精度提高了15%,扬声器有效积的相对精度提高了20%。在综合方面,针对这一阶段的风格迁移,音调模拟和情感拟人化这三个挑战,百度推出了语音合成技术Meitron,它可以将声音,风格,情感和其他元素映射到不同的子空间。可以任意组合不同的元素以灵活地控制合成语音的风格。同时,降低语言合成的门槛,你只需要20个句子就可以成为一个人的专属声音。

img_pic_1562221857_1.jpg

(高亮,百度语音技术部高级总监)

对于着陆应用,最终需求量巨大。百度Brain Voice团队为远场语音交互开发了一个芯片。宏盛芯片的设计,传统芯片设计方法的转变,遵循“软件定义芯片”的新设计理念。该芯片采用双核HiFi4架构,2.8M大容量内存和TSMC 40nm技术。在该硬件规范中,大约100mw的平均工作功耗可以支持远场语音交互核心的阵列信号处理和语音唤醒能力。同时,根据汽车级标准,公司可以满足极其严格的要求,这将为汽车语音交互和智能家居场景带来更多想象。同时,公司已实现批量生产。

百度视觉技术在2019年的主要国际比赛中开启了“开放”模式,并在不久前结束的CVPR中赢得了视频理解,面对生活,车辆REID等的第一名。在今年上半年,NTRIE2019,ICME2019,ICDAR2019,DWAN2019等比赛多次获得冠军。百度视觉技术部门和增强现实技术部门主任吴忠钦介绍,在5G时代,越来越多的物理设备将连接到高可靠性,低延迟的网络空间,这将彻底改变人们与之交互的方式。环境和设备。 Visual Semantic Platform 2.0的这一新版本正在推动视觉技术的推广,从“视觉清晰”到“互动”。 Visual Semantic Platform 2.0在交互式升级和硬件与软件集成方面实现了突破。

img_pic_1562221857_2.jpg

(吴忠勤,百度视觉技术部和增强现实技术部主任)

交互式升级包括集成的人机交互系统和大规模的物理世界交互系统。简单来说,集成的人机交互系统是人与机器和虚拟环境之间的自然交互和集成。该系统适用于实现实时效果,小视频,特效和AR特效的其他程序。它已被应用于百度的各种视频应用程序。大规模物理世界交互系统将视觉定位与AR技术相结合,实现了对各种虚拟信息和物理世界的精确叠加,从而在AI时代建立了一个新的交互系统。目前,硬件和软件的结合可以满足应用场景的更高效的可视化计算,以及在保护数据隐私的同时降低延迟体验。百度的视觉硬件和软件组合主要集中在模型压缩平台PaddleSlim,多模态FaceID开发组件以及软件和硬件集成解决方案AI相机上。 FaceID覆盖设备的数量已超过1200万台。

Visual Semantic Platform 2.0更新了许多先进的传感技术,并在机器人领域实现了新的突破。根据百度3D视觉首席科学家杨瑞刚的说法,机器人是代理商。除了感知技术,代理商还需要决策和行动相关技术来实现情境感知和主动感知。目前,百度对代理技术的研究主要集中在三个方面:自动驾驶仪阿波罗,工程机械和服务机器人。早上在主论坛上引起关注的机械臂“博士茶”,不仅可以谈论会议,还可以完成传统的长嘴壶浇茶工作,这依赖于服务机器人程序。基于百度3D视觉,机器人可以检测和跟踪杯子的位置。通过机器人运动规划和控制,机器人手臂可以检测工作空间中的碰撞并避开障碍物。在运动的实时计划之后,可以自动生成茶叶轨迹;然后,感测水流并实时调整茶位。对语音和语义联动技术的分析使机器人像“人”一样,理解,说得好,尽其所能。

img_pic_1562221857_3.jpg

(白百钢,百度3D Vision首席科学家)

在语言和知识技术方面,百度大脑也宣布了一系列创新和突破。百度人工智能技术平台系统执行总监吴天设计并实现了一个知识增强的语义理解框架。 ERNIE,具有可持续学习能力,核心模型能力不断提高。目前,ERNIE已经积累了超过10亿的知识,全面更新了中国NLP任务的指标,并提高了百度众多产品应用的效果。机器同声传译也有最新进展。用于纠正语音识别的联合词矢量编码技术在翻译过程中可以解决多轮翻译一致性和一致性问题文本翻译模型,并结合先进的语音技术。百度的大脑已经实现了高精度,低延迟的机器同步传输技术。

img_pic_1562221857_4.jpg

(吴天,百度AI技术平台系统执行总监)

知识可以帮助AI更深入地了解现实世界。在主要论坛上,王海峰使用最近发布的音乐纪录片《大河唱》来展示百度知识地图技术的视频语义理解能力。该技术通过对视频多模态知识的分析,建立了多维知识地图的关联,并通过计算推理建立了对视频的深层语义理解。

此外,吴天还正式发布了行业知识地图平台和智能创作平台2.0。行业知识制图平台旨在满足各行各业的需求,以构建和应用知识地图,以帮助提升情报。行业知识地图平台基于领先的知识地图核心技术,提供智能和高效的知识生产流程,低成本的初创企业和跨行业的迁移。能够帮助行业开发人员定制行业知识地图并应用它们。新的智能创建平台集成了实时热点跟踪和相关的丰富材料。它具有全面的创意支持功能,可以轻松解决传统内容创建所面临的问题。整个过程有助于创作者。吴天还预计,邀请将在10月份进行。多模自动创作。目前,百度已经建立了百度的大脑,语言和知识技术开放平台,不仅拥有丰富的基础技术,还形成了包括智能创建平台,UNIT平台,知识地图构建和应用平台在内的翻译开放平台。平台,为不同领域提供百度领先的语言和知识技术。

巩固基础强度关注AI计算挖掘数据值

百度脑5.0不仅包括算法级创新,还实现了计算能力的重大突破。近年来,该算法对计算能力的需求增加了近30万倍,而芯片的计算性能仅增加了30倍。两者之间存在巨大差距。

百度副总裁白珍为观众分享了百度下一代人工智能计算架构。面对人工智能计算的挑战,它需要能够从端到端提供人工智能计算能力。这就要求计算系统从旧的海量数据处理能力,追求IO高峰转向IO训练功能。计算密集型,通信密集型要求,以及AI推理功能中对大吞吐量和低延迟的需求。

img_pic_1562221857_5.jpg

(百度副总裁白振宇)

侯振宇认为,面对即将到来的AI + 5G时代,计算将无处不在。真正的计算将在设备,边缘和云中发生,因此DEC场景将成为下一个主要的研究问题;同时,包括芯片间,系统到系统和设备它们之间的互连将有助于将不同场景中的计算连接在一起,从而提高计算能力。

底层芯片和上层应用程序之间也需要操作系统。王海峰认为,深度学习框架是智能时代的操作系统。百度自主研发的功能齐全的深度学习平台“飞桨”是中国自己的“人工智能操作系统”。在主要论坛上,百度的飞桨和华为的麒麟芯片正式公布。世界领先的端到端AI芯片和深度学习平台将共同为端到端AI提供最强大的计算能力,并创造最佳的深度学习操作效率。

许多开发人员对飞桨非常熟悉。百度深度学习技术平台部主任马艳军详细介绍了飞桨的五大核心优势。在核心框架层面,飞桨支持动态和静态图像,同时考虑到灵活性和效率;飞桨提供超过70种工业应用的官方模型;飞桨支持大规模分布式训练和端到端部署;对于中国开发商而言,Flying Paddle提供系统的深度学习技术服务,并提供非常全面的中文支持。马艳君还表示,科技产业“奥斯卡”已经成功举办了15年的经典活动“2019百度之星”,而百度之星的注册是飞桨核心框架发展的任务;百度之星开发该游戏基于飞桨的目标探测任务。

img_pic_1562221857_6.jpg

(百度深度学习技术平台总监马艳军)

为了降低建模成本,提高建模效率,减少对大数据的依赖,减少人工干预,百度开发了AutoDL自动建模技术。在论坛上,百度大数据实验室主任严军正式发布了AutoDL 3.0,它从设计,迁移和改编三个方面进行了升级,并分享了一些实际案例。目前,它已被飞桨正式开源。

img_pic_1562221857_7.jpg

(西点,百度大数据实验室主任)

来自工业实践的深度学习平台也正在反馈这个行业。以交通运输领域为例,百度地图事业部总经理李莹介绍了基于飞桨的百度地图,提高了ETA开发,调试的便利性和培训效率,完成了数百亿日的数据培训;改进了ETA部署。和预测性能,支持当天数百亿的电话。 ETA是地图路线规划的主要特征,也是用户出行决策的主要参考因素。对于用户来说,飞桨的百度地图ETA可以实现对运行时间的智能估计,可以在旅行前提前预测路况,避免拥堵时间,了解拥堵时间,避免拥堵路线,合理规划旅行时间。

img_pic_1562221857_8.jpg

(百度地图部总经理李莹)

数据是AI时代的核心生产数据。目前,大数据产业的发展面临着两大问题:数据资产安全和数据价值勘探成本。百度大数据部高级总监白燮介绍了百度大数据技术开放平台作为中国第一个大数据iPaaS平台,重点关注大数据行业发展中的安全和效率问题。同时,电石有三个核心功能,包括安全数据融合处理环境,多级开放式可定制组件,以及功能集成的大数据开发平台,可帮助开发人员安全有效地探索大数据的价值。百度希望通过石材加速大数据的生态开发,帮助开发人员深入探索数据的价值并打造一块石头。

img_pic_1562221857_9.jpg

(郭燮,百度大数据部高级总监)

百度脑5.0,人工智能算法,计算架构和应用场景的融合,已成为硬和软AI生成的平台。百度脑论坛下午近三个小时的分享只是百度大脑技术的“冰山一角”。除了顶级技术,百度的大脑将继续开放和赋予权力。目前,已经开设了210多项领先的人工智能技术。平台电话数量同比增长108%。定制平台模型的数量正在快速增长,并在平台上进行开发。这个数字已经达到130万。王海峰说:“教人们钓鱼比教人更好。”百度开发一流的人工智能技术,致力于开拓顶级人工智能技术。百度脑5.0帮助各行各业的行业开发人员加速工业智能。