24种新AI能力,20个好案例 百度大脑开放日划了这些重点

深度学习是AI发展的燃料。

百度在深度学习领域深耕已久,2016年,百度开源了深度学习框架PaddlePaddle。

此次,PaddlePaddle迎来两方面重大更新,核心框架PaddleFluidv1。

3新增发布业界首个视频分类模型库,新增支持NLP语义表示BERT模型,分布式训练性能大幅提升,大规模稀疏参数服务器Benchmark发布;同时,基于PaddlePaddle的深度强化学习框架PARL,夺冠NeurIPS2018。

具有高灵活性和可扩展性,支持可定制的并行扩展,覆盖DQN、DDPG、PPO、A3C等主流强化学习算法。

目前,百度PaddlePaddle已对外开放超过50种经过工业场景验证的官方模型,例如,领邦利用PaddlePaddle,通过ICNet语义分割模型识别精密零件瑕疵,实现零件自动分拣。

在深度学习基础之上,百度大脑通用AI能力开放涵盖语音、视觉、自然语言处理、知识图谱等全面AI技术。

语音方面推出了语音识别极速版,首次对外开放搭载国际领先的注意力(attention)模型的语音能力,拥有更快的响应速度,相对识别准确度提升15%,为开发者带来更极致的识别体验。

此外,语音识别预置语义解析全新升级,预置场景由35个升级为51个,从影视娱乐到外卖打车,语义解析效果全面提升。

另外,还预告了即将推出的几款新产品,包括语音识别自训练平台、远场语音开发套件和语音离线合成等产品。

视觉方向上,OCR、车辆分析、人脸人体、图像识别都有重磅升级。

比如卡证OCR新增了户口本、出生医学证明、港澳通行证和台湾通行证四类新能力,可识别卡证总数达到9种。

只需对着你的户口本拍一张照片,系统就能字段进行结构化识别,然后反馈出信息页的出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码。

而票据OCR和汽车场景OCR也分别新增了行程单、保单、通用机打发票、定额发票、车辆VIN码、机动车销售发票、车辆合格证等识别能力。

目前,百度大脑OCR产品全系列可以识别类型多达34款,实现卡证、票据、文档、汽车全场景覆盖。

人脸人体识别方向,百度大脑此次发布了新能力——人脸情绪识别,同时升级了人脸关键点检测和手势识别,人脸检测关键点由72个增至150个,常见手势能识别种数也达到了24种。

图像识别方向,百度大脑更新了红酒和地标识别两个新能力。

无论是卢浮宫还是82年的拉菲,只要上传1张照片,就能获得文字解析。

车辆分析方面上线了车辆检测和车流统计。


亚博电竞打不开