云知声展示全栈 AI 硬核能力,让机器更好地服务人类

时间:2019-07-09 来源:www.pirspress.com

玛雅棋牌

云之声展示了全部AI核心功能,让机器更好地为人类服务

4月18日,在开放日深圳站期间,云智生董事长兼首席技术官梁佳博士向深圳合作伙伴和开发商介绍了云智生的云AI技术和产业能力。梁佳博士强调,“人工智能不是一纸空白,而是对行业实际问题的真正解决方案。”人工智能技术只有与行业结合才能解决工业问题才能发挥其最大价值。

Yunzhisheng成立7年,逐渐形成了基于工业需求的AI理念。梁嘉恩博士总结为一个完整的堆栈+硬核。 “整个堆栈使我们能够专注于用户价值和应用程序问题。硬核可以帮助我们解决工业问题。”其中,完整堆栈是指完整的技术能力和着陆能力,技术创新贯穿工业应用并创造闭环价值;而核心技术解决方案可以有效地解决工业规模的问题。

9ad90aebfc2a4cee9ca6450ac944032d.jpeg

“完整堆栈”包含完整堆栈AI技术功能和完整堆栈AI着陆功能的两个维度。

从技术角度来看,云之声很早就建立了Atlas机器学习计算平台。该平台具有强大的GPU计算资源和浮点计算能力,为人工智能新领域的计算能力奠定了坚实的基础。 Atlas平台支持AEC/SSP/ISP,语音(ASR/TTS/VPR/CALL),语言和认知(NLU/NMT/SDS/ICI)和图像(FID/OD/OCR)等信号。域的水平扩展和垂直迭代。基于此,云感知硬核AI技术地图具有完整的感知,表达,认知和计算能力。

在完成全栈技术的构建后,云之声将其功能集成到自主开发的芯片中,以创建“云核”集成产品系统,为特定场景提供行业特定的硬件和软件集成交钥匙解决方案,使行业用户。站在更高的设计起点,以更低的成本,在更短的时间内创造出更稳定可靠的产品,然后通过云知道从AI技术到生态闭环的工业应用。

dd5f55bfe6804c0292b9c896e66eaef4.gif

硬AI技术解决了工业规模应用的问题

云之声根据行业需求,优化和增强其AI硬核技术,使其有效解决行业规模应用中的问题。到目前为止,Yunzhisheng的核心AI技术涵盖了语音感知和表达,语言和知识计算,AioT芯片登陆,超级计算平台和图像,翻译等维度。

硬核技术1:语音感知和表达

言语感知和表达是人机交互的基础。在感知级别,有必要使机器能够感知和发出命令,以便设备能够听到和听到命令。在远场拾音阶段,云智晟AI实验室技术专家关海新表示,目前,云之声在回声消除,混响抑制和噪声处理等领域拥有成熟的技术解决方案,相关技术指标已达到行业首位 - 班级标准。在语音识别阶段,云之声构建了基于大数据,声学建模和自适应学习的声学模型,具有数据量大,集成能力强,灵活性强,个性化的语言模型。上述模型也将基于super计算平台不断优化迭代。在表达层,云之声通过“算法+数据+工程”三位一体输出高质量,个性化的语音合成功能。

745dd89a707d4499a22e1d6580cdb75a.jpeg

硬核技术2:语言和知识计算

认知能力是机器智能的核心。只有通过解决认知问题,设备才能解决并满足用户的需求。从公司成立之初,云之声就开始进行语言和知识的计算; 2013年,云之胜开设了一个开放式对话平台(语义云),帮助合作伙伴创造更加自然的人机交互体验;云泽生于2018年形成了完整的技术和应用系统,实现了家庭,汽车,智能儿童机器人等场景的智能互动,以及医疗,教育,酒店等场景的行业智能化。

db622c6763e04ced8b31d5a3fb648516.jpeg

Yunzhisheng的人机对话系统有三大核心功能:流媒体互动,实用计算和智能对话。云之声AI实验室技术专家单波介绍说,流媒体互动的最大特点是避免了多轮对话中的唤醒,大大提高了人机对话的流畅性;实用计算是将人机对话内容放在相应的语境中,让设备准确理解人的意图;最后,智能会话是将知识地图应用于人机对话过程,以便设备可以灵活地响应用户的问题。

硬核技术3:AioT芯片着陆

为了实现人工智能技术并让技术真正受益于行业,仅仅打包云算法是不够的。有必要硬件化语音交互和AI技术,并通过芯片和模块快速启动智能产品。

自2014年以来,Yunzhisheng已经建立了“云核心”战略,其次是IoT AI硬件芯片解决方案(IVM)。 2015年,云之声正式推出自主开发的AI芯片方案。在2018年,云之声推出了第一代UniOne物联网AI芯片“Swift”,并将基于Swift解决方案开源。在此基础上,云之声为智能家居和智能扬声器推出了两套基准解决方案。

48b6bd8e101e48aa9e373d9cab203f59.jpeg

在2019年1月,Yunzhisheng发布了其多模式AI芯片战略,并宣布了三款新芯片:第二代物联网语音AI芯片Swift Lite,多模式AI,用于智能城市支持图像和语音计算。 Dolphin,用于智能旅行的汽车级多模AI芯片Leopard。基于这些AI芯片,Yunzhisheng继续扩展其技术和场景生态,以实现工业赋权。

硬核技术4:超级计算机平台和图像,翻译扩展

超级计算平台是AI技术自优化,水平扩展和垂直迭代的重要基础。早在2013年,云之胜就开始构建Atlas机器学习智能计算平台,称为“TensorFlow + GKE(GoogleKubernetesEngine)”,并对统计学习和深度学习中的一些通用算法进行了采样。该平台使用GPU和CPU作为计算集群的基本硬件资源。针对智能计算的需求和任务特点,云芝生内部改进的Kubernetes被用作资源管理和调度系统,用于计算任务容器化和图形任务交互。最大化的简化算法研究人员提交计算任务的复杂性,实现计算任务的全过程管理和一键式分布式操作。同时,Atlas智能计算平台构建了具有PB级别的高IO和高可靠性分布式存储系统,用于智能计算访问大规模的实际应用场景。

48d32d5ff455461db2732b3d88a4cebc.gif

在去年5月WMT 2018国际机器翻译大赛的汉英翻译大赛中,云明盛NMT机器翻译团队在英国获得第二名,在中国和英国获得第四名,在第一轮获得第三名。 BLEU关键分数仅次于第二名。 )结果。这些成就是Atlas计算平台为云之声探索多模式AI技术能力带来的重要价值。

在2019年推进之后,AioT行业将面临许多变化,包括需要为大众用户提供智能交互,以及针对特定领域的行业特定智能。

在智能人机交互过程中,新的数据维度(图像,语音,视频,VR/AR等)带来了数据传输的复杂性和数据实时处理的要求,需要更全面的计算力量,多模态。人工智能技术能力建设是关键。对于行业场景,将知识地图与大数据相结合,构建行业知识地图以及创建可移动的行业智能系统可以解决行业情报的实际问题。

未来,在全栈能力和硬核技术的两轮驱动下,云之声将继续定位需求和问题,并致力于开启技术创新的闭环工业应用,解决关键问题。工业规模应用。

关于云之胜开放日

开放日是云之声的年度技术分享和交流活动。它是云之声的人工智能硬核技术,与合作伙伴,相关学术和产业研究机构等共同探索合作的平台。 看看更多