加速爆发的物联网对AI芯片提出全新需求
另一方面,AI算法的接入,对设备端芯片的并行计算能力和存储器带宽也提出了更高的要求,而尽管基于GPU的传统芯片能够在终端实现推理算法,但其并非针对深度学习设计,能效比远低于AI专用芯片。
黄伟指出,无论是CPU还是GPU、FPGA,现有的芯片架构并非为 AI 专门设计,并不能满足物联网AI算力需求,且考虑了太多的向后兼容性,因此在性能上远非最优。“基于业务方面对芯片产品、场景的反复验证,以及对AIoT终局的判断,云知声在2014年就明确必须自主研发面向物联网的AI芯片。”
较之于传统芯片,定制化的AI芯片由于应用场景和AI算法相对确定,因此在硬件设计上更加专门化,在面向此类任务时其相对于通用芯片在计算密度及功耗上有绝对优势。因此,相较通用芯片而言,AI芯片可以在更低的主频、更小的芯片面积,完成机器学习中同等任务量的计算,做到成本、功耗、算力等多维需求之间的完美平衡。
第一代物联网 AI 芯片及解决方案──雨燕
云知声第一代UniOne物联网 AI 芯片及解决方案──雨燕采用CPU+uDSP+DeepNet架构,支持8/16bit 向量、矩阵运算,基于深度学习网络架构,可将面向语音 AI 的并行运算性能发挥到极致,在更低成本和功耗下提供更高的算力。
在架构灵活性方面,雨燕通过Scratch-Pad将主控CPU与AI加速器内部RAM相连,可提供高效的CPU与AI加速器之间的数据通道,便于CPU对AI加速器运算结果进行二次处理。另外,连接各个运算单元的可编程互联矩阵架构,提供了扩展运算指令的功能,从而进一步提升硬件架构的灵活性及可扩展性。同时,芯片采用多级多模式唤醒,从能量检测,到人类声音检测,再到唤醒词检测,针对语音设备及使用场景的定制化Power Domain等技术,可将芯片功耗降低至最低。具体而言,雨燕包括以下几大显著特征:
高性能深度学习加速:面向深度学习和语音信号处理的 AI 定制指令以及体系架构,将面向语音 AI 的并行运算性能发挥到极致,系统运算能力提升50倍以上;
云知声联合创始人/芯片负责人李霄寒表示,云知声不仅提供雨燕芯片和终端引擎,还将应用部分向客户开源,同时提供相应定制化工具以及云端AI能力服务。通过云端芯结合,云知声基于雨燕提供的是面向一个个具体场景如智能家居、智能音箱、智能车载等的Turn-key解决方案。基于雨燕方案,可让客户站在更高的设计起点,以更低的成本在更短的时间内打造出更稳定可靠的产品。同时,开源的方案也可确保客户基于已提供的 AI 能力自行设计其它各种长尾产品形态,构建更为丰富的AIoT生态。
“UniOne 不是一颗芯片,而是一系列芯片
“UniOne 不是一颗芯片,而是一系列芯片,它代表了云知声对于物联网 AI 芯片发展战略的整体构想。” 李霄寒指出,面向方案商与开发者,UniOne可提供完整的语音 AI 应用参考方案、云端能力以及定制化工具,可以帮助客户在跨形态的物联网硬件产品上以最低的时间、资源等探索成本,打造最高体验的用户入口应用未来。