嘉楠科技发布高性能图像及语音处理 AI 芯片勘智 K510:RISC-V 双核 64 位 CPU,支持高清航拍等

7 月 8 日消息嘉楠科技正式公布 AI 芯片勘智 K510。该芯片定位于中高端边沿推理环境趋势,搭载自立研发 IP 核的晋级版本 KPU2.0,接纳创始计较数据流与复用方法,在算力晋升 3 倍的同时低落芯片功耗。K510 集成新一代图像处分单位,搭载 3D ISP,支持 TOF 深度录像头,以及 2D/3D 降噪、WDR 宽动静、鱼眼矫正和硬件 3A 等功效。在使用方面,K510 支持高清视频会议、高清航拍和机械人等边沿侧场景。

中文国际得悉,官方说明,K510 在总线架构、IP 焦点与视频子体系推出斩新计划,相比一代芯片算力晋升 3 倍,经典视觉算法大幅度优化,自研高速 PHY 接口表面带宽 10GB/s,8 位数据压缩率 50% 以上,极大优化了勘智 AI 系列在机械视觉场景的使用机能。

总线布局是一款 SoC 的要紧特性。为打听决 SoC 总线地点空间有限以及芯片受单纯时钟的影响,嘉楠科技在 NoC 总线架构中计划了可扩大的地点空间,使每个 IP 核工作在特定的时钟域。

凭据关联性,K510 将体系时钟布局分别成多个时钟域,从而办理分状况时钟掌握疑问。把全部体系分别成多个可支持高低电操纵的电源域,从而办理了分区域掌握能耗疑问。

在 ISA 方面,K510 相沿 RISC-V 双核 64 位 CPU 架构,并集成了数字灯号处分器 DSP 来辅助加快 AI 使用。差别的是,嘉楠科技为 DSP 计划了专用的片上存储,而且在双核 CPU 与 DSP 之间加入 mailbox 通讯模块,以实现对体系各片面的天真调剂。

K510 自立研发 IP 核 KPU2.0 配备了嘉楠科技在算法、软硬件和编译器的非常新计划,密集突破 AI 芯片计划中宽泛存在的“存储墙”和“机能墙”的疑问。

开始是“存储墙”,计较历程需求把数据从存储器搬运到处分器才气进行运算。而存储器的吞吐机能往往滞后于处分器的机能增进,干脆影响了计较服从的晋升。嘉楠科技在 KPU2.0 中接纳了全局内陆缓存计划,通过 SRAM 阵列满足神经网页中差别层级对里面走访带宽和存储的需求。

其次是“机能墙”,为了晋升计较服从,KPU2.0 接纳了动静 3D PE 阵列。第三个维度支持多种方法互鉴传递数据,并实现多个维度上的计较映射,进步 PE 阵列的行使率。同时也能够动静开启或关闭每一个 2D 阵列,并凭据差别层级对带宽和计较资源的需求进行调整。

连结动静 3D PE 计较阵列和天真的全局内陆访存计划,嘉楠科技提出的计较数据流,计较卷积不需求进行 im2col(image to column)数据重排,晋升计较服从;而通过多级存储计划,K510 可以增加卷积计较的数据复用,从而削减数据的读取次数,低落芯片功耗。

同时,KPU2.0 还搭载了可重构的 SIMD 加快单位,通过创新的 meshnet 网页可以天真配置支持种种激活函数、pooling 和 resize 等算子。

K510 搭载的高速 PHY 接口由嘉楠科技自立研发。LPDDR4 支持 32 位双通道,非常高频率 2700MHz,表面非常大带宽 10GB/s。MIPI D-PHY spec v1.2, 支持 4 通道输入,每通道峰值速度达 2.5Gbps。

与初次代芯片相比,K510 在帧率和外设方面都有大幅优化。别的,K510 还支持浮点 BF16 计较,在不适用进行模子量化的场景相比同类产品更具上风。

在外设方面,K510 搭载 MIPI CSI2 和 DVP 接口,可同时支持非常多 3 个录像头输入。MIPI CSI 接口支持 1x4 lane 和 2x2 lane 模式,天真支持种种 MIPI 录像头。K510 MIPI 支持 DPHY v1.2 规范,非常高速度每 lane 可达 2.5Gbps,支持 RAW, RGB, YUV 等种种盛行花样。

K510 里面还集成了 3 个图像处分单位 ISP, 此中一个 ISP 支持 3D 功效,无需应用介入,干脆寄托硬件实现深度数据的提取加工,相比应用处分深度消息方法不但节减了庞大的 CPU 开支,机能上也会有非常大晋升。

为进一步进步芯片对算法模子的适配,嘉楠科技在 K510 的编译器和应用上团结优化带宽需求,对算法进行量化压缩。

K510 在计划上针对中心层数据和权重的漫衍特性接纳差别的压缩算法。针对中心层计较数据,行使相邻数据的关联性进行无损压缩,即使 8 位数据的平衡压缩率也能到达 50% 以上,而且根基不损失精度;对权重数据则接纳希罕压缩,在网页进行希罕练习的环境下,压缩率也能够到 50% 以上。

在应用方面,K510 支持富厚的网页模子算子,包含多见的 CNN、RNN 和各类向量计较和数据处分操纵。支持裸机、嵌入式 RTOS 和 Linux,而且移植了 OpenCV Python Numpy。同时,K510 支持 TensorFlow、PyTorch、ONNX 和 TVM 等合流深度借鉴框架,兼容性更强。

得益于架构优化和高清 MIPI 的壮大配置,K510 支持 2~3 路 2K 表现和 VPU 图像拼接,以及业内非常前沿的 TOF VSLAM 视觉导航技术,疾速实现对停滞物的测距和避障,可用于无人机航拍、高清视频会议和机械人等多个场景。

您可能还会对下面的文章感兴趣: