二代龙芯派VS树莓派3B+:性能孰胜一筹?

2018年10月,二代龙芯派正式公布。历史了长达靠近半年的跳票以后,在今年年4月晦究首先对龙芯俱乐部的醉心者发货了。拿到派以后,我就筹办对它做一个详细的测评。

龙芯派是龙芯公司用龙芯2K1000处分器做的一个开辟板。初次代龙芯派在许多处所借鉴了树莓派,但有许多不及,诸如读卡器速率太慢等;二代龙芯派在一代派的底子上做了许多改进,体积变大,接口加倍丰富。

表面参数比拟

你见过二代龙芯派吗?若没有,当今你见过了。

▲二代龙芯真机图

▲二代龙芯派接口,图自龙芯开辟者商城

中心散热片底下安置的,即是龙芯2K1000处分器。拆下散热片,擦掉导热硅胶,终究暴露了龙芯2K1000处分器。

▲龙芯2K1000处分器

龙芯派的尺寸是nano-ITX 12cm×12cm,但设计的时分没有思量到接口的摆放,造成全部的四个面都有接口,并且接口的设计也分歧理。

组装好的龙芯派,四面都有接口。

▲初次壁:DB9串口

▲第2面:Ejtag接口,reset按键和start按键,表现屏接口,电源接口

▲第3面:GPIO插针以及PCIE接口

▲第四面:从左往右,划分是两个USB口,一个OTG口,一个HDMI口以及两个自顺应千兆网口

▲部分细节1

SSD底下的四个芯片,两个VP232是CAN收发器,ISSI的是存MAC的EEPROM。非常右侧的GD是bios;若需求用编程器手动革新pmon,需求刷的即是这颗芯片。

▲部分细节2

两颗紫光内存

▲部分细节3

16GB的金士顿固态硬盘

▲部分细节4

两个RTL8211E的千兆以太网芯片

▲部分细节5

ALC269声卡芯片,包管龙芯派能作声

▲部分细节6

Sii9022 RGB转HDMI芯片

若仅仅知足于开箱晒图,然后问一句“你怎么看”,那和某些自媒体有甚么差别?作为硬核醉心者,固然要拿出基准程序,好好的测测二代龙芯派的性能了。

二代龙芯派应用的处分器是龙芯2K1000,接纳40纳米工艺制造,双核,主频1.0GHz。非常明显,如许的处分器不是拿来和合流的x86处分器去角逐环境趋势的。官方的宣传海报鼓吹,龙芯2K1000的性能相配于A53。刚好,树莓派3的处分器是接纳了4个A53焦点的ARM处分器,所以咱们决意将树莓派和2K1000的性能做一个细致的比拟。

咱们接纳的测试的方案用phoronix test suite作为基准程序,比拟树莓派3B+和二代龙芯派的性能。以前,咱们用同样的技巧测试了龙芯3A3000的性能。细目请看中文国外的投稿:

《中文国外网友投稿:周全深扒国产龙芯3A3000处分器性能细节》

新公布的树莓派4接纳的BCM2711处分器领有4个A72焦点,1.5GHz的主频,用28纳米的工艺制造,性能太强,龙芯派必定比但是。

▲二代龙芯派和树莓派3B+参数比拟

和树莓派相比,龙芯派自带16GB的SSD硬盘、散热片、亚克力支架,并且带有高速的PCIE接口,有更丰富的接口,从设计上更靠近开辟板。从价格上,二代龙芯派仍旧是树莓派的6倍多。龙芯派这么贵,值得吗?除了高额的情怀税,它在性能上和树莓派相比有上风吗?

咱们用phoronix test suite对龙芯派的性能进行了测试,并且和openbenchmarking网站中盘问到的树莓派3B+的数据进行了比拟。趁便也重叠行使了一下龙芯3A3000处分器的数据,和树莓派、龙芯派进行了比拟。咱们将数据大致分为单核性能、多核性能两片面,然后每一片面再大致分为整数性能和浮点性能。有少许欠好归类的,独自进行说明。底下,咱们将划分说明咱们的测试后果。

1. 单核整数性能

1.1 TSCP

TSCP是一个象棋性能测试的程序。能够觉得这是一个以单核整数性能为主的测试。从测试后果来看,在应用了优化的数学库(openlibm)的条件下,龙芯派的性能到达了树莓派的85%;若应用默认的libm,龙芯派的性能惟有树莓派的55%。应用openlibm,性能进步了53%。这是非常大的性能晋升。应用libm的龙芯3A3000的性能是树莓派的1.3倍,假设接纳openlibm的话,性能大约是树莓派的两倍。

在都应用libm的情况下,龙芯派中的2K1000处分器性能是龙芯3A3000的43%。思量到龙芯2K1000主频惟有3A3000的2/3,并且惟有双发射(3A3000是四发射),这性格能还算平常。

1.2 收缩算法

接纳三种收缩算法,划分统计了收缩文件的耗时。从数据能够看出,龙芯派的性能比树莓派差。在Pbzip、LZMA和GZIP三种算法上,龙芯3A3000和龙芯派与树莓派相比,性能划分是3.89、1.86、1.50倍和83%,71%和79%。在收缩算法上,龙芯派阐扬欠佳。

运转Pbzip、LZMA和GZIP这三个程序,龙芯派的性能划分为龙芯3A3000的21%、38%、和52%。需求留意的是,pbzip2考查的是程序的多核性能。

2. 单核浮点性能

2.1 Scimark2

Scimark2是一个单核性能测试程序。测试的内容包含一系列算法,包含雅克比逐次超松懈法、稠密LU矩阵剖释、希罕矩阵乘、快速傅利叶变更、蒙特卡罗。

从Scimark2数据来看,即便龙芯2K1000处分器的主频惟有1.0GHz,其性能也远远跨越主频1.4GHz的BCM2837B0处分器,浮点运算模块功效非常壮大。但是,在龙芯3A3000眼前就露馅了,概括性能惟有3A3000的1/4。非常让人意外的是蒙特卡罗性能,龙芯3A3000居然比龙芯派还要糟糕,猜测是在libm片面性能没有优化。

从Scimark2的概括性能看,龙芯派的性能是树莓派的2.13倍,然而惟有龙芯3A3000的26%。

2.2 Aobench

在龙芯派上,划分用libm和openlibm进行了编译,咱们发现用openlibm的时分性能比libm快50%以上。龙芯派的速率惟有树莓派的70%。值得留意的是,咱们发现应用libm的龙芯3A3000速率居然比树莓派还要慢。可见龙芯用的libm数学库性能有何等的糟糕。

在应用libm的情况下,龙芯派的性能是龙芯3A3000的62%。

2.3 Himeno

Himeno基准是一个应用点Jacobi技巧的压力泊松线性解算器,数值越大性能越好。测试评释,龙芯3A3000和龙芯派性能都跨越树莓派,性能划分是后者的2.65倍和2.05倍。咱们还发现,和应用libm相比,应用openlibm龙芯派的性能进步了42%。

应用libm时,龙芯派单核性能是龙芯3A3000的54%。

3. 多核整数性能

3.1 7zip

7zip是一个常用的benchmark程序,反映的是处分器的多核、整数性能。同样是4核处分器,同样是1.4GHz的主频,龙芯3A3000的性能是树莓派的2.6倍。龙芯派核数惟有树莓派的一半,7z性能是树莓派的56%,看起来阐扬还能够。和单核龙芯2F相比,龙芯派的7z性能是前者的2.4倍。龙芯派多核性能惟有3A3000的22%。

3.2 多重序列比拟

MAFFT(多重序列比拟)是一个多线程程序,统计程序运转的时间,数值越短越好。凭据测试,龙芯3A3000和龙芯派的性能划分是树莓派的1.83倍和0.61倍。龙芯派性能是3A3000的33%。

3.3 Primesieve

Primesieve是多线程的质数制造程序,凭据计较用的时间考查处分器的整数性能。从测试后果来看,龙芯3A3000的性能是树莓派的2.8倍。龙芯派的多核性能惟有树莓派的66%,3A3000的24%。

4. 多核浮点性能

4.1 TTSIOD 3D Renderer

TTSIOD渲染测试是多核性能测试,测试后果为渲染的速率。从测试后果来看,龙芯3A3000的多核性能是树莓派的1.75倍;龙芯派的多核性能是树莓派的47,3A3000的27%。

4.2 Smallpt

Smallpt是多线程亮光渲染测试程序,数值越低,性能越好。从以上的数值能够看到,3A3000的性能是到达了树莓派的4.9倍;龙芯派的性能是树莓派的1.25倍,3A3000的23%。

双核的龙芯派,多核性能跨越了4核的树莓派!

4.3 高性能共轭梯度

从高性能共轭梯度看,龙芯派的性能惟有龙芯3A3000的1/3。我没有找到树莓派3B+的测试数据。

5. 其余

5.1 音频编码

对于音频编码,咱们做了两组测试,划分将WAV音频用MP3和FLAC进行编码,耗时越短越好。从测试的后果来看,在MP3编码阐扬上,龙芯3A3000和龙芯派均快于树莓派,速率划分是树莓派的4.6倍和2.1倍;在FLACi编码上,差距没有辣么大,速率划分是树莓派的1.27倍和1.10倍。究其缘故,MP3编码是一种有损收缩算法,而FLAC是一种无损收缩算法。猜测前者需求进行较多的浮点运算,然后者要紧是整数运算。

5.2 缓存性能测试

从缓存性能看,龙芯3A3000性能跨越同主频的树莓派,在读取/点窜/写入的性能测试中,龙芯3A3000的性能是树莓派的4.4以上,写入速率速率是树莓派的1.5倍。但在第三项读取速率测试中,和树莓派相比上风不明显。而龙芯派,前两个测试性能明显优于树莓派,而读取速率惟有树莓派的一半。

5.3 内存性能测试

内存性能测试,简单一句话,龙芯派掉队于树莓派。龙芯派内存频率默觉得400MHz,树莓派内存频率默觉得450MHz,预算一下龙芯派内存性能惟有树莓派的89%。凭据龙芯2K1000处分器手册,内存接口非常高频率为533MHz。非常明显,龙芯派的设计没有发扬出内存的速率。

5.4 网络服无性能测试

Apache测试反映了体系在运转网络服无时的多核性能。凭据咱们的测试,龙芯3A3000阐扬优越,运转Apache性能是树莓派的1.86倍。龙芯派的阐扬欠安,性能划分惟有树莓派的44%,龙芯3A3000的24%。

5.5 注释性语言

咱们比拟了龙芯派和树莓派运转两种剧本语言的性能。龙芯派的性能悲剧了。运转PHP性能和python的性能划分惟有树莓派的36%和93%。若要拿龙芯派跑PHP程序,还得三思然后行。

从Perl语言的性能来看,龙芯派的性能惟有树莓派的46%摆布。从Python、Perl、PHP三种注释性语言的运转结果来看,性能都不短长常好。缘故大约有两个:一个是这些测试要紧反映程序的整数性能而非浮点性能,一个是龙芯派上Python、Perl、PHP的注释器都没有进行优化。

5.6 SQLite

SQLite测试,耗时越短越好。从测试后果来看,龙芯派速率是树莓派的2.13倍。

上头的测评着实是太罗嗦了,能不能够报告我谁更强少许?一图胜千言,先放一张图。

▲✅代表上风项,❌代表短处项

在21项测试中,龙芯派赢了7个,树莓派赢了此中14个。作为一个惟有1GHz主频的双核处分器,和1.4GHz主频的4核处分器做相对,能够赢7个,或是有些让人意外的。咱们来测试剖析一下龙芯派和树莓派相比的上风和短处:

1. 价格过高。1399元的价格,和树莓派220元的价格相比着实是太!高!了!但是,据小道消息龙芯正在做托钵人版教诲版的龙芯派,价格会有大幅下降。

2. 主频太低。同样是40纳米工艺的处分器,龙芯2K1000主频惟有1.0GHz,而树莓派3B+的处分器主频高了40%。IPC再好,主频不敷高也白费。好比一个妙技周全的蝇量级拳王,遇到重量级拳手的话就会被一拳撂倒。

3. 应用生态不敷好。在测试中能够明显看到,操纵体系自带的libm性能非常糟糕,没有进行充裕的优化,造成龙芯派在许多测试项目上后果非常差。用libm的龙芯3A3000性能乃至会不如用openlibm的龙芯派。这个情况曾经存在非常久了,但我没有看到一点改进的迹象。也能够是我用龙芯的架势不太对吧!:(

1. 纯国产的CPU,自立可控。没有买国外的CPU核,也不消给ARM公司交高昂的指令集授权价格,也不需求忧虑美国制裁。对于一般用户来说,这个上风聊胜于无吧!对于分外行业的用户来说,不妨非常紧张的。

2. 应用全开源。从BIOS到操纵体系,统统开源。

3. GS264处分器核非常优秀。1GHz的龙芯2K1000能够在某些项目上战胜1.4GHz的A53处分器,足以说明GS264处分器核的优秀。若看同主频的性能,龙芯还会在更多项目上当先(假设不思量功耗疑问的话……)

总之,二代龙芯派在片面性能上靠近了树莓派上的4核A53处分器,提供了丰富的接口,能够在产业掌握、计较机教诲等平台发扬紧张的好处。和龙芯3A3000处分器相比,龙芯2K1000单核性能大约是前者的40%~50%,多核性能是前者的20%~25%。等候龙芯派能在性能、价格、应用生态上有更多的前进,让它能够加倍亲民、易用。

谢谢龙芯某个不能够提他名字的贩卖对此文章的支持!谢谢龙芯派群老鼠先生和flygoat两位对文中片面错误的批改。

您可能还会对下面的文章感兴趣: