「龙芯20岁」龙芯处理器族谱篇

2021-09-06 13:36:53 admin

「来源: |EETOP ID:eetop-1」

加固计算机
加固计算机

20年来,经过无数人的奋斗,今天基于国产龙芯CPU的自主信息产业体系正在逐步形成。

胡伟武表示,龙芯CPU在迭代中发展,经过20年的发展,从第一代的基本可用(小学毕业)到第二代可用(中学毕业),第三代产品将实现好用(大学毕业),主CPU和OS(操作系统)基本完成“补课”,CPU通用处理性能已逼近市场主流水平,操作系统成熟度也已接近Windows XP。

谈到技术方面,胡伟武指出,通过在市场中试错,龙芯意识到我国CPU与国外CPU的主要差距在于通用处理性能,而不是专用处理性能;同时,单核性能不足,仅仅叠加核数并不能解决问题;设计能力不足,不能仅仅依赖工艺。因此,龙芯希望通过优化设计提高单核通用处理性能。

值此龙芯20周年,芯思想精心梳理龙芯家族产品,特别推出龙芯族谱篇,以作纪念(有部分芯片因各种原因,未列示)

龙芯诞生

2001年8月19日,设计与验证系统成功启动Linux操作系统。因此,8月19日被确定为龙芯的生日。

龙芯一号“XIA50

2002年8月10日,首款单核32位通用CPU龙芯一号流片成功。为了纪念夏培肃院士从事计算机事业50周年,龙芯一号的代号为“XIA50

龙芯一号(Godson-1A)采用类MIPS 的RISC指令集,具有七级动态流水线、32位整数单元和64位浮点单元。主频可达266MHz,整体的性能低于Intel Pentium II。

龙芯一号(Godson-1A)采用0.18微米CMOS工艺进行流片,集成400万晶体管,采用QFP封装。

注:夏培肃(1923.7.28—2014.8.27)被誉为“中国计算机之母”,1951年从美国回来,一生致力国家计算机事业,1991年当选为中国科学院院士,是龙芯CPU的功臣李国杰院士、唐志敏研究员、胡伟武研究员的导师。

加固计算机

龙芯1(XIA50)

2002年9月28日龙芯一号(Godson-1A)正式发布。时任中国科学院计算技术研究所所长李国杰院士在称赞时,引用《易经》中的话:万物生于有,有生于无。

龙芯一号(Godson-1A)完成后,龙芯课题组投入了龙芯二号(Godson-2)的研发。

龙芯2A

2003年龙芯2A(Godson-2A)因为寄存器堆设计问题流片失败。

2003年3月部署“龙芯2A(Godson-2A)”九个端口的寄存器堆的全定制设计;5月“龙芯2A(Godson-2A)”的物理设计正式展开;6月完成FPGA验证平台建设,7月14日“龙芯2A(Godson-2A)”的第一个设计完成tapeout。

龙芯2B“MZD110”

2003年10月17日,首款单核64位通用CPU龙芯2B(Godson-2B)流片成功,和龙芯2A同期研发。为了纪念毛主席诞辰110周年,龙芯2B的代号为“MZD110”。

龙芯2B(Godson-2B)采用境内0.18微米工艺进行流片,集成1000万晶体管,最高频率为300MHz,7-10级流水线,功耗1W-2W。相同主频下,性能是龙芯1号的3至5倍,已经超过了英特尔Pentium II。

加固计算机

▲龙芯2B(MZD110)▲

2003年3月部署“狗剩2号”九个端口的寄存器堆的全定制设计;5月“狗剩2号”的物理设计正式展开;6月完成FPGA验证平台建设;8月13日“狗剩2号”的第二个设计完成tapeout。

龙芯2C“DXP100”

2004年9月28日,龙芯2C(Godson-2C)流片成功。为了纪念邓小平诞辰100年,龙芯2C的代号为“DXP100”。

龙芯2C芯片主频为450MHz,其单精度峰值浮点运算速度为每秒20亿次,双精度浮点运算速度为每秒10亿次,64+64k一级缓存。龙芯2C的性能是龙芯2B的3倍,达到了相同主频的英特尔Pentium III的性能。

龙芯2C采用0.18微米工艺,集成1350万晶体管。

加固计算机

▲龙芯2C(DXP-100)▲

在龙芯2C上,印有中科院计算所的“ICT”标识

龙芯2D

有关龙芯2D的信息很少。

2005年12月龙芯2D完成流片,采用0.13微米工艺,加入片内512k二级缓存,主频600-800MHz,改版后,主频可达800-1000MHz,性能是龙芯2C的五倍。

龙芯2E“CZ70”

2006年3月18日,龙芯2E流片成功。为了纪念长征胜利70周年,龙芯2E的代号为“CZ70”。

龙芯2E主频最高可以达到1GHz,兼容MIPS64,具有128KB一级缓存、512KB二级缓存,单精度峰值浮点运算速度为80亿次/秒,双精度浮点运算速度为40亿次/秒。

龙芯2E是我国首款采用90纳米工艺制造的处理器,芯片面积6.8mm×5.2mm,集成4700万晶体管,采用HSBGA452封装。

2006年9月13日,龙芯2E通过科技部组织的验收。

龙芯2E在包括政府办公、数字电视、农村信息化、工业控制等领域展开了试点应用,但由于龙芯2E的北桥使用FPGA实现,成本较高,最终没有大规模量产。

意法半导体参与协助了龙芯2E的流片,所以龙芯2E处理器上同时印有“ST”和“ICT”的标识。

据当时的报道称,基于龙芯2E的成功,意法半导体还花费三百多万美元授权费购买了龙芯2E的生产和销售授权,开创了我国计算机核心技术对外授权的先例。

加固计算机

▲龙芯2E▲

2007年8月7日,曙光公司举行了主题为“中国芯,更安全”的产品发布会,推出了首款基于龙芯2E处理器的网络安全产品-“曙光100L防火墙”。

龙芯内核

加固计算机

经过多年积累,龙芯CPU形成了GS132、GS232和GS464三大系列处理器核。龙芯GS132及GS232系列CPU核对标ARM中低端系列,GS464系列核对标Intel桌面、服务器系列。

GS132为单发射32位结构,采用静态流水线。其1.0版本(GS132)为三级静态流水结构,在龙芯1D中使用。其2.0版本(GS132E)为五级静态流水结构,GS132R用于龙芯1C101处理器。

GS232为双发射32/64位结构,采用动态流水线。其1.0版本(GS232)为五级动态流水线结构,只有32位版本,在龙芯1A、1B、1C中使用。其2.0版本为动态流水线结构,有32位(GS232E)和64位版本(GS264),在龙芯2K中使用。

GS464为四发射64位结构,采用动态流水线。其1.0版本(GS464)为9级流水线结构,在龙芯3A、3B、2H中使用。其2.0版本(GS464E)为12级动态流水线结构,在龙芯3A2000、龙芯3B2000、龙芯3A3000、龙芯3B3000等CPU中使用;GS464E的优化版GS464V在龙芯3A4000、龙芯3B4000中应用,GS464V的LoongArch自主指令系统版本(LA464)在龙芯3A5000、龙芯3C5000等CPU中使用。

加固计算机

GS464E微结构框架图(红色方框部分为乱序执行引擎)

龙芯曾经一度准备砍掉GS132核,重点研发GS232和GS464处理器核。但经过市场调研,还是继续了GS132处理器核的研发,并基于此核开发了一系列的专用处理器。

龙芯指令集架构

2021年4月15日龙芯发布完全的指令集架构LoongArch,写下了国产CPU发展史上具有历史性意义的一笔。

LoongArch是全新的指令集,包含基础指令 337 条、虚拟机扩展 10 条、二进制翻译扩展 176 条、128 位向量扩展 1024 条、256 们向量扩展 1018 条,共计 2565 条原生指令。

龙芯中科产品族谱

龙芯中科的处理器按照其为结构,分为四类,分别是单发射32位(132),双发射32位(232),四发射64位(464)以及双发射64位(264)。按照处理器的性能、核数等分为龙芯1号小CPU,龙芯2号中CPU以及龙芯3号大CPU。

加固计算机

“龙芯3号”系列芯片,面向个人计算机与服务器类应用。

“龙芯2号”系列芯片,面向工业控制和终端类应用。

“龙芯1号”系列芯片,面向嵌入式专门应用。

龙芯1号家族

真正的龙芯1号家族成员都是在龙芯中科成立之后,经过市场调研开发的专用芯片。

龙芯1家族处理器可以大致分为两类,一类是单发射的32位CPU,采用单发射顺序执行的GS132系列处理器核,主频在10MHz左右,主要当作单片机使用;一类是双发射的32位CPU,采用双发射乱序执行的GS232系列处理器核,主频在1GHz以内,用做更高性能的嵌入式处理器,可以替代同等主频的ARM处理器。

龙芯1A

2012年推出的龙芯1A是一款面向嵌入式市场的处理器。

龙芯1A芯片主频266MHz,基于GS232处理器核,具有一级指令缓存16KB和一级数据缓存16KB。

龙芯1A采用0.13微米工艺制造、WBBGA448封装,封装尺寸23mm×23mm,功耗小于1W。

龙芯1A可以被配置为具有PCI接口的全功能南桥芯片。

加固计算机

龙芯1A▲

龙芯1B0200

2011年推出的龙芯1B是一款面向嵌入式市场的处理器。龙芯1B可以被视为是龙芯1A的简化版,是龙芯在嵌入式处理器研发上继续做减法的产物,以降低芯片的成本。

龙芯1B主频200MHz,基于GS232处理器核,5级流水线,具有一级指令缓存8KB和一级数据缓存8KB。

龙芯1B采用0.13微米工艺制造,采用WBBGA256封装,封装尺寸17mm×17mm,功耗小于0.5W。

加固计算机

龙芯1B0200▲

2018年5月10日,安控科技与龙芯中科共同发布了基于龙芯1B处理器开发的国产化RTU产品。表明我国完全有能力在工控领域逐步完成从芯片到软件的整体自主化替代,保障工业信息安全不再受制于人。

龙芯1C300“XPS90”

2012年推出的龙芯1C300可应用于工业控制及物联网等领域。为了纪念夏培肃院士90岁寿辰,龙芯1C300的代号为“XPS90”。

龙芯1C300主频240MHz,基于GS232处理器核,5级流水线,具有一级指令缓存16KB和一级数据缓存16KB。

龙芯1C300采用0.13微米工艺制造,采用QFP176封装,封装尺寸20mm×20mm,功耗小于0.5W;还可以采用QFP100封装。

加固计算机

龙芯1C300▲

龙芯1C101

龙芯1C101是针对门锁应用而优化设计的单片机芯片。

龙芯1C101主频8MHz,基于GS132R处理器核,集成Flash、SPI、UART、I2C、RTC、TSENSOR、VPWN、ADC等功能模块,在满足低功耗要求的同时,可以大幅减少板级成本。

龙芯1C101采用0.13微米工艺制造,采用QFP64封装,封装尺寸12mm×12mm,功耗5mW/5μW。

加固计算机

龙芯1C101

浙江龙芯凯丰在2012年推出龙芯智能门锁。龙芯智能门锁具有传统智能锁的指纹、密码开锁功能,还有“短信开锁”的功能。只要通过指定代码发送短信,门就可以自动打开,实现远程遥控。此外,如果指纹开锁出现三次错误,“龙芯锁”就会拍摄影像发送到主人的手机;如果遇到煤气泄漏、发生火情等情况,“龙芯锁”不仅会发出警报,还会同时拍摄烟雾影像传到主人手机。

龙芯1D

龙芯1D是面向超声波热表、水表和气表测量的低功耗、低成本专用处理器。2013年6月完成设计,2014年3月19日,龙芯1D芯片的量产版本(LS1D4)完成流片封装。

龙芯1D主频8MHz,基于GS132R处理器核(8KB SRAM),片上存储128KB Flash;集成超声脉冲发生器、模拟比较器、时间数字转换器、红外收发器等功能部件。

龙芯1D采用0.13微米工艺制造,采用QFP80封装,封装尺寸14mm×14mm,功耗100uW。

加固计算机

龙芯1D▲

2011年11月,三川智慧与龙芯中科签署《技术开发合同》,共同研发一款水气热计(测)量通用芯片(LS1D或龙芯1D),芯片采用0.13um实现,处理器主频8MHz。在每秒钟进行2次测量的频率下,采用3000mAH理论电量供电,能连续工作5年以上。合同有效期10年。

2018年5月27日三川智慧公告称,公司与龙芯中科合作开发的水气热计(测)量通用芯片,能满足公司目前的产品主要技术性能要求,保障特殊情势下战略安全,但与世界同类芯片先进水平尚有一定差距,能否进一步深入研发、突破核心技术存在一定的研发风险;同时,由于受使用环境、使用习惯、市场拓展等因素影响,对公司当前经营业绩不会产生重大影响。基于目前的判断,该芯片市场前景尚不确定。

龙芯1G(音响)

龙芯1G是苏州上声(Sonavox)定制的一款汽车音响专用芯片。

龙芯1H(高温钻探)

2016年推出的龙芯1H高温钻探芯片是为中国石油集团渤海钻探工程有限公司专门定制的一款处理器,设计目标是175摄氏度超高温工作条件下的长时间可靠运行,主要用于石油钻探随钻的温度、转速、倾角等参数采集设备。

龙芯1H主频8MHz,采用单发射按序执行32位处理器核(GS132),3级流水线,集成单精浮点协处理器、片上RAM/Flash/EEPROM、24位ADC、比较器、电源管理等模块,以及定时器、SPI、UART、I2C、CAN等接口。

龙芯1H采用0.13微米工艺,采用QFP100封装,封装尺寸14mm×14mm,功耗50uW。

加固计算机

龙芯1H▲

龙芯2家族

早期龙芯2号处理器采用4发射乱序执行的64位处理器核。但龙芯2K处理器是双发射乱序执行的GS264处理器核的64位双核处理器。

龙芯2F“PLA80”

2007年7月31日,龙芯2F(L2F)流片成功。为了纪念建军80周年,龙芯2F代号为“PLA80”。

龙芯2F主频800MHz,采用四发射乱序执行的64位处理器核,具有64KB一级指令缓存和64KB一级数据缓存,512KB 二级缓存。

龙芯2F采用90纳米工艺,包含5100万晶体管,采用HSFCBGA452封装,封装尺寸27mm×27mm。

龙芯2F集成了DDR2内存控制器和PCI接口,辅以适当的PCI外设,2F可用于个人计算机、行业终端、工业控制、数据采集、网络安全等领域。

加固计算机

龙芯2F▲

2007年12月26日,由中国科技大学基于“龙芯2F”处理器研制的万亿次高性能计算机“KD-50-I”通过鉴定,集成了330余颗“龙芯2F”处理器,理论峰值计算能力达到1万亿次。这是我国首台国产万亿次高性能计算机。

2008年,中科龙梦推出采用龙芯2F处理器的福珑2F迷你电脑。经过多年的商业化推广,龙芯2F的稳定性已得到充分的验证。可以说龙芯2F是龙芯家族中第一款成功的商用处理器。

龙芯2G

2010年,单核CPU龙芯2G(L2G)流片成功。

龙芯2G主频1.0GHz,有64KB的指令和64KB数据的L1缓存,以及1MB的L2缓存;功耗3W。

龙芯2G采用65纳米工艺,集成1亿晶体管,采用BGA741封装,封装尺寸31mm×31mm。

加固计算机

▲龙芯2G▲

龙芯2GQ

有关龙芯2GQ的信息不多。

我们只能在中科梦兰逸珑8133笔记本的介绍中看到。

逸珑8133笔记本内置我国拥有自主知识产权的龙芯3A/2GQ四核高性能通用处理器,主频900MHz。配备13.3显示屏,分辨率为1366x768;1GB独立显存;采用AMD RS780E+SB710;2.5” SATA HDD 160/250/320/500 GB;操作系统:红旗/中标麒麟/中科方德/共创/Debian Linux。

据称龙芯2GQ与龙芯3A1000的区别在于龙芯2GQ不支持多路互联。

龙芯2H

2012年,单核64位CPU龙芯2H流片成功,2013年开始送样,2014年正式推出。

龙芯2H是一款高集成度系统芯片,主频达1GHz;片内集成64位处理器核、3D GPU、VGA 和LCD显示接口、媒体加速以及芯片组功能;有64KB的一级指令缓存和64KB一级数据缓存,512KB的二级缓存;实现了高级电源管理功能,支持多种电源级别和唤醒方式。

龙芯2H采用65纳米工艺,采用FCBGA741封装,封装尺寸31mm×31mm。

龙芯2H能够满足安全适用计算机、云终端、网络设备、消费类电子等领域需求,同时可作为Hyper Transport(HT)或者PCIE接口的全功能套片使用。

加固计算机

龙芯2H▲

龙芯2I

龙芯2I采用65纳米工艺;集成8200万晶体管;采用FCBGA500封装。

龙芯2K1000

龙芯2K1000主频达1GHz;集成两个64位GS264处理器核和GPU图形核心,峰值运算速度8GFlops,一级指令缓存32KB,一级数据缓存32KB,二级缓存共享1MB,功耗1-5W,并支持动态降频降压。是面向工业控制与终端等领域的低功耗通用处理器。

龙芯2K1000采用40纳米工艺,集成约1.9亿个晶体管,采用FCBGA608封装,封装尺寸27mm×27mm。

加固计算机

龙芯2K1000

龙芯2K0500

龙芯2K0500的主频达500MHz;集成1个LA264处理器核。采用40纳米工艺生产。

龙芯2K2000

据悉龙芯2K1000的升级版是龙芯2K2000,预计采用28纳米工艺生产,集成2个LA364处理器核,对主要接口进行升级,同时主频将达到2GHz。

目前没有更多消息。

龙芯2K3000

据悉龙芯2K2000的下一个版本是龙芯2K3000,预计采用12纳米工艺生产,集成2个LA364处理器核,同时主频维持2GHz。

目前没有更多消息。

龙芯3号家族

龙芯3处理器均为四发射乱序执行的64位处理器核。目前,除了龙芯3B1500处理器为8核,其他的龙芯3号处理器均为4核。而最新版龙芯3C5000处理器会将处理器核数提高到16。

龙芯3A1000

2009年9月28日,我国首款商用四核处理器龙芯3A1000流片成功。

龙芯3A1000集成4个四发射乱序执行的64位处理器核(GS464),9级流水线,有64KB一级数据缓存和64KB一级指令缓存,二级缓存共享4MB,最高主频1GHz,功耗15w(支持动态降频)。

龙芯3A1000中每个CPU核包含两个浮点乘加部件,双精度浮点性能峰值为16GFlops;可用于桌面、服务器、工业控制等领域。

龙芯3A1000采用65纳米工艺,集成4.25亿晶体管;采用FCBGA1121封装,封装尺寸40mm×40mm。

龙芯3A1000初期经过两次改版,第一次改版并于2010年10月流片成功,第二次改版于2012年8月中旬流片成功。

加固计算机

龙芯3A1000

2010年4月中国科学技术大采用80颗龙芯3A1000处理器构建万亿次高性能计算机“KD-60”研制成功。

2010年4月23日,曙光公司宣布成功研制出基于国产龙芯处理器的高性能刀片服务器CB50-A。

2011年9月19日,曙光公司发布基于国产龙芯3A四核处理器的龙腾机架服务器、存储服务器以及塔式服务器。

龙芯3B1000

2011年4月,首个8核CPU龙芯3B1000流片成功。

龙芯3B1000集成8个GS464处理器核,4MB的二级缓存,每个核包含两个256位向量部件和1个128x256位的向量寄存器堆,峰值浮点性能达到128GFLOPS。

龙芯3B1000采用65纳米工艺,比3A1000大73%;集成5.826亿晶体管,比3A1000增加了37%;采用FCBGA1121封装,封装尺寸40mm×40mm。

加固计算机

▲龙芯3B1000▲

龙芯3B主要用于高性能计算机、高性能服务器、数字信号处理等领域。2012年12月29日,由中国科学技术大学与深圳大学联合研制的首台采用自主设计的“龙芯3B”八核处理器的万亿次高性能计算机“KD-90”在合肥通过专家组鉴定。“KD-90”采用单一机箱,集成了10颗龙芯3B处理器,成本低于20万元,功耗低于900W,占地面积降低至0.12平方米,理论峰值计算能力高达每秒1万亿次。

龙芯3B1500

2012年8月,8核CPU龙芯3B1500第一次流片成功;2013年10月第一次改版的龙芯3B1500流片完成;2015年6月第二次改版的龙芯3B1500流片成功。

龙芯3B1500集成了8个四发射乱序执行的64位GS464处理器核,主频1.3-1.5GHz,9级流水线,每个处理器核有64KB的私有一级指令缓存和64KB的私有一级数据缓存,128KB私有二级缓存,有8MB三级共享缓存。单芯片双精度浮点计算能力达到192GFlops。功耗30w(典型)/60w(向量)。

龙芯3B1500集成11亿晶体管;采用FCBGA1121封装,封装尺寸40mm×40mm。

加固计算机

龙芯3B1500

龙芯3A2000

2015年8月18日,首款采用GS464E微结构的处理器的龙芯3A2000/3B2000正式发布。

龙芯3A2000是龙芯3A1000的升级版,保持4核架构,但是处理器核升级为GS464E,主频1GHz,缓存方面每核心一级指令64KB、数据64KB,二级缓存为256KB,三级是共享4MB。

2015年9月和2016年3月分别进行了龙芯3A2000的第一次改版设计和第二次改版设计。

龙芯3A2000采用40纳米工艺,采用FCBGA1121封装,封装尺寸40mm×40mm。

加固计算机

龙芯3A2000

龙芯3B2000

龙芯3B2000在龙芯3A2000的基础上支持多达四片全相联结构的多路一致性互连。

龙芯3B2000是龙芯3A1000的升级版,保持4核框架,但是处理器核升级为GS464E,主频1GHz,缓存方面每核心一级指令64KB、数据64KB,二级缓存为256KB,三级是共享4MB。

龙芯3B2000采用40纳米工艺,采用FCBGA1121封装,封装尺寸40mm×40mm。

龙芯3A3000CZ80

2016年10月17日,4核CPU龙芯3A3000流片成功。为了纪念长征胜利80周年,龙芯3A3000命名为“CZ80。2017年4月25日正式发布。

龙芯3A3000主频可达1.5GHz,采用4个四发射乱序执行的64位超标量GS464E处理器核,采用12级超标量流水线;每核有2个定点单元、2个浮点单元和2个访存单元。每个处理器核包含64KB私有一级指令缓存和64KB私有一级数据缓存,每个处理器包含256KB私有二级缓存;所有处理器核共享8MB三级缓存;峰值浮点性能24GFlops;典型功耗<40W@1.5GHz。

龙芯3A3000采用28纳米工艺,采用FCBGA1121封装,封装尺寸40mm×40mm。

加固计算机

龙芯3A3000

龙芯3B3000

双路服务器CPU龙芯3B3000在龙芯3A3000的基础上支持多达四片全相联结构的多路一致性互连。

龙芯3B3000主频可达1.5GHz,采用4个四发射乱序执行的64位超标量GS464E处理器核,采用12级超标量流水线;每核有2个定点单元、2个浮点单元和2个访存单元。每个处理器核包含64KB私有一级指令缓存和64KB私有一级数据缓存,每个处理器包含256KB私有二级缓存;所有处理器核共享8MB三级缓存;峰值浮点性能24GFlops;典型功耗<40W@1.5GHz。

龙芯3B3000采用28纳米工艺,采用FCBGA1121封装,封装尺寸40mm×40mm。

龙芯3A4000

2019年4月15日龙芯3A4000第一次流片成功,2019年12月24日正式发布。

龙芯3A4000保持4核框架,但处理器核升级超标量GS464V,主频得以提升至2GHz,支持支持128/256位向量指令;每核有2个定点单元、2个向量单元和2个访存单元。每个处理器核包含64KB私有一级指令缓存和64KB私有一级数据缓存,每个处理器包含256KB私有二级缓存;所有处理器核共享8MB三级缓存;典型功耗<30W@1.5GHz、<40W@1.8GHz、<50W@2.0GHz。3A4000通用处理性能与AMD公司28nm工艺“挖掘机”处理器相当。

龙芯3A4000采用28纳米工艺,采用FCBGA1211封装,封装尺寸37.5mm×37.5mm。

加固计算机

龙芯3A4000

加固计算机

▲摘自胡伟武董事长在龙芯3A4000发布会上的报告《龙芯不怕远征难》

龙芯3B4000

2019年6月采用GS464Vv的龙芯3B4000第一次流片成功,2019年12月24日和龙芯3A4000同时发布。

龙芯3B4000属于龙芯服务器CPU产品线,用于多路服务器整机产品,支持最多四路结构的多路一致性互连。

龙芯3B4000支持双路、四路服务器,即在一台服务器主板上安装2个或者4个龙芯3B4000芯片,一台服务器最多包含16个处理器核。所有CPU之间通过高速总线接口直接互联,共享使用物理内存。龙芯3B4000专门优化了CPU之间的高速互连总线,跨片访存实际带宽提升400%以上。龙芯3B4000提升了对于大内存容量支持,支持DDR4内存,四路服务器最高内存容量可达1TB。

龙芯3B4000的性能是龙芯3B3000四倍以上。

龙芯3B4000采用28纳米工艺,采用FCBGA1211封装,封装尺寸37.5mm×37.5mm。

龙芯3A5000“KMYC70”

2021年7月,首款采用自主指令系统LoongArch的处理器芯片龙芯3A5000正式发布。2020年10月,基于全自主IP设计的龙芯3A5000第一次流片成功。为纪念抗美援朝70周年,龙芯3A5000芯片代号为“KMYC70”。

龙芯3A5000处理器主频2.3GHz-2.5GHz,包含4个处理器核心,每个处理器核心采用64位超标量LA464自主微结构。集成了2个支持ECC校验的64位DDR4-3200控制器,4个支持多处理器数据一致性的HyperTransport 3.0控制器。支持主要模块时钟动态关闭,主要时钟域动态变频以及主要电压域动态调压等精细化功耗管理功能。龙芯3A5000处理器相较上一代龙芯3A4000处理器,性能提升50%以上,功耗降低30%以上。

龙芯3A5000采用12/14纳米工艺节点,继续保持4核设计,但主频提升至2.5GHz。

龙芯3A5000

龙芯3B5000

龙芯3B5000在龙芯3A5000的基础上支持多路互连。

龙芯3C5000L

16核龙芯3C5000L是由4颗3A5000封装而成,支持四路3C5000L互连。

龙芯3C5000L

龙芯3C5000“CPC100”

基于龙芯3A5000核心的服务器专用芯片龙芯3C5000已经于2021年上半年完成设计并交付流片。为庆祝建党100周年,芯片代号为“CPC100”。

龙芯3C5000采用自主指令系统LoongArch,内核数将从4核提升至16核,主频为2.5GHz,支持2至16路服务器,具备高端服务器的商业竞争力。

龙芯3C6000

下一代产品是龙芯3A6000,主频将超过2.5GHz,包含4个处理器核心,每个处理器核心采用64位超标量LA464自主微结构。

龙芯桥片

龙芯7A1000

2017年10月,龙芯7A1000桥片流片成功。

龙芯7A1000桥片是面向龙芯3号处理器的第一款配套桥片,目标是替代AMD RS780+SB710芯片组,为龙芯处理器提供南北桥功能。

龙芯7A1000桥片通过HT3.0接口与处理器相连,集成GPU、显示控制器和独立显存接口,外围接口包括32路PCIE2.0、2路GMAC、3路SATA2.0、6路USB2.0和其它低速接口,可以满足桌面和服务器领域对IO接口的应用需求,并通过外接独立显卡的方式支持高性能图形应用需求。

龙芯7A1000采用40纳米工艺,采用FCBGA804封装,封装尺寸31mm×31mm。

龙芯3A3000是第一款采用龙芯7A1000作为桥片的处理器。

加固计算机

▲龙芯7A1000▲

龙芯7A2000

龙芯7A2000桥片是龙芯7A1000桥片的升级版,作为龙芯3A5000的配套桥片。

龙芯7A2000桥片集成PCIE3.0、USB3.0、SATA3.0等接口,集成自研的图形处理器。

后记

龙芯经过20年的发展,形成了一个相对完整的处理器家族,可以应用于石油钻探、工业控制、网络安全、桌面办公、智能水表、生物识别等各种领域,为我国关键行业信息基础设施提供了重要的技术支持。

诚然,与英特尔、AMD等处理器厂商相比,龙芯还只是个“成长中的孩子”。但是令人欣喜的是在曙光等国产服务器厂商与软件厂商的支持之下,龙芯并不是孤军奋战。龙芯的发展已经推动并形成了一条自主科技产业链,整个产业链无疑将形成一股更强大的力量来共同开拓自主创新的产业之路。


电话咨询
产品中心
解决方案
关于我们