服务器 频道

开拓自主创新之路 龙芯十年发展回顾

  【IT168 专稿】就像人类的大脑一样,作为计算系统的核心,处理器的作用与重要意义不言而喻。由中国科学院计算所自主研发的通用CPU龙芯(英文名:Loongson)的诞生打破了长期以来由国外巨头垄断处理器市场的局面,更开启了国产科技产品的创新之路。从最初成立课题项目,到诞生实体产品,再到支撑起整个名族产业链,龙芯已经走过了风雨十年。本文将回顾龙芯十年(2001-2011)的发展历程,并对龙芯产品进行梳理。

 

龙芯研制路线

  龙芯研制路线

  2001年5月,龙芯课题组在中科院计算所知识创新工程的支持下正式成立。

  2001年8月19日,龙芯1号设计与验证系统成功启动linux操作系统,10月10日通过由中国科学院组织的鉴定。

  2002年8月10日,首片龙芯1号龙芯XIA50流片成功。

  2002年9月22日,龙芯1号通过由中国科学院组织的鉴定,9月28日我国首个拥有自主知识产权的CPU龙芯1号正式发布。

  2002年9月,曙光推出完全自主知识产权的“龙腾”服务器,采用了“龙芯1号”CPU、曙光和中科院计算所联合研发的服务器专用主板以及曙光LINUX操作系统,是国内第一台完全实现自有产权的服务器产品。

  2003年10月17日,龙芯2号首片MZD110流片成功。

  2004年9月28日,经过多次改进后的龙芯2C芯片DXP100流片成功。

  2004年11月,中国国务院总理温家宝视察中科院计算所听取龙芯研发情况汇报。

  2005年1月31日,中国科学院组织举行龙芯2号鉴定会,2005年4月18日龙芯2号正式发布。

  2005年2月,中国国家主席胡锦涛等党和国家领导人在参观中科院建院55周年展览时参观了龙芯处理器展览。

  2006年3月18日,龙芯2号增强型处理器CZ70流片成功。

  2007年12月26日,基于龙芯2号的国产万亿次高性能计算机系统KD-50-I通过鉴定。KD-50-I由中国科学技术大学研制成功,使用300多颗64位龙芯2F处理器,峰值性能达到每秒1万亿次双精度浮点运算,是我国首次采用国产CPU芯片研制的万亿次级的高性能计算机系统。

  2008年,曙光公司推出了基于龙芯2号的防火墙产品,实现了从软件到硬件、从整机到芯片完全自主知识产权。

  2009年,龙芯3A、龙芯2F3、龙芯2号抗辐照SOC流片成功;龙芯2G和龙芯3A+完成流片;龙芯2H和龙芯3C的设计也开始部署。在全面掌握65nm工艺的产品设计技术后龙芯开始32nm工艺的设计。

  2010年4月,全线自主化的曙光龙腾刀片服务器成功面世。“中国创造”龙腾刀片服务器产品的诞生,填补了国内全线自主化服务器市场的长期空白,打破了国外厂商对服务器关键技术的长期垄断。

  2011年9月19日,曙光公司发布基于国产龙芯3A四核处理器的龙腾机架服务器、存储服务器以及塔式服务器。

  龙芯三代简介

  龙芯处理器产品包括龙芯1号、龙芯2号、龙芯3号三大系列,涵盖小、中、大三类CPU产品。

 

22222222222222

  (1).龙芯1号

  龙芯1号CPU IP核是兼顾通用及嵌入式CPU特点的32位处理器内核,于2002年研发完成,采用类MIPS III指令集,具有七级流水线、32位整数单元和64位浮点单元。龙芯1号CPU IP核具有高度灵活的可配置性,方便集成的各种标准接口。

  龙芯1号CPU IP核可配置结构可根据用户的需求进行选择配置,从而定制出最适合用户应用的处理器结构。主要的可配置模块包括:浮点部件、多媒体部件、内存管理、Cache、协处理器接口。浮点部件完全兼容MIPS的浮点指令集合,浮点部件及其相关的系统软件完全符合ANSI/IEEE 754-1985二进制浮点运算标准。浮点部件主要包括浮点ALU部件和浮点乘法/除法部件,用户可根据自己的实际应用选择是否添加。媒体部件复用了MIPS浮点指令的Format域,并复用了浮点寄存器堆,媒体指令集基本对应了Intel SSE媒体指令集合的各种操作。

  内存管理部件有三种工作模式:标准模式、直接映射模式和无映射模式。在标准模式下,TLB分为ITLB和DTLB两部分,每部分均由48项页表项组成,同时支持mapped和unmapped的从虚拟地址到物理地址的变换方式;TLB也可只进行直接映射,不使用CAM和RAM,以减小面积;而无映射模式下甚至可以去掉TLB,采用直连SRAM的形式实现访存。龙芯1号CPU IP核的Cache分为指令Cache和数据Cache,两部分独立配置,以4K为一路,可配置为4路、2路和0路。用户可根据应用需要,确定所需Cache的大小,甚至不使用Cache。协处理器接口为外部协处理器提供了一个高效率的接口。龙芯1号CPU IP核提供了两套可配置的处理器总线接口:AMBA接口和哈佛结构SRAM接口。

  (2).龙芯2号

  龙芯2号CPU 采用四发射超标量超流水结构,于2003年正式完成并发布,片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB,最高频率为500MHz,功耗为3-5瓦,远远低于国外同类芯片,其SPEC CPU2000测试程序的实测性能是1.3GHz的威盛处理器的2-3倍。

  (3).龙芯3号

  2008年末4核龙芯3号流片成功,采用65nm工艺,主频1GHz,晶体管数目达到4.25亿个。“龙芯3号”早期是一款4核处理器,并增加专门服务于Java程序的协处理器,以提高Linux环境下Java程序的执行效率,指令缓存追踪技术等。“龙芯3号”最终将实现对内峰值每秒500-1000亿次的计算速度。此外,龙芯3号还会尝试去兼容x86。

  龙芯产品简介

 

龙芯产品简介
▲龙芯1A 

  龙芯1A是一款32位SoC芯片,主频为300MHz,采用130nm CMOS制造工艺,23mm*23mm BGA封装,片内集成32位处理器核、2D GPU、VGA和LCD显示接口、以及南桥芯片组功能。能够满足超低价位云终端、工业控制/数据采集、网络设备、消费类电子等领域需求,同时可以作为PCI接口的全功能南桥使用。

 

龙芯产品简介
▲龙芯1B

  龙芯1B是一款32位SoC芯片,主频为200MHz,采用130nm CMOS制造工艺,17mm*17mm BGA封装工艺,片内集成32位处理器核、LCD显示接口、以及丰富的IO接口。能够满足超低价位云终端、工业控制/数据采集、网络设备、消费类电子等领域需求。

 

龙芯产品简介
▲龙芯2G

  龙芯2G集成3-4个处理器核,主频为900MHz-1GHz,采用65nm CMOS制造工艺,31mm*31mm BGA封装,具有很高的性能功耗比。龙芯2G主要用于个人计算机等领域。

 

龙芯产品简介
▲龙芯2F

  龙芯2F集成64位处理器核,主频达到800MHz,采用90nm CMOS制造工艺,27mm*27mm BGA封装,具有很高的性能功耗比。龙芯2F主要用于个人计算机、行业终端、工业控制/数据采集、网络安全等领域。

 

龙芯产品简介
▲龙芯3A

  龙芯3A是首款国产商用4核处理器,主频达到1GHz,采用65nm CMOS制造工艺,40mm*40mm BGA封装,峰值计算能力达到16GFLOPS,具有很高的性能功耗比。龙芯3A主要用于低功耗服务器、个人计算机、工业控制、网络安全等领域。

 

龙芯产品简介
▲龙芯3B

  龙芯3B是首款国产商用8核处理器,主频达到1GHz,采用65nm CMOS制造工艺,40mm*40mm BGA封装,支持向量运算加速,峰值计算能力达到128GFLOPS,具有很高的性能功耗比。龙芯3B主要用于高性能计算机、高性能服务器、数字信号处理等领域。

  编者的话

  诚然,与英特尔、AMD等处理器厂商相比,龙芯还只是个“成长中的孩子”。但是令人欣喜的是在曙光等国产服务器厂商与软件厂商的支持之下,龙芯并不是孤军奋战。龙芯的发展已经推动并形成了一条自主科技产业链,整个产业链无疑将形成一股更强大的力量来共同开拓自主创新的产业之路。 

0
相关文章