北京信息科学与技术国家研究中心

Beijing National Research Center for Information Science and Technology

先进电子与光电子科学技术研究部

先进电子与光电子科学技术研究部

    一、研究部介绍
    信息技术和电子技术正向着智能化方向发展。相关系统在带宽、能耗、微型化等方面的需求面临核心瓶颈的制约。另外,支撑这些系统的集成电路等比例缩小制造技术也已逼近物理极限。此时,若能在电子与光电子基础器件和制造技术上取得变革性突破并将之应用,可避免信息技术的发展出现停滞,也将重新确定未来信息技术新的强者。
本研究部将在纳米尺度上探索光与物质相互作用新的机理,揭示小尺度噪声、非线性对宏观器件的影响,攻克载流子输运的微纳尺度调控方法与技术;探索狄拉克材料及拓扑绝缘体等新材料的量子物理机制,提出超越玻尔兹曼极限、实现近零功耗电子器件与芯片的技术途径。在此基础上,研制超低功耗纳米有源、无源光电集成芯片;研制超高速、宽带集成光电子器件及相关的高频宽带光信号处理组件;研制近零功耗的、支持大规模单元集成的新型电子器件;研制高性能低功耗的计算、存储芯片。为此,本研究部将重点布局纳米光电子发光器件及集成芯片、高维并行光处理芯片、光电子器件与微波光子器件、新型基础电子器件与微传感器、可重构计算系统与存算一体新架构等方向。

    二、主要研究方向
    1.纳米光电子发光器件及集成芯片
    片上超级计算机、片上数据中心是解决制约超算或数据中心发展的两大关键性指标:能耗和速度的不二途径。该途径上的一个挑战性问题是光电子器件的纳米化、低能耗化、和集成化。本研究方向将探索新型纳米光电材料的发光物理机制,研究新型小尺寸低能耗高速纳米激光与片上光放大器;揭示纳米激光器的尺寸极限、能耗极限和高速及尺寸-能耗-速度的相互关系,研究二维相变材料进行新型的高速低能耗调制;探索纳米尺度上器件集成的新思路,研究光源、调制器、波导和探测器等关键器件的“模型”芯片的设计、材料兼容性及其研制工艺。经过5-10年的研究,最终实现低于10 fJ/bit的超低功耗片上可集成纳米激光,完成50 GHz以上超高速纳米激光的验证,打通纳米光电子关键器件集成的制作全过程,实现“模型”芯片的集成。
    2.高维并行光处理芯片
    随着微电子芯片内器件工艺接近物理极限,依赖微电子集成提升芯片性能的路线难以持续。光信号处理技术为突破这一瓶颈提供的新的途径。该途径需要解决的挑战性问题是:如何在有限光子器件集成度的条件下实现性能超过微电子芯片的光处理芯片。本研究方向将研究在芯片上实现复杂高维光场产生和操控功能的技术,发展高性能、高效率低功耗的高维并行光处理芯片,探索其在高性能光计算和光通信上的应用。预计未来5年内,研制出多种新型高维空间光场产生器件,实现新型波长-空间动态调控芯片,获得超高分辨的光谱操控(小于0.1nm)、超快的空间模式调制速度(大于MHz)和超大规模(有望达到100*100)的辐射阵列。
    3.光电子器件与微波光子学
    联合激光、微波探测,实现多波段、多维一体化目标监测和成像是未来智能平台眼睛的基本功能需求。低噪声、高灵敏度、大带宽、大动态范围的光电子器件与微波光子组件是该基本功能需求的基础支撑。本研究方向将发展半导体微纳量子结构中载流子输运的调控方法和手段;研究强度噪声、相位噪声、和载流子散粒噪声的物理机理以及抑制方法,发展原子尺度半导体薄膜和低维量子结构的制备技术和高分辨、原位、飞秒级材料与微纳结构分析和评测技术;研究基于微波光子技术的分布式相参结构,研究高精度时频动态同步原理、方法与核心技术;研究光-电一体化相参信号处理理论与方法,研究高频宽带光电一体化的收发组件原理、结构与技术。经过5年研究,实现非晶衬底上的半导体发光薄膜材料外延生长,颠覆现有半导体晶体生长的范式。实现新型全固态有源相控阵激光雷达技术突破,研制开发关键光电子核心单元器件;突破微波光子分布式相参原理、方法与核心技术,实现高精度三维微波成像。
    4.新型基础电子器件与微传感器
    基于现有集成电路的技术路线,等比例缩小的芯片制造技术已逐步逼近物理极限。信息处理和计算技术的发展亟待基础电子材料、器件与微传感器全新升级。本研究方法将探究低维铁磁和狄拉克材料、以及新型铁电纳米材料的生长机理;研究新型材料体系量子应用的能带、带隙、能谷、自旋及铁电起源等物理机制;调控材料体系和微纳结构的性质;挖掘新的传感物理机制;研究传感器与被测对象以及控制电路的片上集成技术。经过5年研究,同等工艺条件下,新型器件功耗降低为传统硅相应器件的80%,其中负电容逻辑器件的滞回降低到50 mV以下。未来,进一步将功耗降低为传统硅器件的50%,其中负电容逻辑器件的滞回降低到10 mV以下;实现单元集成,完成自旋逻辑运算器件、负电容晶体管与存储原理性芯片研发,并拓展应用于量子计算、人工智能等领域。
    5.可重构计算系统与存算一体新架构
    指令集处理器(ISAP)与专用集成电路(ASIC)已无法满足智能终端计算的要求;亟需探索突破冯诺依曼架构的新体制,推动智能计算领域的创新发展。本研究方向尝试解决该项挑战,将重点研究:可伸缩的动态变结构电路架构及电路重构方法;混合颗粒度、动态可变功能的基本计算单元和存储单元;高带宽、可扩展的动态可重构片上互连策略;存算一体化架构的理论基础、存算一体化结构的抽象计算模型及其运算机理;以及存算一体化结构的设计及相关算法在存算一体化结构上的高能效映射方法。5年内,实现软、硬件动态可编程、功能可重构计算芯片,在人工智能处理器和数据中心处理器领域设计完成2款芯片。人工智能处理器能效达到60TOPs/W;数据中心处理器相比指令驱动CPU性能提升1倍、功耗降低1倍。突破存算一体化高能效智能计算体系结构,完成计算能效高于CPU-GPU 2-3个数量级、能耗为百毫瓦量级的存算一体智能芯片研制并实现在手机、无人机等领域应用。未来设计完成高能效通用可重构可编程逻辑器件,实现对量大面广的专用集成电路的替代,探寻出我国高端集成电路的新型发展路径,提升我国集成电路产业的核心竞争力。

    三、重要研究成果
    3.1 基础前沿研究
    1.面向未来光电集成芯片的光源及器件

    2007年首次提出用金属-半导体核壳结构作为激光小型化的方案,利用金属中的等离子激元和光波的耦合来将光模限制在远远小于波长的尺度,从而根本突破衍射极限,为激光器尺寸的最终小型化另辟新路。这一方案目前被国际上很多研究组采纳。2009年首次研制了光学厚度小于半波长的金属腔激光器,这是世界上第一个尺度小于衍射极限的电注入激光器。在2013年首次在世界上实现了电注入、室温下连续模运转的金属等离子激元激光器,从而为这种纳米激光器的实用化迈出了关键的第一步。

金属等离子激元激光研究成果

    2.半导体合金纳米材料、多波长激光及白光激光器:2015年首次在单一纳米半导体薄膜上一次生长出支持三原色同时激光运转的异质结,在国际上首次实现了白光激光器,相关结果在《自然·纳米技术》上发表。2015年底,美国著名科技杂志《Popular Science》将“白光激光”的发明评为该年度工程类的十大发明之一(“The Greatest Tech of the Year”),中国激光网将白光激光选为2015年十大新型激光器,及激光领域的十大技术进展。

半导体合金纳米材料、多波长激光及白光激光器研究成果

    3.硅基二维材料纳米激光器和芯片上光放大器
    2017年首次实现了室温下连续模运转的硅基二维材料的纳米激光器,相应结果发表在Nature Nanotechnology杂志上,并获得2017年“中国光学十大进展”- 基础研究类。研制出一种生长在硅基衬底上的新型单晶铒化合物纳米线,并首次在单根纳米线上准确测量了材料的本征吸收系数,最终获得高达100dB/cm的光学净增益,相应结果发表在2017年Nature Photonics杂志上。这一研究结果对于硅基片上光子集成的纳米激光器和光放大器等具有重要意义。


硅基二维材料纳米激光及纳米线波导实现光放大示意图

    4.基于超材料的自由电子辐射芯片
    提出并实验论证了SPP超材料中的“无阈值切伦科夫辐射”,实现了低速自由电子的光频段辐射,创造性地设计研制出世界首款自由电子辐射芯片——片上集成的自由电子光源。论文发表于2017年的《Nature Photonics》,并作为当期网站主页封面文章。该研究成果从根本上解决了切伦科夫辐射需要极高电子速度这一科学界几十年来的难题,将推动光电子器件领域 “自由电子辐射芯片”这一全新的研究方向的发展。研究工作入选“2017中国光学十大进展”。


切伦克夫芯片及其性能

    5.在新的电子器件方面取得突破
    实现了电压调控可塑性的石墨烯类突触器件,这一新型动态突触器件在同一个器件上实现了兴奋型与抑制型的突触行为,为类脑计算芯片的设计与实现提供了新的思路与支撑技术(Nano Letters 2015, 15, 8013?8019);实现了电压调控存储窗口的石墨烯阻变存储器,这一新型存储器的写入电压连续可调,有望对新一代高密度存储技术产生重要影响(Advanced Materials, 2015, 27, 7767–7774)。采用石墨烯修饰介质层和电极界面,实现了一种低阻态阻值、低功耗石墨烯存储器(Nano Letters 13, 651-657 (2013))。

石墨烯类突触器件

石墨烯阻变存储器

石墨烯存储器

    实现了阻变存储器在10 pA极低工作电流下工作,其功耗仅为28 pW,远低于传统阻变存储器mW~nW量级的功耗。该器件的仿生突触能耗仅为400 fJ/spike,已经非常接近人脑~1-100 fJ/spike的超低能耗,此项成果对于极低功耗的仿生神经计算具有重要意义(ACS Nano, 2017, 11 (12), pp 12247–12256)。

阻变存储器

    3.2 应用基础研究
    1.光通信波段量子光源器件

    在国内率先开展基于硅基光子器件的量子光源研究,充分应用硅波导量子光源的高维时频纠缠特性第一次利用光纤长距离实现量子鬼像。发展的光通信波段双光子量子光源还应用到:光纤传送量子安全直接通信实验,基于独立量子光源的量子隐形传态实验和量子纠缠交换实验等。成果已进入产品化阶段。


    2.微波光子滤波器组件及其硅基集成芯片
    提出电域等效切片原理实现光域频谱的超高精细度切割,解决光域频谱硬切割精度差的难题;揭示FIR滤波器的Q值最终受限于组件的高阶色散;发明一种微波光子滤波器高阶色散高精度在线测量的方法;提出并实现一种可消除高阶色散的微波光子滤波器原理与结构。最终实现W波段(75~110GHz)Q值创纪录(>6400)的、可调、任意复系数可重构的FIR微波光子滤波器。相关学术成果发表在Light: Science & Applications、Laser & Photonics Review、Optics Express、Optics Letters等国际期刊上,并在CLEO-PR2017、ICOCN2017、CLEO2018、Advanced Photonics 2018等国际会议上做特邀报告。


W波段可调、可重构FIR 微波光子滤波器组件

    提出基于双层耦合超低损氮化硅波导的超长延时线(~50cm)和级联MZI光子回路,实现了7个零点的FIR超精细微波光子集成信号处理芯片,处理精度145MHz;提出了基于类自感应透明效应的超精细微波光子信号处理芯片,可以对微环Q值进行200倍以上的增强,处理精细度可达2.2MHZ,等效光域Q值达8E7,是当时同类微波光子信号处理器精度最高记录。实现了频率范围覆盖1-65GHz的微波信号可调谐精细处理,处理精度为500MHz。

微波光子滤波器芯片

    3.超快激光扫描系统
    基于新型快速时频空映射光场信息的产生与获取,结合波分技术解决了激光扫描成像中成像帧率和色散分辨率的基本矛盾限制,实现了目前世界上最快速的实时线扫描成像技术,将扫描速率提高到了2GHz,并应用于流式细胞检测。
实现了快速的结构光照明成像与数据压缩系统,克服了传统结构光调制技术的速度缺陷,把结构光产生的速度提升到50MHz,比目前最快的DMD快3个数量级;在1.55微米波段实现了超越衍射分辨极限40%的超快超分辨成像。


流式细胞检测原理

    4.基于光子原理的宽带微波收发组件的研究
    提出一种光子辅助PDAC结构和技术,消除电子DAC时间抖动等限制DAC高频宽带的影响,实现了带宽10GHz任意波形的产生。以该PDAC为基础研制了一种波形可重构的宽带微波发射组件。提出一种带宽可重构的、支持下变频/去斜等、功能灵活的宽带微波光子接收前端。以此为基础研制成功一种0-100GHz可调、可重构的宽带微波接收组件。实现了X波段4GHz带宽、W波段10GHz带宽运动目标的成像,分辨率分别为5cm和1.9cm。成果获国家发明专利7项,SCI论文十数篇,已迈入应用研究阶段。

宽带微波光子雷达发射、接收机

X波段4GHz成像雷达的成像效果与分辨率

W波段10GHz宽带微波光子雷达成像分辨率与成像效果

    5.非易失处理芯片
    基于铁电存储器件的分布式非易失存储架构,成功设计了世界上首款低功耗非易失处理器THU1010N,流片结果表明:与工业界最先进的MSP430系列处理器相比,THU1010N的唤醒速度、休眠能耗都有2-4数量级的提升。完成了世界上最快的非易失处理器THU2015N并发表在芯片领域国际顶级会议ISSCC上。设计了集成度最高的非易失处理器THU1020N,非易失FPGA技术和柔性伪CMOS逻辑电路噪声容限模型。THU1020N拥有最高的集成度,数据发送效率提高了27倍。


设计完成的非易失智能传感芯片

    6.数模转换芯片
    经过近10年的努力,实现了高速高精度数模转换器(DAC)从无到有、从落后到超越国外禁运指标的质的飞跃。在公开发表的论文中,本研究提出了高速高精度DAC设计的第一个交织的数字域动态随机归零技术、第一个互补电流源技术、第一个基于冗余的空间过采样技术,提出了自适应的码字不相关开关切换技术。基于这些技术的14位精度3.0GS/s采样率的DAC芯片已经实现了442MHz带宽内超过70.5dB的动态范围,以及1000MHz带宽内超过54.7dB的动态范围,远远超过了欧美对华禁运的指标(12位、1.25GS/s、100MHz处68dB动态范围)。该研究成果获得授权发明专利7项,发表顶级SCI源刊和国际会议论文8篇。

设计的数模转换芯片、测试电路及实测结果

    3.3 应用研究
    1.高速分布反馈半导体激光器及其集成光源

本学部历时近20年,研制出高速、低成本的 DFB 激光器及其集成光源并与合作企业一起实现了产业化。成果于 2011 年通过了教育部科技成果鉴定,鉴定委员会认为“研究成果水平已达国际领先”。成果在数字光纤通信网络中得到广泛应用,近三年合作企业累计为海内外提供了超过 110 万套高速光源器件,新增销售额超过7.5亿元,有力地促进了我国高端光电子芯片产业的自主创新发展。本学部成员(排名第一、第二)与企业合作获得 2011 年中国电子学会电子信息科学技术一等奖,以及 2012 年度国家技术发明二等奖。

干线光通信用40 Gb/s高速集成光源。(a) 激光器和调制器共用同一外延层的增益耦合集成光源芯片结构;(b) 40 Gb/s 高速集成光源模块;(c) 40 Gb/s 高速集成光源模块100km传输实测眼图;(d)国家技术发明二等奖获奖证书

    2.面向半导体照明的GaN基蓝绿光LED及其产业化
    率先提出了在具有二维高低起伏结构的图形化衬底上外延LED 材料的技术方案(中国发明专利:ZL02117329.X);提出了新型量子阱结构以抑制压电极化效应,提高内量子效率和稳定发光波长;利用图形衬底表面的台阶发展了无掩膜的GaN侧向外延技术,GaN材料的位错密度降低至107 cm?2,且LED的出光效率相比传统的平面衬底提高了20%以上;通过优化生长条件,获得了具有陡峭界面的InGaN/GaN多量子阱,制成的LED芯片光谱特性是国际文献报道的最好水平。提出基于Cl2/Ar/BCl3的新刻蚀气体组合,并对刻蚀参数进行了系统优化,实现了大面积均匀、速率可控、表面光滑的GaN/AlGaN异质结材料的非选择性ICP刻蚀。与企业合作,实现了上述创新技术的产业化,推动了我国 LED 产业的发展,与合作企业共同获得了2011年国家科技进步二等奖。


GaN基LED芯片关键技术。(a) 二维蓝宝石图形衬底上的GaN材料外延;(b)高内量子效率量子阱结构;(c) 原子级平整ICP干法刻蚀技术;(d)国家科技进步二等奖获奖证书

    3.基于光线行为调控的三维自由光学曲面构建及其在半导体照明中的应用
    发明并研制出可同时实现光线调控(配光)、系统散热、直流最优化驱动的半导体照明光源架构;构建了一个三维自由光学曲面以非成像光学原理调控 LED 发出的光线走向,消除眩光和实现均匀的照度/亮度分布,同时仅用一个自由光学曲面就可将偏离理想点光源的 LED 扩展光源转换为可提供具有任意照度分布的半导体照明光源。基于这一方法,发明了包括“花生米”型光学结构在内的多种三维非对称自由光学曲面透镜,首次在实际道路应用,较传统路灯照度均匀性提高45%,且节能 60%。上述非成像光学方面的专利成果已成为东莞勤上光电股份有限公司的核心技术并促成其上市,形成了大型场馆照明、路灯等系列产品,实现销售收入 12.2亿元。专利产品在人民大会堂万人礼堂使用时,照明效果优于原卤钨灯且节能75%。获 2009 年广东省科学技术一等奖,2014年国家技术发明二等奖。


半导体照明应用技术。(a) 传统照明技术和早期半导体照明技术面临的问题;(b)具有矩形均匀照度分布的非成像光学自由曲面设计;(c)成果应用于深圳高速公路和人民大会堂;(d)国家技术发明二等奖获奖证书

    4.高能效动态可重构计算及其系统芯片关键技术
    率先突破了低存储与低通信代价的层次化配置策略、面向并行多任务的高效重构管理器、基于可调节双电压技术的低功耗可重构阵列设计、片上多级数据存储器缓存结构、支持阵列动态重构的可扩展配置信息结构,以及支持高效循环任务执行的二维可重构阵列架构等面向计算密集型应用的可重构处理器关键技术,围绕高能量效率和高灵活性两大类技术难题,成功研制了可重构运算单元阵列IP核-RPU(Reconfigurable Processing Unit)、高性能可重构处理器SoC -REMUS_HPP等多款芯片。相关成果获2015年国家技术发明二等奖。


 RPU架构(左),RPU IP核验证芯片CHAMELEON架构(中)和管芯照片(右)TSMC 65nm LP1P8M工艺流片,规模为540万门(注:存储器已经被折算成标准门),面积是16.7mm2,正常工作频率为200MHz


RPU IP核验证芯片的验证演示电路结构(左)和实物演示图 (右)

(注:该验证演示电路由8块RPU芯片和2块超大容量FPGA组成)

REMUS_HPP架构(左)、RHINOCEROS架构(中)、RHINOCEROS管芯照片 (右)(TSMC 65nm工艺,REMUS_HPP面积为48.9mm2。将REMUS_HPP集成进一款高清机顶盒样机SoC芯片RHINOCEROS,并通过TSMC 65nm LP1P8M工艺流片。RHINOCEROS的硅片面积是9.28×9.28mm2。)

    5.面向深度学习的Thinker系列人工智能芯片
    面对移动计算设备对人工智能应用的迫切需求及对功耗的苛刻限制,研究和设计了可重构混合神经网络计算芯片-Thinker。该芯片针对神经网络容错性高、计算密度波动大、访存模式复杂等特点,提出了自适应多位宽计算、按需资源划分和片上数据复用等高能效技术。Thinker采用TSMC 65nm LP工艺流片,芯片面积4.4mm×4.4mm,在0.7V~1.1V的电压供电下,功耗仅为4mW到447mW,能量效率高达1.06TOPS/W~5.09TOPS/W。

    面向通用神经网络计算、采用异构PE架构、支持CNN/FCN/RNN,及混合神经网络Thinker-I 深度学习芯片

Thinker-I 深度学习芯片

    面向极低功耗神经网络计算、采用负载感知的调度技术、支持低位宽量化与资源复用技术的Thinker-II 深度学习芯片

Thinker-II 深度学习芯片

    面向极低功耗语音应用技术、支持Always on 实时处理技术、支持语音识别和声纹识别技术的Thinker – S 深度学习芯片

Thinker-S 深度学习芯片

    6.面向通用计算的可重构芯片
    面向通用计算领域,为满足加州大学伯克利分校提出的13类通用计算应用特征需求,攻克针对控制密集型应用的可重构阵列优化、多目标优化的可重构片上网络设计,以及基于优先级和负荷的硬件多线程派发和调度等关键技术,研发了一款可重构通用芯片-HReA,基于TSMC 65nm工艺设计流片,芯片规模1890万门,硅片面积4.83×3.93mm2。与ARM公司高端处理器Cortex A15相比,该芯片功耗降低22.1倍,能效提升16.2倍。


通用可重构计算芯片-HReA

    7.桥梁结构监测无线传感网
    基于电路、传感器以及软件系统等方面发明专利51项、软件著作权7项,研发了权威机构认证的23种无线传感器产品,节点时间同步技术达到了10?s级,发明了基于深度神经网络和桥梁结构力学参数统计分析的无结构模型的健康评估方法和渐进式在线程序更新技术,研发了桥梁监测云服务平台软件,建成世界上第一座大型和特大型桥梁的长期监测无线传感网系统,应用于特大型桥梁长期桥梁监测、大型桥梁国检、千余座桥梁日常巡检、“一带一路”项目和福州地铁监测,并已经推广应用到隧道、边坡、水电大坝、古建筑。获2016年度“中国公路学会科学技术一等奖”。以该技术为基础,本研究部于2013年10月成功创建了源清慧虹信息科技有限公司。


2012年建成的蓉湖大桥健康监测无线传感网

    8.神经网络加速系统及软硬件协同设计技术
    2015年在嵌入式FPGA平台上实现卷积神经网络,引入低比特和网络压缩技术,系统能量效率超越英伟达GPU平台,该成果发表于2016年FPGA会议,谷歌引用超过200次;在KU060 FPGA上实现了稀疏化语音识别引擎,相较于同级别的英伟达GPU处理速度快3倍,能效比高11.5倍,该成果获得FPGA 2017最佳论文,并已成功在Amazon AWS云实现部署。曾获2017年度“中国计算机学会科学技术奖技术发明一等奖”,中关村高聚工程-创新领军人才等。基于以上技术基础,本研究部于2016年3月成功创建了深鉴科技有限公司,2017年获得三星、赛灵思领投的A+轮4000万美元融资,估值超过1.5亿美元,成为国际领先的深度学习处理器及解决方案供应商。

    9.3D成像系统
    在三维信息研究领域,提出了一种视差与估计置信渐进迭代理论的高精度全局立体匹配算法,在美国自然科学基金委、微软研究院、Middlebury大学等权威机构设立的双目立体匹配算法评测中排名第一(截止研究成果文章发表)。在姿态估计问题上,提出了区域集成神经网络的方法,在ICCV 2017的手部姿态估计挑战赛上三项任务分别取得了第2、3、4名的成绩,在国内该领域研究中排名第一。将成果应用到液体食品在线质量检测中,相关产品已应用于可口可乐、统一企业、雀巢和达能等各大国内外企业,并已出口到日本、菲律宾等国家,目前共推广应用了两百余台套,累计为用户创造经济效益约3.2亿元。研究成果发表SCI文章46篇,EI文章77篇,发明专利公开近30项,发明专利授权19项,实用新型专利授权5项,于2014年获中国人工智能学会“吴文俊”科技进步一等奖、山东省科技进步二等奖。