上海通用sail

2021世界人工智能大会将于7月8日至10日在上海举行。作为世界人工智能大会的最高荣誉，赛欧奖一直秉承“追求卓越、引领未来”的理念和“高端化、国际化、专业化、市场化、智能化”的原则，从全球视角发掘人工智能领域具有较高认可度和美誉度、具有提升人类福祉意义的项目，鼓励正在技术上取得方向性突破和应用创新、正在改变未来生活的人工智能项目。

赛欧奖设置大奖，形成年度榜单。即日起，我们将继续对2021赛欧奖30强名单中的入选项目进行系列专题报道，以飨读者。

今天的主题是AI芯片。

以下项目按项目单位笔画顺序排列。

云7 nm GPGPU芯片产品BI

上海田甜智芯半导体有限公司

上海石天智芯半导体有限公司(简称“石天智芯”)于2018年正式启动GPGPU芯片设计，是国内首家GPGPU高端芯片和超级计算能力提供商公司以“成为智能社会的使能者”为使命，专注于云服务器层面的通用高性能计算芯片，瞄准以云计算、人工智能、数字化转型为代表的数据驱动技术市场，解决核心计算能力的瓶颈问题。着力打造自主可控、世界一流的通用、标准、高性能云计算GPGPU大芯片，从芯片端解决计算能力问题；它还推出了面向5G应用的基于云的推理芯片，该芯片与进口主流GPGPU生态兼容，并提供本地化选项，旨在将超级计算发展成为类似水电和煤炭的基础设施，并帮助各行业以更可信、高效和经济的方式升级计算能力。

公司发布的云7纳米芯片产品BI，实现了国产高性能GPGPU历史上从0到1的突破。采用自主研发的核心知识产权，极其先进的7 nm工艺和2.5D CoWoS封装工艺，性能卓越。没有专门的图形渲染模块，更加灵活可编程，突出通用计算功能，优化人工智能的训练和推理。BI芯片即将进入量产和商用交付，产品研发和商用进度领先国内同行1-2年。

寒武纪思源290智能芯片、加速卡、玄思1000智能加速器

上海寒武纪信息技术有限公司。

云智能芯片具有卓越的性能和能效，可以覆盖视觉处理、语音处理、自然语言处理、推荐系统、搜索引擎和传统机器学习。寒武纪是全球少数全面掌握智能芯片及其基础系统软件研发和产品化核心技术的企业，能够提供云边缘集成、软硬件协同、训练推理一体化、统一生态的系列智能芯片产品和平台化基础系统软件。本项目在寒武纪研发了一款高速低能耗的智能芯片，以满足智能处理对智能计算能力和能耗的需求。

寒武纪思源290智能芯片、加速卡、玄思1000智能加速器于2021年1月21日量产后首次正式亮相。思源290智能芯片是寒武纪第一款训练芯片。采用台积电7nm先进工艺技术，集成460亿个晶体管，采用MLUv02扩展架构，全面支持AI训练、推理或混合人工智能计算加速任务。该芯片拥有多项关键技术创新，MLU-Link多核互联技术，提供高带宽多链路互联解决方案；HBM2内存提供AI训练所需的高内存带宽；VMLU帮助客户实现云虚拟化和容器级的资源隔离和热迁移。与思源270芯片相比，思源290芯片的峰值计算能力提升了4倍，内存带宽提升了12倍，芯片间通信带宽提升了19倍。结合新架构和7nm工艺，思源290可以提供更好的性能功耗比和多MLU系统的可扩展性。寒武纪MLU290-M5智能加速卡搭载思源290智能芯片，采用开放式加速模块OAM设计，搭载64 MLU核，1.23TB/s内存带宽，全新MLU-Link多核互联技术，在最大350W散热功耗下，提供高达1024 TOPS(INT4)的AI计算能力。

寒武纪玄思1000智能加速器，将4颗思源290智能芯片、高速本地闪存和Mellanox InfiniBand网络集成在一个2U机箱内，对外提供高速MLU-Link接口，打破传统智能芯片、服务器、POD、集群的水平扩展架构，实现AI计算能力在计算中心层面的垂直扩展。它是一个高度集成的人工智能计算能力平台。寒武纪训练产品线采用自适应精准训练方案，为互联网、金融、交通、能源、电力、制造等领域复杂的AI应用场景提供充足的计算能力，推动人工智能赋能产业升级。

基于GPGPU软件定义的片内异构通用人工智能加速器—Goldwasser基于GPGPU软件定义的片上异构通用人工智能加速器——Goldwasser

上海登林科技有限公司

Goldwasser是一款面向GPGPU的高性能通用人工智能加速器，目前已在国内量产，成功填补了国内高性能GPGPU在商业、技术和产品上的空白。Goldwasser采用完全自主创新的架构(基于Minsky软件定义的GPGPU的片上异构计算架构)，解决了通用性和高效性的双重问题。Goldwasser的硬件可以直接支持CUDA/OpenCL加速，通过片内高带宽低延迟内存子系统技术结合任务级并行技术实现高性能低功耗。与国际主流云推断卡相比，该芯片能效提高3倍，准确度更高。Goldwasser已于2020年底完成台积电12nm工艺上的流光，并实现量产。基于成熟的12nm/14nm工艺实现的量产，Goldwasser具有很强的自主可控性。

基于GPGPU的创新型软件定义片上异构架构系统已在国内外申请多项核心专利，部分已获授权。可以在通用性、兼容性(兼容现有软件生态)、能效等方面对比国际主流云加速器的产品。它不仅打破了国外产品对国内市场的垄断，而且使登船技术的国际化成为可能。

亮点:

A.它采用完全自主创新的架构(基于Minsky软件定义的GPGPU的片上异构计算架构)，解决了通用性和高效性的双重问题。

b、可实现高性能低功耗，比国际主流云推理卡高3倍。

C.硬件支持CUDA/OpenCl加速，无缝接入现有软件生态系统。

d自主研发，并在成熟的12nm/14nm工艺上实现量产。

E.国内外申请了多项核心架构专利，部分已获授权。

面向通用人工智能的类脑计算猫芯片

清华大学

该项目将面向计算机科学的机器学习和面向脑科学的神经形态计算与brain like computing的学术思想相融合，开发出具有相应架构的天体芯片以支持通用人工智能的发展，并演示了基于天体运动的无人智能自行车平台。天体运动与平台相关成果作为封面论文发表在《自然》杂志上，入选2019年两院院士评选的中国十大科技进展、中国十大科学进展和15项世界领先科技成果。还孵化了北京灵犀科技有限公司，推动类脑计算技术的产业转型，目前已实现芯片量产。

类脑计算(Brain like computing)通过借鉴脑科学原理开发的通用人工智能，是国际半导体协会认可的后摩尔时代两大新技术(另一个是量子计算)之一，是“脑科学与类脑研究”(中国脑计划)的主要研究内容，但其主要挑战是缺乏系统的理论框架和高效的计算芯片与平台。因此，本项目将面向计算机科学的机器学习和面向脑科学的神经形态计算与类脑计算的学术思想相结合，实现优势互补，支持通用人工智能的发展。并且开发了芯片相应的架构，内部数据访问带宽高达600 GB/s；提出了类脑计算与环境交互迭代发展的思想。基于天体运动搭建了无人智能自行车平台，展示了实时视听探测识别、目标跟踪、避障、平衡控制、低功耗自主决策等功能。天体运动与平台的相关成果以封面论文的形式发表在《自然》杂志上，实现了中国在人工智能和芯片领域的突破。被《自然》主编Magdalena Skipper评价为人工智能领域的重要里程碑，并入选2019年中国十大科技成果、中国十大科学成果和15项国际领先科技成果。该项目孵化了国家级高新技术企业——北京灵犀科技有限公司，推动该领域的产业转型，并已完成该片12nm量产，开发了相应的系统平台和软件工具链。整体计算能效比领先同类芯片。

高性能数据流AI芯片CAISA高性能数据流人工智能芯片CAISA

深圳市坤云信息技术有限公司

高性能数据流AI芯片CAISA是鲲云科技基于30多年人工智能定制数据流领域的技术积累，自主研发的AI芯片产品，在全球率先实现数据流AI技术的量产和商用。CAISA基于自研定制数据流架构，不同于冯诺依曼的传统指令集架构。它通过控制数据的流动顺序来管理计算的执行顺序，大大提高了芯片的利用效率，实现了真正计算能力的技术突破。芯片利用率最高可达95.4%，比同类产品高出11.6倍。同时，CAISA依托易用的RainBuilder编译器工具链，实现对主流框架和算法的通用支持，为客户提供最佳性价比。CAISA芯片作为数据流AI芯片，通过底层架构的创新，实现了真实计算能力的突破，为AI芯片的发展和AI产业的发展探索了一条新的道路。

CAISA芯片基于自研定制数据流架构，提出了一种新的AI计算平台的架构实现方法——不同于传统计算平台所依赖的指令集架构，没有指令依赖性，解决了冯诺依曼系统面临的指令墙问题。CAISA架构依靠数据流的流动顺序来控制计算的执行顺序，将数据计算和数据流重叠，压缩计算资源的每一个空空闲时钟；通过计算能力资源的动态平衡，消除流水线的性能瓶颈；通过数据流的time 空映射，最大化复用芯片内的数据流带宽，降低对外部存储带宽的需求。通过这些技术创新，芯片利用效率大大提高。基于数据流技术，CNN算法的计算数据可以在CAISA芯片架构内持续计算，芯片利用率最高可达95.4%。在同样的峰值计算能力下，同类GPU产品的实际计算能力可以达到3倍以上，为用户提供更高的计算能力和性价比。

基于自研定制数据流架构，CAISA实现了芯片利用率的技术突破，打破了计算能力提升对芯片制造工艺的高度依赖，为行业客户提供了更具性价比的芯片产品选择。目前，坤云科技基于CAISA发布了多款数据流AI计算平台，包括Star 空加速卡X3、Star 空边缘站X6A、Star 空加速卡X9，满足AI计算在边缘、高性能场景的加速需求，应用于智能安全监管、智能油田、智能制造、智能制造。

作为全球首款商用的数据流AI芯片，CAISA完成了与腾飞、麒麟操作系统、浪潮等众创服务商的产品兼容，在计算能力性价比、芯片利用率、实测性能、处理时延等方面实现了行业领先，为底层AI计算能力支撑提供了新的选择，填补了国内数据流AI推理芯片领域的技术空白，并荣获高交会优秀产品奖、世界计算机大会创新技术与产品应用奖等等。

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。