从AI热潮中率先获益的英伟达,其GPU参数和性能频繁出现在不少AI芯片发布会的对比图中。这是在缺乏AI芯片衡量的标准时,新的AI芯片证明自己实力的不错方式。不过,声称性能超越英伟达GPU的创新AI芯片不少,但想要超越英伟达非常困难。

因为,超越英伟达最核心的并不是更高的硬件参数和更低的价格,13年和160万这两个数字才是关键。

“短短半个小时,但凡任何一个环节出了差错,我都可能考不了试。在图书馆那里,我都准备放弃回去了。”小谢说,4个保安,其中图书馆保安和送她去教室的保安比她还着急,就在她与工地保安交涉期间,图书馆保安急匆匆跑过来问她,“你怎么还不过去?”

意外:开考在即,准考证却被浸湿

“考试前,为了防止出现意外,我打印了两张准考证以防万一,不知道是不是骑自行车时包放在车筐里,保温杯盖子被颠开了,水全部倒出来了。”小谢说,所有资料中最重要的是准考证,它已经被泡烂了。《考生须知》第一条,准考证使用A纸打印,正反面均不得涂改或者书写。

但也并非没有可能,有一家初创公司的思路是在软件层面完美兼容CUDA,通过提供性价比更高的硬件,能够替代英伟达GPU。但由于CUDA并非完全开放,且在持续迭代,要完美兼容CUDA面临挑战,能否在兼容的同时完成新生态的建设影响成败。

“如果没有这个四个保安叔叔,我一年半的考研准备就要浪费掉了。”考生小谢说,“我是多幸运才能遇到你们,谢谢。”

至于未来是否会进一步开放甚至开源CUDA,Greg Estes告诉雷锋网,现在整个开发者社区做出了各种贡献,CUDA周边也有很多开源软件和代码,对于CUDA的进一步开放英伟达并不反对。

2016年,英伟达投入数十亿美元动用数千工程师打造的第一个专为深度学习优化的Pascal GPU推出。2017年,又推出了性能比Pascal提升5倍的Volta架构,神经网络推理加速器TensorRT 3也同时亮相。

“换谁都会这么做,不过是举手之劳。”刘德说,早上8点多,那个考研女生求助,他递给她一顶安全帽,开了门,待她步行几十米后,他又把她叫了回来。

他同时指出,进入到新的领域,营销可能需要更多的支出。但英伟达使用的是统一的平台,进入新领域的时候并不需要像其它公司一样开发新的架构和软件,不会大幅增加研发成本。比如开发自动驾驶的软件和开发机器人的软件差别没那么大,它们都有感知环境、设定路径、模拟周围物体移动的相同之处。

保安:“举手之劳,换谁都会这样做的”

不过,相比硬件的加速,软件带来的提升更加显著。黄仁勋称,在不改变硬件的前提下,通过软件和库的完善,过去2年英伟达将计算性能提升4倍,AI推理性能可以提升2倍,所需的开发时间也可以几周缩短为几天,从几天缩短为几小时。

会话式AI涉及语音识别和转化为文字、理解文字、再转化为文字用语音反馈三个部分,此前的TensorRT版本能完成理解的部分,TensorRT7可以完成三个流程,并且是在300毫秒内。

为了中国开发者,DLI将很多课程转换为中文,还在中国新开了10个基础的DLI课程。

2018年,黄仁勋口中自2006年CUDA GPU发明以来最大的飞跃图灵(Turing)架构发布,这一新架构承载了RT核心(RT Core)以及全新张量核心(Tensor Core),RT Core使全球首款光线追踪GPU成为可能,Tensor Core能实现高性能的深度学习训练和推理。

“准考证烂掉了,我担心进不了考场。”小谢说,祸不单行,手机也不知是何缘故,无法拨打电话,她向外求助无门。

即便是新推出的硬件平台Orin,也十分强调其软件定义特性,尽可能延长硬件的生命周期以及发挥软件的优势。

为了让英伟达拓展新的市场领域,多年来黄仁勋一直都会事先做好风险预估工作。十多年前,黄仁勋下了一次关键性的赌注,押注一系列的改动和软件开发,让GPU能够处理图像以外更为复杂的任务。

“我当时上早班,走不开,打电话给我同事,让我同事骑电瓶车送她过去,会快得多。”刘德说,工地后面到底有无打印店,他不清楚,不过,他有个电瓶车,让同事骑上电瓶车带着她去,或许会快点,他给同事阳隆兵打了电话。

此举给英伟达带来了不小的成本压力。黄仁勋估计,名为CUDA(Compute Unified Device Architecture,统一计算架构)的项目每年需要花费5亿美元,当时英伟达的总营收约为30亿美元。

英伟达承诺第8代图灵架构GPU模拟物理世界的能力将比Pascal架构提升6倍,实时光线追踪能力比Pascal架构提升25倍。

不久后,英伟达对其芯片作出改动,开发出软件辅助工具,包括支持标准的编程语言,而非用于向图形芯片发出指令的神秘工具。在Ian Buck的率领下,2006年CUDA正式推出,这是全球首款GPU的通用计算解决方案。

上午8点,她抵达到考点成都大学综合楼楼下,把手提挎包打开一看,糟了,保温杯的盖子开了,准考证、学生证、身份证、考试资料全部浸湿了,无一幸免。

在这种吸引力下,特别是伴随深度学习的火热,英伟达的开发者生态日渐壮大,过去三、四年开发者数量增长尤为快速。2019年,全球已经有超过160万CUDA开发者。中国CUDA开发者数量最为众多,数量也增长最快,数量已经超过了30万,并且还在以每个月新增1万人的数量增长。仅今年,CUDA的下载次数就超过了500万次。

与之相伴的是CUDA的不断更新,今年初,全新的AI加速库CUDA X AI SDK正式发布,可以用于数据分析、机器学习、深度学习等多个领域的加速,更好地释放 Tensor Core GPU 的灵活性。如今,CUDA已经发布了500多个库。

“他指路后,比我还着急,让我跑快点。”小谢说,工地距离图书馆不过几十米,她把来意跟工地保安一说,对方递给了她一个安全帽,戴上安全帽后,她过了闸门往里冲,快要进入施工区,被叫了回来。

同样关键的是,CUDA发布之后,英伟达所有新推出的GPU都支持CUDA。这就意味着只要研究人员、学生拥有搭载英伟达GPU的笔记本电脑或者台式机,就能在学校实验室和宿舍开发软件。再加上英伟达说服了许多大学开设课程,教学生用其最新的技术。

帖子同时@成都大学学生会等大V,网友“ANGE丽—佳佳丽”评论:“好心酸,回来抱抱”;网友“全年都在吃柠檬”说:“好温暖”。

或许太慌太紧张,小谢在电脑上调了三四遍格式,准考证才打印出来。其中一名保安骑上电瓶车,风驰电掣将她送到了教室楼下,此时已经8点28分。考点在三楼,顾不了许多,她往楼上冲,抵达教室,8点31分,成功赶上了考试。

还有半个小时就要开考了,当务之急是打印准考证,小谢立即向在考点巡逻的保安询问,保安给她拦了一辆校园“小白龙”(校园电动车),载着她往成大食堂、后门打印店跑去。时间尚早,逛了一圈,5个打印店全都没有开门。

此时,已经8点20分,距离开考还有10分钟。她路过成大图书馆,存着最后一丝希望,她向图书馆监控室保安打听,希望在这里找到一台打印机。保安跟她说,正在施工的工地背后有一家校外打印店,她可以让工地保安开门,从工地穿过去,抄近道前往或许可以来得及。

据悉,河钢集团和浦项钢铁均是具有全球竞争力、影响力的钢铁企业。其中,浦项钢铁是韩国最大的钢铁企业,在汽车板领域拥有世界领先的技术实力、营销体系和优质客户群。

“我们也将不断探索,开拓一些现在还没人愿意关注的市场。这需要勇气,也非常困难,但英伟达的基因让我们非常享受各种挑战。” Greg Estes如此解释构建更强大开发者生态的挑战。

CUDA工具包包括了GPU加速库、编译器、开发工具。为了便于使用,英伟达让使用CUDA的开发人员可以使用熟悉的C、C ++、Fortran、Python、MATLAB等流行语言设计程序,以几个基本关键字的形式通过扩展表达并行性,就能用GPU实现加速计算。

还有一家公司走的是定制化和本地服务的路线,通过与有强AI需求的公司合作,提供性价比更高的定制化解决方案,同时提供更加本地化的服务,以期获得一些市场份额。

英伟达与华大基因合作,使用 CUDA 进行全基因组测序

随着CUDA的迭代,CUDA团队开发了石油、天然气和国防等相关产业所使用的科学计算方面的库。开发者们也逐渐把GPU应用于气候建模、勘探石油和天然气等很多领域。

12月22日12点11分,一名网友发微博,点名表扬成都大学的保安。帖子称:“我是一名四川考研儿,点名表扬成都大学的保安叔叔们,谢谢你们的最后两分钟,让我一年的努力准备没有白费。”

这两种方法都有成功的机会,但实际应用和发展的过程中每一步都充满挑战且非常关键。

这是否会改变市场格局?雷锋网雷锋网(公众号:雷锋网)

13年前就“注定”成为AI明星

当然,为了让新注册的开发者更快上手CUDA,除了提供文档,英伟达深度学习学院(DLI)也提供实战培训,帮助开发者了解如何开发、应用甚至部署。还有英伟达的校园大使项目,目前以及与国内23个高校合作,让高校老师能开设DLI课程,补充理论课程。

“工地保安说,他叫了同事用电瓶车送我过去,会更快。”小谢说,保安同事说,在工地项目部可以打印资料,两名保安陪着她去了项目部资料室。

还有一点不容忽视的是,GTC China 2019上英伟达展示了GPU相比CPU在云端AI推理中的成本以及性能优势,即便黄仁勋表示这并不是要用GPU替代CPU,但在云端训练市场需求放缓,推理市场迅速增长的背景下,英伟达和英特尔将在云端AI推理市场激烈的竞争难以避免。

更多的开发者让CUDA软件堆栈不断完善,也让英伟达可开发不同的全套解决方案应用到各个垂直行业,这也是英伟达成功的关键。要探索更多的领域,英伟达需要进一步开放CUDA,在支持x86的基础上,英伟达今年6月宣布将在年底前向Arm生态系统提供全堆栈的AI和HPC软件。

这才有了大家都熟悉的2012年Alex Krizhevsky用英伟达GPU运行AlexNet卷积神经网络算法在2012年ImageNet竞赛中获得第一,图像识别的错误率大大降低。

“我突然想到,项目部资料室就可以打印,而8点项目部就已经上班了。”阳隆兵说,他和刘德陪着女生去项目部资料室,资料室工作人员与保安相熟,二话不说打开了电脑,让女生自己打印。拿上准考证,阳隆兵骑上电瓶车,带上女生往考场赶。

小谢前来求助,图书馆消防治安监控室保安林兴洪正站在门口透气,“一个女娃娃,戴着一个眼镜,多造孽的,拿着一张打湿的准考证 ,让我给她打印一份,马上要考试了。”林兴洪说,这里没有打印机,最近的打印店在图书馆对面,穿过正在施工的工地,是最近的道。

英伟达开发者计划副总裁Greg Estes说,“之所以英伟达在AI时代比其它公司跑的更快一些,主要的原因是十多年前做出的战略性决定——将CUDA开放给各个行业。任何一个英伟达GPU都可以使用相同的软件堆栈。”

当日下午,红星新闻记者在成都大学考点见到了这名发微博的网友——考生小谢,她是四川音乐学院的大四学生,考完最后一科,她一脸轻松,自我感觉考得不错。

在成都大学大运村项目岗亭,记者见到了小谢口中的工地保安刘德,说起此事,他摆摆手表示不值得一提。

小谢绝望了,她在成大第五食堂下了车,步行回考点,回去的这两三百米,是她最绝望的时刻。她的目标是中国地质大学,为了这个目标,她已经准备了一年半,前一天考的政治和英语这两科,发挥都还不错。越想越绝望,她哭了,想要放弃。

目前,河钢集团已经成为中国第二大汽车用钢供应商,2018年汽车用钢产量超过了700万吨,冷轧及涂镀汽车板产品涵盖十大系列100多个牌号,实现从结构钢、零部件用钢、冷轧到涂镀板钢种的全系列覆盖,具备了汽车整车用钢的供货能力。

所有GPU,从云端到终端不同的硬件平台,都支持统一的CUDA软件平台,让英伟上百万的开发者可以基于GPU在各个领域进行计算加速。这促进了CUDA软件堆栈的完善,也让英伟达能够针对不同的领域推出完整的解决方案。

另外,英伟达还用迁移学习、联邦学习等方式帮助开发者更快地将AI技术应用于自动驾驶、医疗等行业。

新“核弹”来了,英伟达推出7倍算力自动驾驶芯片,与BAT滴滴一起强调量产 | GTC 2019

阳隆兵说,女生坐在后座,心里依然是慌的,“她不停地说,准备一年多了,我安慰她,不用担心,很快的,一两分钟就到。”把女生送到楼下,开考铃声还没有响,他看着女生进入考场,才骑车离开。

由此,深度神经网络引发了第三次AI浪潮,英伟达也一步步成为了“AI明星”。

(原题为:《准考证被泡烂进不了考场,考研女生急得要命!四个保安伸援手》)

8点左右,校园巡逻中队值班队员张仕元在马路旁见到小谢,她一脸着急,从她口中得知,她准考证打湿了想找打印店。张仕元说,最近的打印店就在成大一食堂那里,“我就给她喊了个小白龙,喊她不要着急,一食堂离这里很近。”遗憾的是,附近的打印店都没有开门。

“如果没有这个四名保安叔叔,我肯定只有放弃回家了。”小谢说,她住的地方离考点约有半个小时车程,今早6点她起了床,为考试做准备。

1993年成立不久后,英伟达就面临激烈的显卡市场竞争,幸运的是,它从47家显卡生产商的竞争中胜出,并于1999年在美国上市。带领英伟达走向成功的关键人物之一就是其创始人兼CEO黄仁勋,人称黄教主。

这意味着,英伟达生态系统中的合作伙伴都能接触到一个巨大的市场,无论是做AI、游戏还是数据中心、边缘计算。

惊心:跑了几个打印店都没开门,保安伸援手

指了路,林兴洪依然不放心,站在门口看,果然,考研女生怵在岗亭门口没有动静,他跑了过去,协助女生跟工地保安交涉,请其通融,三言两语间,工地保安开了门。

这个重大的决策和CUDA成功背后,还有一个关键人物——现英伟达GPU 计算软件总经理的Ian Buck。他在加入英伟达之前就通过实验证实GPU用于通用计算的潜力巨大,2004年进入英伟达实习后,Ian Buck开始聚集相关的硬件和软件工程师创建GPGPU模型。

据悉,双方自2017年建立全面合作伙伴关系以来,在战略企划、原料资源、钢铁技术、能源环境四个方面建立了常态化的交流机制。今年上半年开始,双方围绕汽车板项目合作开展了多层次的技术和商务交流,达成了在资本层面开展合作的意向。下一步,根据双方签署的谅解备忘录框架,发挥各自在技术、资源等方面的优势,以合资公司为载体,加强业务协同,共同进入高档汽车板市场。(完)

雷锋网原创文章,。详情见转载须知。

这是英伟达在AI时代率先被广泛应用的重要原因,也是其在未来竞争中核心竞争力。26年的硬件能力积累,13年前开始的统一平台软件布局,160万的开发者生态,不断探索新领域的商业模式,这样的一个系统公司怎么看都难以超越。

阳隆兵上完夜班,正在工地宿舍睡觉。接了电话,他穿上鞋跑了过来,前后不到一分钟。

AI的光环下,英伟达的股价比GPU性能的提升更加迅速,2016年每股30美元左右, 到2018年最高涨至每股280美元,创下历史新高。

小谢说,图书馆保安一直陪着她,看她打印好准考证骑上电瓶车才离开。“在电瓶车上,送我去教室的保安安慰我说,他会骑快点,尽快把我送过去。”小谢说,自己是有多么幸运,才会遇到他们。