【自制AI芯片】从零开始,我们自制了一款超级省电的人工智能芯片

作者: 边缘感知芯片实验室分类: 计算机技术 发布时间: 2022-07-10 16:27:05 浏览:197549 次

【自制AI芯片】从零开始,我们自制了一款超级省电的人工智能芯片

zepan:
不错的作品~不过有些疑问, 65nm高压制程(虽然已经选用了65nm里最低的1.2V核心电压),动态功耗是远大于28nm的,是如何做到70mw功耗的呢? 视频里可以看到有专用的NPU_CLK外部直接灌入,相当于省了一个PLL的功耗,但是SDIO也会引入IO功耗开销 1.6M gate相当于400K Lut,理论上全赛乘法器可以达到0.2T的算力,但也很极限了;而且ASIC里面sram也占用门数,乘法器和sram这两个大户摊1.6M门和这个面积,感觉有点难?内部有多大的SRAM呢?这个面积下似乎全放SRAM可能就1MiB的样子? 以及你们适配的前端推理框架是哪款呢?

【回复】非常感谢大佬提问,细节很多,我们挑一些重点回答: 1.功耗低是由于优化的算法+粗粒度高效计算模块,典型计算帧率180Hz,70mW是平均功耗; 2. 1.6M gate不包括SRAM块,内部SRAM共994KB; 3.我们实现了专用编译器,适配前端推理框架Pytorh、Mxnet; 4.常用轻量化操作Dwconv和Pwconv有专用加速单元,具体计算单元采用优化后的分块im2col和MAC乘加阵列,存储消耗很小; 5.K210是基于SoC设计,它包含双核RISC-V 64位处理器,而TinyNPU只是AI加速器,两者区别很大; 6.我们说FPS小于10具体不是指的K210,只是指出了现在边缘侧AI设备的痛点之一。
【回复】仔细看了下视频,版图里左右两边都是SRAM,刚好占了一半。但是还看到了草稿上的架构图里有im2col控制器,这个一般是常规dsp里才需要操作,会导致存储空间膨胀很多倍,IO延迟开销也很大,对于ASIC来说不是一个好的设计吧? 以及最前面的210的展示,<10fps是错误的用法,实际上不优化的情况下qvga下可以有30fps,优化的情况下可以超过100fps
庄小民:
焊接会产生有毒气体. 请务必通风设备完善情况下合规实施. 国家栋梁们请重视. 内容棒棒的[微笑]

【回复】吸了好多年有铅焊锡的烟,我们已经不在乎了[妙啊]
【回复】回复 @海豹猫与海盗狗 :有时甚至会觉得这烟的味道还挺好闻[doge]
【回复】回复 @海豹猫与海盗狗 : 尽量换无铅吧,铅元素易溶于脂肪,松香烟里一大堆,我都不敢用
酒酒酒酒酒酒酒啊:
太厉害了,这是哪个实验室哇,我也要来读博[星星眼]

【回复】西安电子科技大学微电子学院 赖睿老师 欢迎报考![打call]
【回复】回复 @边缘感知芯片实验室 :希望以后可以蹭师兄成果~~~哈哈哈
【回复】申你们这的博士需要多少篇论文[抱拳][抱拳][抱拳],等我两年
qecxnk:
首先祝贺几位同学成功点亮芯片,我是在早上别人推送给我看的这个视频,但也希望各位同学戒骄戒躁,讲真,我觉得毫无创新点,假如视频简介已经披露全部设计亮点,只能说可能这个芯片连一般档次的期刊都发不出去,看同学的介绍是西安的高校,实际上几年前西交和西工大都做过类似的AI芯片。 另外,我建议不要动不动就放卫星,吹嘘“能效最高”。68.4% ImageNet Top-1 Acc.估计是量化到INT4了吧。 你在市面上看不到这样低能耗的芯片,是因为算力如此低的芯片没啥市场,全志的V853能效比你这个高得多,也不见得好卖。

【回复】哥们,希望你可以做一个有创新点的,能发期刊的,推动行业进步的作品出来,然后发出来成果给大家。否则我感觉你很酸。 首先,视频第一句话就说了,项目需求是超低功耗的AI芯片,何时提及了“能效很高”,或者“需求精度很高”; 第二,这是实验室成果,满足了实验室“超低功耗”&“AI芯片”两需求。确实可能“如此低算力”的芯片没什么市场,但是它满足了实验室的需求,纵观全片,我没有看到作者提及需要上市,需要“好卖”,以己度人,如此低廉; 第三,我看到的是几个年轻人一腔热情,做自己喜爱的事情,并且成功完成。相信大家能看出他们的努力和热情,并且客观来说,他们的成果已经超出了绝大多数同龄人。我很佩服,并深受激励; 第四,我从中高校的学到了一块芯片从无到有的核心环节,如此简洁大方的,如此活泼可爱。对于一个普通人,把芯片设计流程生动的展示给观众,并引人入胜,确实很成功。 希望大家多一丝包容,多一些认可。这样的视频再给我来一框,我每个都要三连[脱单doge]
【回复】您好,首先谢谢关注到我们的工作,针对您对我们工作的质疑,我们已经将相关论文在评论区置顶。 我们致力于打造功耗极低、AI算法精度较高的人工智能加速芯片,从测试效果来看,我们的成果已经达到了这一点。 我们是西安电子科技大学的实验室,本身定位就是研究型的实验室。第一版的TinyNPU芯片本就是实验室测试版本,正在研发下一版本,以后会考虑商用价值。目前已经有多家单位有意向合作。 最后感谢您的提醒,我们会继续努力,感谢您的关注。
【回复】回复 @边缘感知芯片实验室 : 其实有人质疑也不算是件坏事情,但是千万不要让别人的质疑打消了你们研发的兴趣,希望你们能在质疑声中越走越远
LCL李同学:
什么时候国内能随意芯片打样就好了,就像pcb打样一样

【回复】这玩意成本巨高[笑哭]而且使用者并不多,除非能工业大量运用,但是工业大量运用就量产了,市场上也能买到了[笑哭]
【回复】谷哥有个免费的计划,但是需要将自己的设计开源
Altium中国:
每次看到这样的年轻人就非常地感动,视频做得好有趣又好燃啊[热词系列_爱了爱了] 注意到视频里的小哥哥用的还是AD18~强烈建议用起来AD21以上版本呀,性能顺滑又上云,团队协同功能超给力啊~百万元器件库免费调用,库管理和版本管理安全又有序。 学生许可证永久免费~也可以私信我获取呢~[给心心]希望看到更多赖睿老师团队的优秀作品!

【回复】回复 @勤勤三三 :培养用户习惯后等工作再宰一刀呗,永久免费可以试试国内的几家EDA工具,简单的板子用起来差不太多
【回复】回复 @Altium中国 :只要我一直复读,就能一直白嫖[生气][生气]
AxGuan:
不能以期刊发表为导向,而应以实际应用为目标,真正做到把科研做在祖国的大地上。 期刊上的设计,动辄几TOPS,动辄几个微瓦,在实际应用场景中真的Work?大概只能卷MNIST?

花了六硬币改名的chiri:
你们团队成员头发都挺多的啊,看来还有很大的进步空间[doge]

哔哩哔哩动画网站:
真怀念啊,之前在大学也是做了一个仿stc51的芯片设计,项目断断续续搞了快一年,模电部分和数模混仿是我做的,仿真教程根本没人教,都是自己看文档,翻英文论坛一点一点摸索出来的,还有那个keil驱动也要我写,匆匆忙忙学了半个小时mfc。那个caliber和ultrasim modelsim也是真恶心,全英文的,一开始什么都看不懂 但后来也渐渐接受了。记得当时最得意的是那个高精度adc是自己凭借老师给的一份外泄残缺资料硬搓出来的[抠鼻]

vanished_fish:
学校做这种产品确实是不错的思路啊,做AI系统集成的公司没有设计芯片的能力,做芯片的公司嫌肉太少了还要先研究专门的AI就懒得做,学校来做这类东西不仅满足了市场需求,自己也可以赚一些钱,而且做前置研究的时候也有优势,还可以积累技术经验和灵感。

【回复】宝马ix3电芯,单体电芯116A,改72v116a,电摩能跑200公里,没有续航焦虑
阿霖emm:
着火,笑不活了[doge]自从那次通电冒烟着火,我就买了个透明罩子[歪嘴][歪嘴]

【回复】回复 @机智的猫君 :孩子炸习惯了,有一次第一天炸完555第二天接着358冒烟[辣眼睛]
【回复】回复 @Catalogue :热成像嘎嘎贵[doge]
【回复】第一次上电必开热成像,看到颜色不对立马断电[笑哭]
米卡吉:
看标题:现在连芯片相关都能蹭流量了? 看完:给大佬磕一个[跪了]

奈奈酱aww:
纯小白,不懂就问。 40W是造一块芯片的成本吗,也太贵了吧?[tv_流汗]

【回复】四十万主要是开模,做芯片配套的胶片之类(可以理解成注塑,耗材不贵但是模具贵)做一套成本高,但可以反复使用,其实机器开机和材料价格并不那么夸张
【回复】开模40w,后续一片可能就几毛钱。
【回复】芯片不贵,几块钱一个,40万就相当于开模的钱
marcia77:
半夜看到这个视频,睡不着了。。。期待你们更多作品!记住你们的团队啦!西电赖睿老师!

原创 AI 科技 自制 电子 制作过程 半导体 芯片 深度学习 编程开发

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!