全网最小的Yolov5实现,364Kb纯C
shenck:
虽然自己写轮子很赞,我也自己写过类似的轮子(cnn推理+训练;c++)
不过楼主说ncnn表现很差我感觉很奇怪,
yv5这种经典模型ncnn肯定hold住的,而且你说ncnn需要>2s,这个速度慢的离谱了
你自己写的纯c说可以有gcc就移植,我大胆猜测一下没用SSE+AVX或NEON或CUDA优化,也没用各平台的NPU
跑同一个yv5结果只需要50多ms!?
可以说你的框架比鹅厂框架快40倍
但据我所了解,ncnn、mnn这种是高强度手打汇编+指令流水线优化+针对算子优化+针对cpu优化过的框架,我觉得这里面很怪
可以参考:https://github.com/cmdbug/YOLOv5_NCNN
我看过你的背影:
以为是教你怎么实现,原来只是告诉你我有
萌新污贼托马斯:
ESP32芯片架构不是ARM的,这个很可惜,不过这样树莓派的pico一下子就觉得自己行了。如果这个打算继续在边缘计算发展的话ARM和riscv这两个大方向随大流就完事了,其他的真的是一些可远观不要亵玩的存在
3050311118:
加油,楼主,我觉得现在已经超越了大厂同类推理框架了
AD1024:
既然用yolo了 要不要试一试看yolo作者的darknet[doge]
3050311118:
试试esp32s3,专门搞aiot。esp32也可以外挂spiram
过客3944:
牛,我一直在找寻纯c的yolo,我是做芯片设计的,对系统不是很熟悉,软件只能做纯裸机应用这样,如果有纯c的yolo,我就可以把底层的一些计算硬件化,例如卷积,池化等,这样就可以大大加速推理速度。
异次元猫猫:
卧槽nb,想问下输入分辨率是多少[嗑瓜子]
UC11779470:
投币支持开源,手残想搞gta5辅助驾驶,单机一直不过![捂眼][捂眼][捂眼]
写代码那些事儿:
你这个感觉算不上造轮子 你用的动态编译 程序肯定小 依赖的opencv库都40m了[吃瓜]
书文实验室:
巧了 我手里有二十多片m4核的低功耗蓝牙芯片[doge]