之前一直有听说 YOLO 非常牛逼,但一直没项目用到也就没特别关注过,最近有东西要做问了 AI 解决思路推荐用视觉大模型。立马 clone 了 YOLO V8 仓库,标注,训练,测试。感觉发现新大陆一样,真的好强大!可以说超出了认知范围,因为如果按没有大模型年代的思路想完成真的是个好庞大的工程。
1 ATKLLL 33 天前 主要是性能太强了 中端游戏显卡随便跑 |
3 ptstone 33 天前 可以同时识别车牌 道路标识 人脸的模糊吗,我需要做视频脱敏处理,还没开始做,网上推荐使用这个库,现在是 YOLO 11 比较好了 |
![]() | 4 sillydaddy 33 天前 能具体说下做的是什么嘛? |
![]() | 5 Myprajna 33 天前 而且配置要求很低,200 元的开发版都能跑。 |
![]() | 6 jackenliu 33 天前 每次出现 AI 都很强大,次次都强大,评分永远没比过 OpenAI |
![]() | 9 jiayouzl OP @sillydaddy 统计相关的一个项目。 |
![]() | 12 jiayouzl OP @ptstone YOLO v11 我没用过,我是看了下文章在 V5 和 V8 里选择了下,反正都能用,v12 也出了现在。并不是说 V 越高=越好,只是划分的领域更细点的区别。 |
![]() | 14 Belmode 33 天前 ![]() @jackenliu #6 YOLO 是传统 NLP 深度学习模型,和现在的 AI 大模型也不一样啊?而且 YOLO 也不是现在才流行,我都看不懂你这话里话外的意思。 |
![]() | 15 Belmode 33 天前 之前做过一个 YOLOV8 的 LOL 助手,效果确实不错。用英雄头像训练,可以记录小地图英雄最后丢失的位置和英雄丢失时间,防 gank 效果非常好。 |
17 PinkPumpkin 33 天前 ![]() yolo 不是大模型,是小模型,而且卖点就是又小又快 |
![]() | 18 Jakarta 33 天前 via Android ![]() yolo 跟大模型没啥关系,甚至是两个不同的 AI 方向,一个是视觉,一个是语言。 |
![]() | 19 gpt5 33 天前 ![]() 当人们提到“ai 应用”的时候,保守说,1/3 都用到了 yolo 。 |
20 srsman 33 天前 用 Hailo-8 跑 |
![]() | 22 listen2wind 33 天前 via Android ![]() 想问下 yolo 可以做比如建筑垃圾、河道垃圾、违章建筑之类的一些识别区分吗? |
23 capric 32 天前 ![]() @listen2wind 当然可以 |
25 nayenizhenmei 32 天前 via iPhone @jiayouzl 我硕士就是搞 cv ,用 yolo 的,一般来说,工程上用 v5v8v11 ,主要是其后面的 u 公司对 yolo 的工程化比较好,也不是说其他的系列不好,对于检测精度来说肯定是越来越高速度也越来越快,但工程化角度看集成度没那么好 |
![]() | 26 rrubick 32 天前 我想做一个截图记账的功能,这个应该可以用吧? |
27 lxxiil 32 天前 via iPhone 现在写游戏脚本 yolo ,opencv ,寻路算法,这些都是是必备技能 |
29 hwdq0012 32 天前 去年做了个工具训练 给公司做的更强大,加了一些网络设备的功能,标注多了缩放功能,还有一个 vncviewer 嵌入,从采集到模型部署 一个软件全包了 |
![]() | 30 neroxps 32 天前 via iPhone 我们产品期望用 yolo 做自助餐菜品自动识别 |
34 someonesnone 32 天前 超市自动识别物品称重那称, 都足够好玩 |
35 BruceWooong 32 天前 啊啊啊! YOLO 都已经玩透了,发论文都会遭到嫌弃。难道在工业界还没有普及吗?何止 v8 ,现在 v13 ( https://arxiv.org/pdf/2506.17733 )都有了,而且还有 DETR ( https://arxiv.org/abs/2005.12872 )这种基于 Transformer 的模型更加厉害,第一版是 2020 年出的。你提到的 yolo 第一版是 2015 年提出来的( https://arxiv.org/abs/1506.02640 ),到现在已经 10 年过去了。 |
36 roundgis 32 天前 via Android |
37 visper 31 天前 yolo 是一个极出色的模型,有兴趣的人都可以去试一下,以后能用到的地方就可以考虑用上。模型小,速度快,标注训练简单。转 onnx 在 java 之类里面跑也很方便。 |
![]() | 39 2en 31 天前 当年还用 yolo v5 做过自瞄,效果好而且封不掉 |
40 gsw945 30 天前 via iPhone ![]() 之前用 YOLOv5 做过发票识别,200 张图片微调训练的模型,准确率能稳在 95%以上,同发票图的准确率超过 PaddleOCR 官方 demo 。 背景说明: 有纸质发票的扫描件,需要数字化归档,识别出内容,PaddleOCR 识别出来的是很多个识别块,发票是历史发票,表格线很多缺失,也有部分扫描缺角,大部分扫描件都有倾斜,ocr 识别后,将块内容对应到字段很困难,穷尽表格识别各种算法后效果仍不好。后改变思路,参考猫狗识别的例子,以发票固定文字(字段)作为为标注分类,比如"纳税人识别号"等,标注后训练大概 2 小时不到,推理时先 YOLO 识别出各个字段的坐标范围,ocr 识别后,识别块的坐标经过比对,很容易就能对应到字段了。 |
![]() | 42 wingor2015 30 天前 @owen800q 识别车牌这种,估计都不需要自己训练,网上应该能找到现有的模型 |
![]() | 43 cz5424 30 天前 via iPhone 刚接触,有什么好用的标注平台可以推荐吗,需要得到物体的四个角位置,不是识别 |
44 lingxipaofan 29 天前 目前项目就是转 onnx 在 unity 里面做骨骼识别 |
![]() | 46 poorcai 29 天前 楼上说的识别车牌这种需求,以前研究 opencv 时就有很多开源的成熟的项目了!另外想问下,Yolo 和 OpenCV 的区别? |
![]() | 47 ioioj5 29 天前 刚接触 |
51 gsw945 29 天前 via iPhone @axunzzzz 寻路算法讲的最好的: https://www.redblobgames.com/pathfinding/a-star/introduction.html ,除了 A 星(A*),还有跳点搜索(JPS)也很常用,不过如果你的游戏是 3D 的,也可以搜索"Recast Navigation" |
![]() | 54 okampfer 12 天前 @lingxipaofan #44 ONNX runtime 不是 C++的么?是怎么用到 C#写的 unity 项目里面的? |