
1 vitovan 2019-07-16 09:15:25 +08:00 via Android 生成的图片会不会不太符合生产环境真实 NG 的特征? 有没有 NG 产品的照片库直接拿来训练这样? |
2 dafengchui OP @vitovan append 附加没有了,正好这里回答你的问题: 生成图片有 2 个方案,并行或者二选一: 可能会有 ng 照片直接拿来训练(如果产线某零件运行时间足够久的话). 此外肯定有个学习条件输入端:比如一平方毫米允许多少个划痕 /裂缝之类. |
3 jingous 2019-07-16 09:24:05 +08:00 via Android 1 楼说的对,直接在图片上添加生成的图片大概率不符合真实环境。现在的图片生成基本都是 GAN,但也需要原始 NG 数据。即使生成新数据之后,也不是直接匹配,而是作为训练数据来训练模型。 |
4 jingous 2019-07-16 09:27:51 +08:00 via Android 直观的思路是:先收集一批 NG 数据,视数据收集的难易程度来确定是否需要生成虚假数据。然后数据训练模型,每次在生产线拍的照片输入模型来得到结果。大概框架是这样,里面可能涉及到 N 多问题:图片的光线、模型的处理数度等等 |
5 dafengchui OP @jingous 我给你的初始照片一定是完美照片,可以用来做基准照片,光线之类不需要考虑了. 倒是模型的处理数度可以探讨,目前仅仅聚焦于产品表面检测. 这个算法是要长期合作的,因为不同的产品对应不同的模型,考虑为一个平台, 暂时只是基于当前已有产品检测而已. |
6 crackhopper 2019-07-16 09:34:50 +08:00 找学校合作感觉最合适。针对数据进行样本生成,一般都是对抗网络,也方便发论文。 验收标准比较麻烦,毕竟深度学习都是玄学,样本哪怕生成的好,也只是一个环节;所以怎么验收也是值得疑虑的。 |
7 jingous 2019-07-16 09:36:04 +08:00 完美的照片才是缺点。如果你拿的是完美的照片,那么训练出来的模型只能处理完美照片。而生产环境中由于光线、光亮等原因采集到的图片各种各样,输入模型肯定得不到很好的效果。如果你这个数据获取容易的话,可以收集大量生产数据,如果数据收集困难的话,这个问题就比较难了。 |
8 dafengchui OP @jingous 产线环境这你根本不需要考虑,已经解决了. |
9 liuzhedash 2019-07-16 09:38:36 +08:00 现在的生产线是如何判别产品是否有质量问题的? |
10 jingous 2019-07-16 09:41:53 +08:00 @dafengchui 那就直接搜集生产环境的数据,先跑一个简单的模型试试。 |
11 dafengchui OP @liuzhedash 请看附言: 定义 ng 输入端:比如一平方毫米允许多少个划痕 /裂缝之类. |
12 dafengchui OP @jingous 目前是基于 halcon 二开,垃圾的一比,基本抛弃了. |
13 vitovan 2019-07-16 09:48:11 +08:00 via Android 建议楼主发几张照片看看 |
14 unhumanplane 2019-07-16 09:51:13 +08:00 瑕疵检测可是可以给一家图像公司当主营业务的领域,现在主流基本都是直接堆数据上检测搞定,外加各种数据增广,基于匹配的大概率不行。 |
15 dafengchui OP @vitovan 这是朋友的项目,我来问问是否需要公开些照片. |
16 dafengchui OP @unhumanplane 目前只是简单的表面瑕疵识别,零件单调简单, 图像公司的算法复杂多了. 不过你提出了很好的思路, 虽然之前我们也探讨过, 我把它写到 append 中. |
17 unhumanplane 2019-07-16 10:25:29 +08:00 @dafengchui 不复杂,大多数深度学习项目工程化关键都在于折腾数据,算法一大堆开源的,昨天刷 github 就看到了一个相关的库,楼主有兴趣我可以再去找找。 |
18 dafengchui OP @crackhopper 这段时间天天 github 找有没有搞这个算法的,估计有人做了,所以找到类似的,然后给感兴趣的提供参考,那么是皆大欢喜的事情. |
19 winglight2016 2019-07-16 11:56:42 +08:00 lz 思路还是基于逻辑编程来做缺陷识别,个人建议还是用监督学习来做分类,有图片的话,可以发过来预研一下,我的 wx:Y2h5NDQ3NjQ4 ( base64 ) |
20 qinyusen 2019-07-16 12:23:48 +08:00 有监督学习的比较好, 关键是, 要有标注好的数据。 |
21 shinodajmk 2019-07-16 12:29:58 +08:00 |
22 mahonejolla 2019-07-16 15:53:20 +08:00 老铁,你是哪个公司的?我咋感觉我们在做同样的事情?? |
23 dafengchui OP @unhumanplane 请问找到了那个 github 上的算法了吗? 方便共享吗? |
24 dafengchui OP @winglight2016 已加 |
25 dafengchui OP @mahonejolla 我是帮朋友忙而已, 你们公司也要做类似的工作吗? |
26 mahonejolla 2019-07-16 16:42:54 +08:00 @dafengchui #25 是的,你是做的具体是什么物体的检测呢?不会是电池吧? |
27 unhumanplane 2019-07-16 17:34:11 +08:00 |
28 cshlxm 2019-07-16 17:42:18 +08:00 好歹搞下一批真实的 NG 数据的标注,训练给 GAN 用 |
29 dafengchui OP @unhumanplane 谢谢,和上面一个兄弟微信沟通过,现在从深圳去珠海见见他当面聊聊。 |
30 dafengchui OP @cshlxm 那肯定了,只是很多时候提供的 ng 数量不足够 |
31 dafengchui OP @cshlxm 对的,大概就是这样的思路,这几天忙的飞起. |