jason6 发表于 2024-8-30 14:51:17

聊聊视觉算法

前阵子有几个供应商来推荐他们的视觉设备,跟我聊视觉深度学习,后来我问了几个问题,答不上来就不了了之了,说明自己都不知道用来干嘛的。这个细分领域,亦是鱼龙混杂,做的好的少之甚少。

我问了5个问题:

1. 是否可以迁移训练模型?例如之前用2000张图像的目标检测模型,新发现的几张NG图像加入重新训练?

2. 你们家的深度学习是基于哪几个深度学习框架的?
--- TensorFlow
--- pytorch
--- Keras
--- Caffe
--- Theano
--- CNTK

3. 你们的视觉深度学习目前支持哪几种应用场景?
--- 分类检测
--- 目标检测
--- 语义分割
--- 还是其他?

4. 是否有独立的标注软件?(他们问什么是标注软件?)
--- 标注软件就是人工把缺陷位置圈出来,这就是标注。

5. 你们目前的模型是什么格式的?是否可以使用通用的ONNX推理?


huhu2 发表于 2024-8-31 17:08:48

本帖最后由 huhu2 于 2024-8-31 18:57 编辑

现在只剩下两家了,google的TENSORFLOW和facebook的pytorch,caffe是奄奄一息,其他的坟头长草了吧!迁移学习应该是指比如你原先识别的是黑白的中文或数字,换为彩色的中文或数字是否也可以快速的识别。另外ONNX主要是把训练好的模型发布到网上服务器上给用户使用,tensorflow用自家的软件部署或发布,其他家都用ONNX部署吧。

学者11 发表于 2024-8-30 17:02:44

本帖最后由 学者11 于 2024-8-30 17:10 编辑

我觉得是你的提问就显得欠缺语法,比如第一个问题,换成“在视觉深度学习领域,之前用2000张图像训练过的目标检测模型,现在新加入几张NG图像是否可以进行重新训练?”,这种描述是不是更好?
答案是当然可以,然而在这样做之前,你需要考虑以下几个方面:
数据一致性:确保新的图像与原来的训练集在数据分布上保持一致,避免引入数据偏移。
数据质量:“NG图像”的质量可能会对训练过程产生影响。如果这些图像是低质量的或者标注有误,那么它们可能会影响模型的整体性能。
数据量影响:虽然添加少量图像通常不会显著改变模型的行为,但如果这些图像具有很强的代表性或包含重要的特征,则有可能对模型产生积极的影响。反之,如果这些图像的质量较差,也有可能导致模型性能下降。
如果你担心新的图像会对现有模型造成负面影响,可以尝试使用迁移学习的方法,仅微调模型的部分层而不是整个网络。
另外,也可以采用增量学习的方法,这样模型可以逐步适应新的数据而不完全忘记旧的数据上的学习成果。

人家不愿意回答采用的是哪种深度学习框架也很正常,这属于商业机密。

你问人家ONNX推理的事,对方只会认为你有恶意。因为通过ONNX,开发者可以使用一种深度学习框架训练模型,然后在另一种框架或者专门的高性能推理引擎中运行这个模型。所以对方会想,你该不会想偷我们的模型,然后在你们公司的框架上运行这个模型吧。人家卖的是服务,没打算把家卖给你啊。

所以根本原因是你的提问已经大大超过了一个普通用户的需求,很多是创业者才会想到的。




hxglty 发表于 2024-8-30 23:10:42

那些视觉软件基本上都内嵌了大把的算法库,随便改改就可以用了,比如说Halcon

leioukupo 发表于 2024-8-30 15:13:26

这5个问题都不知道,那还不如我,至少我知道
我是不是也能去做视觉产品了

m2006410 发表于 2024-8-30 21:17:19

{:3_46:}

无法言喻1977 发表于 2024-8-31 21:50:40

学者11 发表于 2024-8-30 17:02
我觉得是你的提问就显得欠缺语法,比如第一个问题,换成“在视觉深度学习领域,之前用2000张图像训练过的目 ...

本质被你看到了。

cangzhoumj 发表于 2024-9-2 07:59:50

大有前途啊

救赎. 发表于 2024-9-2 10:27:16

会不会觉得你是同行提问 :lol

救赎. 发表于 2024-9-2 10:30:26

我们就是拿样品过去给他做视觉分析OK后 我再拿一批料过去给他判断,拿判断过的产品OKNG 回来公司用自己的检测方法判断他们的视觉是否可行,可以就买 不行就在商量 或者换一家
页: [1] 2
查看完整版本: 聊聊视觉算法