1 hwdq0012 193 天前 ![]() 视频也是拆成单帧送去推理的,ultraclity yolo 这种不算什么大模型吧,但是能把视频做成结构化数据,再用大模型加工 |
![]() | 2 suke119 193 天前 ![]() Qwen2.5-Omni . 千问的 ai 对话那里点击 有个实时视频对话 [Qwen2.5-Omni 和 minicpm-v 对比]( https://stable-learn.com/zh/qwen-omni-vsminicpm-v/) |