ChatGPT 是基于文本的语言模型,做的仅限于文本方面的工作。
我大胆预测下一个方向是基于视频学习的模型,暂且命名为 ActionGPT 哈哈
那么这个模型发展逻辑我觉得可能是这样的:
1 、一个机器人拥有各种基础功能,各个关节具有三维方面的可操作性能力
2 、ActionGPT 开始学习大量视频,并最终理解一些含义。例如喝水动作,首先是拿水杯,让拥有基础动作的机器人
通过视频得到分解的动作,并通过模拟,完成这个拿的动作,然后再送到嘴巴,喝下去。
3 、上面两步完成之时,才是真正大爆发的时代,你甚至有了穿衣服机器人、炒菜机器人、洗澡机器人等等,真正迎来机器人时代,这些只是生活机器人,更恐怖的是延展到其他方面。
细思极恐,新时代的主题已经很明确了,就是机器人时代,爆发就在眼前。
我大胆预测下一个方向是基于视频学习的模型,暂且命名为 ActionGPT 哈哈
那么这个模型发展逻辑我觉得可能是这样的:
1 、一个机器人拥有各种基础功能,各个关节具有三维方面的可操作性能力
2 、ActionGPT 开始学习大量视频,并最终理解一些含义。例如喝水动作,首先是拿水杯,让拥有基础动作的机器人
通过视频得到分解的动作,并通过模拟,完成这个拿的动作,然后再送到嘴巴,喝下去。
3 、上面两步完成之时,才是真正大爆发的时代,你甚至有了穿衣服机器人、炒菜机器人、洗澡机器人等等,真正迎来机器人时代,这些只是生活机器人,更恐怖的是延展到其他方面。
细思极恐,新时代的主题已经很明确了,就是机器人时代,爆发就在眼前。
