大三科研立项方案,求各位老哥指导 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
WilliamColton

大三科研立项方案,求各位老哥指导

  •  1
     
  •   WilliamColton 17 天前 1335 次点击

    现在初步选题是一个基于 MediaPipe 的动作纠正与健康管理平台,目前想到的核心功能就是

    1. 利用摄像头去检测用户各关节间的角度,然后与标准的动作进行比对,通过语音播报的方式来纠正用户的动作

    2. 通过 RAG 接入一些文档、资料等来强化 AI 在这方面的知识储备

    3. 仿照现在流行的 Agent 记忆管理方式去建立一个用户的个人健康状态、运动习惯方面的记忆系统,建立符合用户自身状态的一个 AI 问答系统

    目前主要的问题就是,在用 AI 做了一个小的 demo 之后,发现实际的识别效果并不好,很难精准的与参考视频里面的动作相匹配,而且不管我做的动作怎么样,播报的声音都会一直响,提示我某某部位再弯一点、腿没有伸直之类

    请问各位老哥在这方面有什么好的技术方案吗(比如优化检测效果或者是播报效果方面的)?

    或者说这个项目本身就比较复杂,不适合小团队去做的话,还有什么其他好的项目想法吗?

    谢谢各位的热心解答!

    4 条回复    2026-04-08 16:11:47 +08:00
    sentinelK
        1
    sentinelK  
       16 天前
    1 、你的解决方案是什么?你都不聊你的技术方案是什么,怎么让别人给你优化?难道伸手党直接要成熟方案?

    2 、你的标准姿势数据是什么?是视频?还是实际骨架数据?有没有做数据对齐?还是给 AI 扔一堆脏数据当许愿池?

    3 、你如何评估用户的“习惯”、与“自身状态”,并且如何持久化?不持久化和谈记忆?
    Mocus
        2
    Mocus  
       16 天前
    嘶……你说的这玩意我三年前本科互联网+做过(我本科毕业项目做的还是这个……),当时用的还是中间商中转的 ChatGPT3.5 ,连 DeepSeek 都还没出

    识别效果不好,那只能说明你关节检测参数没调好

    一直响的话那你,就得设置播报间隔,规定它第一次响后多少 s 后,如果状态没变化就不象应

    小团队完全可以做,当年一个哥们负责调整 MediaPipe 参数,我负责做服务器的 RAG 和移植到 Android 上(写 Kotlin ),还有一个人做 PPT 与老师协调,这没问题的

    如果非要说的话,这玩意豆包图片识别一把梭,调教下应该也 OK 吧当年的构想是自己训练个 CLIP 用,但忙着毕业,手头上也没有很好的训练集,只能作罢
    Mocus
        3
    Mocus  
       16 天前
    @sentinelK 大哥别着急(别抛出这么多问题把楼主吓住喽),盲猜止不定不是哪个大学老师拍脑袋给了这个选题,楼主估计还在想要不要做这个,技术细节肯定还没想好
    WilliamColton
        4
    WilliamColton  
    OP
       16 天前
    @sentinelK #1

    谢谢老哥您提出的这些问题,确实是我上面没有补充这些有关的详细信息,下面是对您问题的一些回答。

    1. 目前设想中的解决方案比较单纯,比方说检测一个手部动作是否标准,就是通过 MediaPipe 识别出躯干和手臂的夹角,然后对比标准视频中的夹角,如果相差超过一定值(比如说相差 15 度),就语音提示用户“请将左臂放低”。
    2. 标准姿势数据原本打算事先录制相应视频, 但是您提出问题之后我调研了一下,发现使用事先准备的骨骼数据会更好一些,同时用 DTW 算法去做一个对齐。
    3. 这方面我们打算参考 openclaw 的记忆机制,分成短期记忆和长期记忆,通过多个 md 文件记录下来持久化,然后在用户和 ai 交流时自动将用户喜好写入记忆,以及在每次锻炼结束时自动总结运动情况(比如说今天的运动效果如何,和标准动作差距在哪些地方)然后写入记忆。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     888 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 29ms UTC 20:25 PVG 04:25 LAX 13:25 JFK 16:25
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86