
2025 年,ai ide/model 协作编程能力大幅度提升,作为后端开发,跟前端相比毫不了太多。做 ai 应用一年了,做了 rag 系统,机器学习图像识别项目,但面对核心的 ai/ml 算法设计部分不得要领。你们是如何与机器学习/ai 模型算法工程师协作以至于能承担部分工作增加核心竞争力的?
1 ranley123 14 小时 23 分钟前 via iPhone 转大模型 infra ,不过现在这个光景很难了。两年前我后端直接转大模型训练 infra 。现在已经杀得一片红海,同组算是国内最顶尖的大模型 infra 团队,进来的全是清北上交的博士,cmu 的也比比皆是。 但是现在如果实在想转,可以看看大模型相关的存储网络等等基础架构相关的,甚至 GPU 和大模型相关的 k8s 团队也行。应该能吃到一些涨幅溢价,只不过都是大厂了。 |
2 jiangbingo OP @ranley123 前外企大厂被优化,现创业小公司待着,无论是后端开发还是测试开发,经过一年多深度 vibe coding 深深的感受到传统程序员的生命周期比预期的要短。 |
3 Elietio 11 小时 58 分钟前 via Android 手头有个 NLP 的项目要做,完全零基础暂时先用 AI 干着。。。 |
4 ranley123 11 小时 47 分钟前 via iPhone @jiangbingo 是的,我赞同你的观点。所以新时代多往 AI 和大模型靠靠,是能够延长的,甚至还有机会远程。个人经验也是如此。自从我入了 LLM infra ,至少前景和钱景上都得到了爆炸式提升 |
5 ranley123 11 小时 43 分钟前 via iPhone @jiangbingo 外企大厂该不会是 ms 吧哈哈,如果是的话那就是前同事了。我觉得你可以学习一下大模型的原理,比如 transformer 和 attention 之类的,甚至包括一些推理的框架基本知识 kv cache 之类的,如果对训练感兴趣的话可以看看并行训练的基本框架,不过会比较困难。 |
6 ranley123 11 小时 26 分钟前 via iPhone 或者自己写写 ai agent 以后找 agent 工作 |
7 richarddingcn 10 小时 44 分钟前 @ranley123 ai infra 是写算子么?请教下大佬有啥学习渠道感谢 |
8 ranley123 9 小时 18 分钟前 via iPhone @richarddingcn 不止算子了,infra 包括高端的并行训练框架,算子优化,还有一系列分布式稳定性框架,LLM 故障检测和处理,LLM 存储 hdfs 优化和网络 NCCL 啥的,一大堆 |
9 ranley123 9 小时 14 分钟前 via iPhone @richarddingcn 框架基本不用想了,现在只有清北博士级别和妖孽硕士的才能进。其他的就按照正常的基础架构+LLM 知识学习找点实习吧 |