记录团队成长点滴以及对技术、理念的探索,同时我们乐于分享!

3523
如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?

2025-06-17 查看(1000)

虽说如今新大模型发布必须有点拿得出手的干货,但MiniMax
3523
浴巾有好的推荐吗?

2025-06-18 查看(1000)

提名康尔馨大云朵浴巾,就是下面的白色款,高克重、有点厚、吸水
3523
为什么小男孩小时候要比小女孩难养好多?

2025-06-18 查看(1000)

兄弟,你这还是噩梦的刚开始,过来人告诉你儿子的养育过程 三岁
3523
以总理称已控制伊朗首都领空,领空被控制意味着什么?伊朗还可以通过空袭反击吗?

2025-06-18 查看(1000)

说明五代机对四代以下的空中优势的确就是碾压形式的。 伊朗既没
3523
qwen3-0.6B这种小模型有什么实际意义和用途吗?

2025-06-17 查看(1000)

0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务
3523
前几周Deepseek都是神一般的存在,为啥热度消散得这么快?

2025-06-18 查看(1000)

大约两个月前,我所在的程序员群里每天能刷出上百条关于Deep