记录团队成长点滴以及对技术、理念的探索,同时我们乐于分享!

3523
qwen3-0.6B这种小模型有什么实际意义和用途吗?

2025-06-17 查看(1000)

0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务
3523
如何评价Google刚刚发布的 Gemini Diffusion? 会代替自回归模型成为下一代模型吗?

2025-06-17 查看(1000)

首先谷歌的 llm diffusion 和之前发布的 llm
3523
突然发现自己变老是怎样一种体验?

2025-06-17 查看(1000)

突然发现自己变老了是从垮脸开始的。 工作关系,经常要给孩子们
3523
如何评价李健?

2025-06-17 查看(1000)

1 2025年新年。 李健送新年祝福。 他抱着绝育的猫,
3523
如何看待小米 5 月 22 日发布 3nm 自研芯片「玄戒 O1 」?性能表现怎样?

2025-06-17 查看(1000)

关于玄戒,之前众说纷纭,基本上没一个对的。 前几天部分媒体
3523
为什么QQ上的网络状态没有了?

2025-06-18 查看(1000)

现在是2025年,Mac 版新QQ仍然有这个网络在线状态,只