如何评价面壁新发布的端侧模型 MiniCPM-4,该模型有哪些技术亮点?
来源:
编辑:
时间:2025-06-24 19:25:16

最近几年精力有限比较少在知乎上回答问题了,不过每次看到精彩的问题和回答还是会手痒。
趁这次MiniCPM-4模型发布,集中分享下最近一年多来的感悟和想法,也是最近跟同学朋友经常探讨的话题,抛砖引玉一起交流。
为什么做端侧模型 规模法则可持续发展问题。
大模型在规模法则(Scaling Law)的指引下,参数规模从2018年的千万量级发展到2024年的千亿量级(Llama3.1-405B)。
到了2024年下半年,逐渐出现规模法则是否可持续的大讨论…。
-
{dede:pagebreak/}


网友评论:
{dede:include file='ajaxfeedback.htm' /}
栏目分类

最新文章
- 为什么明明35岁以上的员工更稳定,招聘时不要,被裁的也是他们?
- 你们在编程时遇到过什么离谱的bug吗?
- 内蒙古通报那尔那茜定向委培争议,称其涉嫌高考报名材料造***,将严肃追责问责,涉事人员面临哪些责任处罚?
- 如何看待 Git 的 Windows 安装程序称 Vim「很难用」?
- 做引体向上可能会诱发腰肌劳损吗?
- 5 月 28 日 DeepSeek R1 模型完成小版本试升级并开源,具体有哪些提升?使用体验如何?
- 24-25赛季总决赛G6,步行者108:91雷霆,总决赛时隔9年再次进入抢七,如何评价这一场比赛?
- 如何评价Cursor?
- 如何看待 Rust 的应用前景?
- 为什么一部分 Go 布道师的博客不更新了?

热门文章
