|
- DeepSeek - 知乎
DeepSeek是一个备受关注的先进模型,提供多种使用方法和优化性能,适合开发者和普通用户探索其潜力。
- 如何评价DeepSeek和豆包的回复能力、准确度和学术水平?
DeepSeek: 优势:结构化输出能力强(如分步骤解题、论文大纲生成),支持Markdown代码块和公式排版,适合技术文档撰写。 局限:娱乐性交互相对生硬,对网络流行语的响应较少。 2 准确度 豆包:
- DeepSeek-V3. 2-Exp版本更新,有哪些信息值得关注?
DeepSeek V3 2,可以说是算法同学最想要、最符合直觉的top 2048 token的sparse attention了,然而,经历过这场适配才能知道,背后有多少infra的坑要踩。 太不容易了,三个时区的同学连轴转一个多礼拜,在DeepSeek提供了很多帮助的情况下,才把hopper kernel集成完了。
- 有必要自己将deepseek部署到本地吗? - 知乎
顺带教大家如何在10分钟内零基础地完全本地化部署DeepSeek-R1模型。 1 为什么要自己部署DeepSeek? 最近DeepSeek非常火爆! 它不仅能撰写文案和进行研究,还能联网实时回答问题,堪称智能助理界的“小钢炮”! 不过,官网常常出现以下问题: 1 高峰期排队让人
- deepseek究竟处于一个什么水平? - 知乎
Deepseek在一些不需要很高精度的模块,使用很低的精度FP8储存数据,极大的降低了训练计算量。 当然即便如此,训练Deepseek的成本还是巨大的,虽然没有最先进的显卡,但保守估计还是用了大概50000张显卡。 三、未来?
- 2025年12月1日,DeepSeek正式发布V3. 2和V3. 2-Speciale,如何评价该模型?
DeepSeek-V3 2 与其他模型在各类数学、代码与通用领域评测集上的得分(括号内为消耗 Tokens 总量约数) 不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3 2 是我们推出的首个 将思考融入工具使用 的模型,并且同时支持思考模式与非思考模式的工具调用。
- DeepSeek 计划二月中旬发布新模型 DeepSeek-V4,有哪些技术亮点?能第二次震惊世界吗?
DeepSeek这个新模型有很强的Coding能力 废话,DeepSeek v3 2就表现出了很强的Coding能力,当然也有用户反映Coding能力反而有下降,我觉得这说明DeepSeek v3 2还没有碾压性的优势,所以在一些个例上显得不如以前,但是v4大版本升级,还大概率应用元旦发布的mHC架构,Coding
- deepseek官网地址告诉我? - 知乎
DeepSeek官网入口、下载及使用教程 DeepSeek简介: DeepSeek,特别是V3版本,因其十分有效的控制训练模型成本和开源免费的模式震惊全球,登顶应用商店的下载排行榜,甚至重创国外的科技股,而且截止到写稿日期(2025年2月9日),已经有很多科技巨头接入DeepSeek,比如英伟达、微软等等。 DeepSeek官网
|
|
|