清华DeepSeek使用手册:我的深度学习探索之旅 本文以第一人称视角详细介绍了如何使用清华DeepSeek进行深度学习实践,包括安装配置、常见问题解决以及功能亮点解析等内容,适合对AI感兴趣的读者阅读。 简书热点 2025年02月14日 00:25 0 点赞 0 评论 16 浏览
美团开源INT8无损满血版DeepSeek R1,AI领域迎来新突破 美团搜推机器学习团队开源了INT8无损满血版DeepSeek R1模型,实现了对原生FP8模型的基本无损量化,大幅降低了硬件要求并提升了性能。本文从技术实现、实际应用及未来展望等多个角度,详细解读了这一重要成果。 IT热点 2025年03月08日 21:00 0 点赞 0 评论 13 浏览
马斯克的Grok 3免费了!用户为何气得跳脚? 本文详细解读了马斯克旗下xAI公司发布的最新大模型Grok 3,探讨了其强大的性能以及免费政策引发的争议,同时展望了这款AI工具在未来的发展前景。 36KR热点 2025年02月21日 10:45 0 点赞 0 评论 17 浏览
Grok3与DeepSeek:谁才是AI模型的王者? 本文深入探讨了Grok3与DeepSeek两款AI模型的竞争态势,分析了两者的技术特点、应用场景及未来发展潜力,为读者呈现了一场精彩的技术对决。 贴吧热点 2025年02月18日 17:47 0 点赞 0 评论 15 浏览
揭秘老黄演讲中的关键技术:PD分离,UCSD华人团队如何让LLM吞吐量跃升4倍 老黄在GTC大会上的演讲引发了广泛关注,其中提到的PD分离技术成为焦点。本文详细解读了这项技术的原理及其背后的UCSD华人团队研究成果,揭示了其如何让LLM吞吐量跃升4倍。 36KR热点 2025年03月20日 13:17 0 点赞 0 评论 8 浏览
深度揭秘:GPT核心机密意外曝光背后的真相 本文从小明的视角出发,详细解读了微软论文意外曝光GPT核心机密事件。通过分析4o-mini和o1模型的特点以及GPT的技术原理,探讨了这一发现对AI行业的深远影响。 36KR热点 2025年01月02日 21:57 0 点赞 0 评论 26 浏览
DeepSeek开源周的第二枚王炸:FlashMLA背后的秘密 本文从个人视角出发,详细解析了DeepSeek开源周发布的FlashMLA项目,探讨其技术特点及开源战略意义,并对未来发展趋势进行了展望。 36KR热点 2025年02月26日 10:50 0 点赞 0 评论 16 浏览
全球华人见证AI巅峰对决:Grok 3险胜DeepSeek,马斯克再创奇迹 本文详细介绍了马斯克旗下xAI公司推出的Grok 3大模型在全球范围内的表现及其与DeepSeek、OpenAI等竞争对手之间的激烈角逐。通过深入分析各模型的技术特点和发展趋势,探讨了未来AI领域的潜在发展方向。 36KR热点 2025年02月19日 17:30 0 点赞 0 评论 16 浏览
低成本高效率:李飞飞团队用不到50美元训练新模型,AI领域迎来革命性突破 李飞飞教授带领团队用不到50美元成功训练出一款性能卓越的新模型,采用最简化的测试时间扩展方法,仅需让模型训练约1000个问题,即可获得超越传统模型的强大推理能力。 头条热点 2025年02月07日 02:36 0 点赞 0 评论 16 浏览