微软Phi-4封神:14B小模型数学击败GPT-4o,合成数据占比40%,36页技术报告出炉 微软推出的14B参数小型语言模型Phi-4在数学推理方面表现出色,超越多个更大规模的模型,如70B的Llama 3.3和72B的Qwen。 Phi-4使用40%合成数据进行训练,并发布了详细的36页技术报告。 36KR热点 2024年12月23日 14:17 0 点赞 0 评论 7 浏览
OpenAI 推出“强化微调”计划:让创建专家大模型更简单了 OpenAI推出了“强化微调”计划,旨在通过特定领域数据对大型语言模型进行优化,使其从“高中水平”提升至“博士级专家”的能力。这项技术将为高校、研究人员和企业提供独特的AI解决方案,特别是在法律、保险、医疗保健、金融和工程等领域。 36KR热点 2024年12月08日 09:56 0 点赞 0 评论 11 浏览
表格处理神器登上Nature,开箱即用,平均2.8s解读任意表格 本文介绍了近期登上Nature杂志的表格处理工具Tabula Recta,详细描述了其功能特点及实际应用效果。 36KR热点 2025年01月09日 18:57 0 点赞 0 评论 6 浏览
ChatGPT发布2周年:我眼中的GPT模型成长之路 本文从个人视角回顾了ChatGPT发布2周年以来GPT模型的成长历程,探讨了其技术进步、面临的挑战以及未来的发展方向。 36KR热点 2024年11月30日 21:50 0 点赞 0 评论 14 浏览
亲测体验:DeepSeek-V3模型究竟有多强大? 本文以个人视角分享了对deepseek最新发布的V3模型的实际体验,从功能特点到用户体验等多个维度进行评价,并对其未来发展表达了积极乐观的态度。 知乎热点 2024年12月27日 11:45 0 点赞 0 评论 7 浏览