reasoning model - 搜索 News

OpenAI on Friday launched a new artificial intelligence (AI) "reasoning" model o3-mini. The company said the newest in the ...

Lex Fridman 今早发布了一个长达五个小时的播客，内容涵盖 DeepSeek, China, OpenAI, NVIDIA, xAI, TSMC, Stargate 等话题。由于信息量过于庞大，Indigo ...

受美国 AI 芯片禁令影响，DeepSeek 团队不得不在性能较低的 H800 GPU（而非 H100）上进行多项优化创新，最终以低于 600 万美元的计算成本完成了模型训练（研发成本不计）。

9 小时

如今的观点认为，DeepSeek的模型如此高效，以至于算力不再是瓶颈，整个市场因此出现了严重的算力过剩。然而，这种说法过于夸大。“杰文斯悖论” ...

5 天

2. DeepSeek 有好口碑的原因在于是第一个把复现 MoE、o1 等发出来，胜在做的早，但能不能做到最好，空间还很大。后面新的挑战在于资源有限，只能把有限的资源放在最亮眼的地方。这个团队的 research 能力、团队文化还是很好的，如果再给 ...

2 天

71. DeepSeek 更多是 FP8，美国是 FP16，DeepSeek 所有都是基于有限算力工程能力的提升，对于算力高效的使用是最大亮点。上周五 DeepSeek 在北美有巨大的发酵，扎克伯格对 Meta ...

近日中国初创公司DeepSeek推出的人工智能（AI）模型备受全球关注后，美国AI公司OpenAI当地时间周五（1月31日）宣布，正式推出推理模型o3-mini，是其系列中最新、最具成本效益的模型，即日起可在ChatGPT和API中使用。

一些您可能无法访问的结果已被隐去。