上周,中国公司 DeepSeek 发布了一款名为 R1 的大型语言模型,震惊了美国科技行业。R1 不仅能与本土竞争对手相媲美,而且成本仅为其一小部分,而且免费提供。美国股市因此损失了 1 ...
2024年,随着OpenAI等国际大模型企业的持续推进,国内大模型企业也在不断追赶和超越。总体上,中国大模型在经历2023年白热化的“百模大战”后,2024年迎来了“大浪淘沙”,竞争格局趋于稳定,呈现互联网大厂与初创公司“共舞”的局面。
导读:奥特曼罕见地承认了自己犯下的‘历史错误’,LeCun发文痛批硅谷一大常见病——错位优越感。DeepSeek的终极意义在哪?圈内热转的这篇分析指出,相比R1,R1-Zero具有更重要的研究价值,因为它打破了终极的人类输入瓶颈!
近日,在国内某问答平台上,一则关于 DeepSeek 的提问登上问题热门排行榜。这一问题的描述是:“如何评价 DeepSeek 自称开源?但似乎并未开源(Open Source),仅为 Open Model?”(来源:资料图)那么,DeepSeek ...
新智元报道 编辑:KingHZ 桃子【新智元导读】一场改写AI历史的震撼对决正在上演!就在昨天,当DeepSeek ...
特朗普政府上任伊始就展现了对AI领域的雄心壮志。1月21日,特朗普在白宫宣布了名为"星际之门"的庞大AI基础设施计划,预计在未来四年内投资5000亿美元,用于建设支持AI发展的基础设施(点击查看相关报道)。这一计划由OpenAI、软银集团和甲骨文公司 ...
DeepSeek-R1 的发布及其引发的全球复现热潮,正在从根本上改变 AI 产业的格局。这种改变首先体现在开发成本上。R1 将每百万 token 的价格从 o1 的 60 美元降至 2.19 美元,这种近 30 倍的价格差异足以改变企业的 AI ...
大和发表报告表示,内地人工智能公司深度求索(DeepSeek)截至本周一(27日)已成为苹果应用商店中免费应用程式排行榜第一名,此推理模型据称在某些AI基准测试中的表现与OpenAI的o1相当。根据DeepSeek ...
在当今竞争激烈的人工智能领域,DeepSeek的横空出世正如一阵狂风,令众多大厂如英伟达、Meta和OpenAI等面临前所未有的压力。近年来,随着AI技术的急速发展,市场内的竞争不断加剧,DeepSeek凭借其低成本高性能的大模型训练策略,成功挑战了行业巨头的地位。本文将全面解析DeepSeek的技术创新、市场影响,以及其背后的开放源代码理念,揭示其如何在短时间内成为全球AI研究者的首选模型。 深 ...
支持大语言模型 LLM、多模态图文模型 VLM 的预训练及轻量级微调。XTuner 支持在 8GB 显存下微调 7B 模型,同时也支持多节点跨设备微调更大尺度模型(70B+)。
OpenAI on Friday launched a new artificial intelligence (AI) "reasoning" model o3-mini. The company said the newest in the ...
2025年1月26日,拾象创始人兼CEO李广密,组织了一场关于DeepSeek的闭门讨论会,嘉宾包括数十位顶尖AI研究员、投资人与一线 AI 从业者,他们围绕DeepSeek的技术细节、组织文化以及其出圈后的短中长期影响等,进行了探讨与学习。