• 沸点IT---为科技爱好者提供最新鲜最热门的IT科技资讯!

沸点IT

ad

中国2家AI公司连发新模型超越OpenAIo1美开发者:中国追赶的速度令

来源:中国网  |  发布时间:2025-01-29 05:02  |  阅读量:5141  |   
“3个领先模型中有2个来自中国实验室?中国追赶的速度真是令人难以置信。”在美国知名技术社区HackerNews,一位开发者如此感叹。“中国初创公司已展现出赶超美国人工智能模型的迹象,而且他们追赶的速度比许多业内人士预期的要快。”有外媒12月...

“3 个领先模型中有 2个来自中国实验室?中国追赶的速度真是令人难以置信。”在美国知名技术社区Hacker News,一位开发者如此感叹。“中国初创公司已展现出赶超美国人工智能模型的迹象,而且他们追赶的速度比许多业内人士预期的要快。”有外媒12月24日的一篇报道中,也通过对比中美两国AI企业推理模型的表现以和研发速度,得出上述结论。

1月20日,国内两家备受关注的人工智能大模型创业公司月之暗面和深度求索(DeepSeek)几乎在同一时间发布了最新模型,都在性能测试中超过OpenAI的o1正式版模型。

在月之暗面发布的k1.5多模态思考模型中,多模态思考模型实现了SOTA级别多模态推理和通用推理能力。short-CoT模式下,Kimi k1.5的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,领先达到550%;而在long-CoT模式下,Kimi k1.5的数学、代码、多模态推理能力,也达到长思考SOTA模型OpenAI o1正式版的水平。

而深度求索发布的DeepSeek-R1在后训练阶段大规模使用强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

不到两个月,两家国产推理模型都实现了对OpenAI o1正式版的对标甚至超越,而与OpenAI不同,两家中国公司都公开了他们的原理及技术报告:Kimi k1.5发布原创技术long2short,高效思维链+原生多模,DeepSeek R1则继续主打高性价比。报告一出,引来大量海外从业者的解读和关注。

英伟达高级科学家范麟熙在社交媒体发文表示,“两篇论文披露了大量技术细节,并惊人得出相似结论,假期读到令人鼓舞。”

Answera公司创始人保罗·库弗特也感叹,“两款中国o1同日发布,中国AI追赶速度越来越快。”

中央民族大学教授郭全中表示:"中国AI公司之前基本都在摸着Open AI的石头过河,但从K1.5等国产大模型开始,以硅谷为中心的格局已悄然发生变动。国产大模型的突破不仅在于技术指标的提升,也展示了中国AI技术正在走向自主创新的新阶段。期待看到更多中国企业在全球AI舞台上展现实力,推动人工智能技术向着更高水平迈进。”

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。

  • 海信贾少谦:以中国管理,建世界一流企业

    海信贾少谦:以中国管

  • 海信贾少谦:世界一流企业必然有一流的ESG表现

    海信贾少谦:世界一流

  • 从“高门槛”到“消费级”,华为引领卫星通信飞入寻常百姓家

    从“高门槛”到“消费

  • 万百万:高净值研究院大健康分院院长万百万分享健康财富密码

    万百万:高净值研究院

沸点IT | 网站地图 | RSS订阅

所载文章、数据仅供参考,使用前务请仔细阅读网站声明。本站不作任何非法律允许范围内服务!

联系我们: jokerdeyouxiang@sina.com

备案号:皖ICP备2023005497号