DeepSeek超越OpenAI的秘密武器:创新

专题:DeepSeek为何能震动全球AI圈   当前,全球AI社区正在疯狂热议一种新的开源推理模型DeepSeek R1。...

专题:DeepSeek为何能震动全球AI圈

DeepSeek超越OpenAI的秘密武器:创新

  当前,全球AI社区正在疯狂热议一种新的开源推理模型DeepSeek R1。

  该模型由中国AI初创公司DeepSeek开发,该公司声称R1在多个关键基准上与OpenAI的ChatGPT o1相媲美,甚至还有所超越,但成本只是后者的一小部分(有报道称约为3%至5%)。

  美国埃默里大学(Emory University)信息系统助理教授Hancheng Cao表示:“这可能是一个真正的均衡突破,对资源有限的研究人员和开发人员来说是件好事,尤其是来自南半球的研究人员。”

  考虑到硬件等资源方面的限制,DeepSeek的成功更加引人注目。DeepSeek等初创公司正以优先考虑效率、资源共享和协作的方式进行创新。

  DeepSeek前员工、现任美国西北大学(Northwestern University)计算机科学博士生Zihan Wang表示,为了创建R1,DeepSeek不得不重新设计其训练过程,以减轻其GPU的压力。

  DeepSeek R1因其处理复杂推理任务的能力而受到研究人员的称赞,特别是在数学和编码方面。该模型采用了一种类似于ChatGPT o1的“思维链”方法,通过逐步处理查询来解决问题。

  微软AI前沿研究实验室的首席研究员Dimitris Papailiopoulos表示,R1最让他惊讶的是它的工程简单性。他说:“DeepSeek旨在获得准确的答案,而不是详细说明每个逻辑步骤,从而在保持高水平效率的同时显著减少计算时间。”

  DeepSeek还发布了六个较小版本的R1,这些版本足够小,可以在笔记本电脑上本地运行。该公司称,其中一个甚至在某些基准测试中表现优于OpenAI的o1-mini。

  尽管R1备受关注,但DeepSeek仍然相对不为人知。该公司总部位于中国杭州,由浙江大学信息与电子工程专业校友梁文峰于2023年7月创立。该公司由梁文峰在2015年创立的对冲基金幻方(High-Flyer Quant)孵化。与OpenAI的萨姆·奥特曼(Sam Altman)一样,梁文峰的目标是建立通用人工智能(AGI),即一种可以在一系列任务上与人类匹敌甚至击败人类的AI。

  训练大型语言模型(LLM)需要一个训练有素的研究人员团队和强大的计算能力。资深企业家、谷歌中国前负责人李开复近日在接受媒体采访时表示,只有“一线玩家”通常会参与构建ChatGPT等基础模型,因为它需要大量资源。

  据报道,为了训练其模型,DeepSeek购买了10000多块英伟达GPU,随后又扩大到50000块。与OpenAI、谷歌和Anthropic等领先的AI实验室相比,这明显相形见绌,因为这些实验室每个都有超过50万块GPU。

  尽管如此,DeepSeek前员工Zihan Wang表示,他在DeepSeek工作时可以获得丰富的计算资源,并可以自由地进行实验,这对应届毕业生来说是一种少有的奢侈。

  梁文峰称,除了硬件方面的限制,公司面临的另一个挑战是,他们的AI工程技术往往效率较低。他说:“我们(大多数中国公司)必须消耗两倍的计算能力才能达到同样的结果。再加上数据效率差距,这可能意味着需要高达四倍的计算力。我们的目标是不断缩小这些差距。”

  但DeepSeek找到了在不显著牺牲准确性的情况下,减少内存使用和加速计算的方法。Zihan Wang说:“团队喜欢把硬件挑战变成创新的机会。”

  梁文峰本人仍然深度参与DeepSeek的研究过程,与他的团队一起进行实验。王说:“整个团队都有一种协作文化,并致力于核心研究。”

  除了优先考虑效率,DeepSeek还越来越多地接受开源原则。阿里云已经发布了100多个新的开源AI模型,支持29种语言,迎合了包括编码和数学在内的各种应用。同样,像Minimax和01.AI(零一万物)这样的初创公司也将他们的模型开源。

  根据中国信息通信研究院(CAICT)去年发布的一份白皮书,全球AI大型语言模型的数量已达到1328个,其中36%来自中国。这使中国成为AI的第二大贡献者。

  塔夫茨大学(Tufts University)技术政策助理教授Thomas Qitong Cao表示:“这一代年轻的中国研究人员强烈认同开源文化,因为他们从中受益匪浅。”

  卡内基国际和平基金会(Carnegie Endowment for International Peace)的AI研究员马特·希恩(Matt Sheehan)称:“中国公司必须利用有限的计算资源提高效率。将来,我们可能会看到很多与缺乏计算相关的整合。”

  事实上,这种情况可能已经开始发生了。两周前,阿里云宣布与李开复创立的北京初创公司“零一万物”合作,合并研究团队,建立“工业大型模型实验室”。

  Thomas Qitong Cao说:“AI行业出现某种分工是节能和自然的。AI的快速发展要求中国企业保持敏捷才能生存。”

本文来自作者[admin]投稿,不代表吹吹讯立场,如若转载,请注明出处:https://cc199.top/bm/202501_1896.html

(35)

文章推荐

  • 开盘:美股周四高开 市场关注经济数据与科技股财报

      北京时间30日晚,美股周四高开。投资者正在消化一系列大型科技公司最新财报。美国第四季度GDP增幅不及预期。欧洲央行自去年6月以来第五次降息。  道指涨20.53点,涨幅为0.05%,报44734.05点;纳指涨64.62点,涨幅为0.33%,报19696.94点;标普500指数涨22.71

    2025年01月30日
    26
  • 再创新高!现货黄金首次触及2800美元关口

    格隆汇1月31日|现货黄金首次向上触及2800美元关口,续创历史新高,今年迄今累涨近7%。

    2025年01月31日
    20
  • 智能驾驶:2025年可能是智驾元年

      来源Gangtise投研  智能驾驶 分析师称,2024年比亚迪智驾渗透率为10%,2025年将达50%,2026年或达80%,2025年其自驾平台主要为DiPliot100,单车摄像头用量为12颗,较2024年全球单车4颗的平均用量翻3倍。现在800万像素摄像头模组成本在300元以内(2

    2025年02月10日
    28
  • 恒生科技指数涨超2%!洪灏称港股目前仍处于交易性行情

    2月12日消息,港股三大指数高开高走,恒生指数涨1.68%,恒生科技指数涨超2%,国企指数涨1.73%。  思睿集团首席经济学家洪灏,近日分享了对关税、港股以及DeepSeek等热点话题的最新观点。他认为港股目前仍处于交易性行情,要打破当前的交易区间需要新的逻辑和中国市场的根本性变化。  他提

    2025年02月12日
    27
  • 外媒:英国首相称,准备在必要时向乌克兰派兵

      【环球网报道记者姜蔼玲】据法新社、英国《卫报》报道,英国首相斯塔默当地时间16日表示,如有必要,英国准备向乌克兰派兵,以确保英国和欧洲的安全。  《卫报》称,据悉,这是斯塔默首次明确表示,他正在考虑向乌克兰派遣英国维和部队。  泽连斯基和斯塔默(右)资料图片图源:外媒  斯塔默在英

    2025年02月17日
    17
  • 北汽集团自主板块加速调整,北汽股份陈巍辞任董事长

    来源:@究竟视频微博【北汽集团自主板块加速调整,#北汽股份陈巍辞任董事长#】在北汽蓝谷更换企业名称后,北汽集团旗下另一自主业务板块北京汽车股份有限公司(下称“北汽股份”)在人事调整层面迎来了调整。2月23日晚间,北汽股份公告显示,陈巍因工作变动已于2月19日向董事会递交辞任声明,不再担任本

    2025年02月25日
    21
  • 通胀预期升温或倒逼美联储加速紧缩?

    来源:华尔街见闻近期美国消费者对于未来12个月的通胀预期已上升至一年以来的最高水平。而如果通胀预期持续上升,美联储可能被迫采取更激进的紧缩政策,包括加快加息步伐或推迟降息。在经历了数十年来最严重的通胀冲击后,美国民众再次为物价上涨做准备。根据21日的密歇根大学的消费者调查数据,近期美国消费者对

    2025年02月26日
    17
  • 资本市场枢纽功能彰显 助力消费投资良性循环

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  本报记者 吴晓璐  资本市场在我国经济发展中的战略重要性进一步提升。近日,中共中央办公厅、国务院办公厅印发的《提振消费专项行动方案》(以下简称《方案》)提出,拓宽财产性收入渠道。其中,股市成为拓展财产性收入、助力消费

    2025年03月18日
    10
  • 光大期货:“对等关税”口径软化,金价出现调整

      3月24日,COMEX黄金先涨后跌,报收3017.6美元/盎司,跌幅0.13%。国内SHFE金夜盘震荡走低,报收704.28元/克,跌幅0.09%。  特朗普称,将于4月2日开始实施的“对等关税”可能比此前预期更具“针对性”,这一消息提振了市场信心。据悉,特朗普本周一表示将在未来几天宣布

    2025年03月25日
    10
  • 白宫贸易顾问纳瓦罗称欧盟需要降低包括增值税在内的非关税壁垒

      白宫贸易顾问纳瓦罗(PeterNavarro)周一表示,欧盟如果想达成协议降低美国总统特朗普征收的关税,就必须降低非关税壁垒,包括由增值税造成的壁垒。  纳瓦罗说,欧盟愿意与特朗普谈判降低关税只是“一个良好的、小的开端”,但非关税壁垒,也包括食品安全法规,比关税率重要“重要几个数量级”。

    2025年04月07日
    3

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年01月27日

    我是吹吹讯的签约作者“admin”!

  • admin
    admin 2025年01月27日

    希望本篇文章《DeepSeek超越OpenAI的秘密武器:创新》能对你有所帮助!

  • admin
    admin 2025年01月27日

    本站[吹吹讯]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年01月27日

    本文概览:专题:DeepSeek为何能震动全球AI圈   当前,全球AI社区正在疯狂热议一种新的开源推理模型DeepSeek R1。...

    联系我们

    邮件:吹吹讯@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们