分享好友 资讯首页 资讯分类 切换频道

工程院院士与DeepSeek过了一招 到底什么状况?

2025-03-03 10:4047056之窗百科网信网
 工程院院士与DeepSeek过了一招。美国当地时间2月17日晚间,马斯克旗下的人工智能公司xAI发布了最新人工智能模型Grok 3。在这场直播发布中,DeepSeek成为屡次被提及的比较对象,以此展示Grok 3的性能。前几年,中国企业每每推出模型时,都要和GPT-3.5、GPT-4进行对比。如今,Grok 3的主要比较对象变成了DeepSeek,这再次证明了DeepSeek在全球人工智能行业中的影响力。

工程院院士与DeepSeek过了一招
工程院院士与DeepSeek过了一招

过去,人工智能领域信奉“大力出奇迹”,即通过增加模型规模、数据量和计算资源来显著提升模型性能。而DeepSeek则开辟了一条新路,以低成本、高效率的方式改写了行业竞争法则,给全球人工智能界带来新的启示。早在DeepSeek“出圈”之前,青岛的人工智能企业就开始关注这个“不走寻常路”的新物种,并在DeepSeek推理模型推出的第一时间积极拥抱,用以提升自家行业模型能力。

对青岛的人工智能企业来说,DeepSeek的到来将加速大模型在各行各业的应用,为垂直领域的行业大模型带来新的机遇。但当前再强大的通用大模型对行业专业知识的理解仍有不足,大模型要在各个行业中真正发挥作用仍需学习更多专业知识,垂域大模型还有许多工作要做。

没有人会否认,DeepSeek是继ChatGPT之后全球人工智能领域最引人注目的产品。某种意义上,DeepSeek对于推动全球人工智能发展的意义要远甚于ChatGPT。如果说ChatGPT展示了大模型的强大,那DeepSeek则表明最强的大模型并非遥不可及。

更低的算力成本和开源路线,是DeepSeek与ChatGPT最显著的区别。正是基于这两点,DeepSeek改变了现有全球AI的竞争规则。算法、算力、数据被称为人工智能三要素。自ChatGPT引发全球大模型浪潮以来,算力的重要性不断上升。然而,DeepSeek重构了这种以算力为中心的竞争规则。通过多元专家混合的模型架构,DeepSeek V3版本的训练成本仅为600万美元,显著低于此前海外主流大模型的成本。中国工程院院士李国杰认为,DeepSeek的创新不仅是技术上的突破,也是发展模式上的颠覆性创新。(来源:信网)

收藏 0
打赏 0
继续提振消费、实施好育儿补贴……财政部部署六方面重点工作
财政部今日发布2025年上半年中国财政政策执行情况报告。报告指出,下一步,财政部将重点做好以下六方面工作:(一)用好用足更加积极的财政政策。压实预算执行责任链条,将提高资金使用效益和保障资金安全有机结合起来,推动资金和政策尽快落地见效。继续实施好提振消费专项行动,对重点领域的个人消费贷款和相关行业经营�

0评论2025-11-0911

卢浮宫馆长称在劫案中受损的皇冠将修复重展
当地时间11月7日,法国卢浮宫馆长表示,在卢浮宫盗窃案中受损的欧仁妮皇后的皇冠将被修复并重新对公众展出。馆长表示,“这需要一点时间,但将成为卢浮宫重生的美丽象征”。卢浮宫馆长在接受媒体采访时证实,欧仁妮皇后皇冠很可能是在展柜被割开时受损,割口由切割机造成。根据卢浮宫装饰艺术部团队的初步检查�

0评论2025-11-0911

市场监管总局指导8家平台企业发起食品安全管理自律公约
近日,为强化落实食品安全主体责任,营造安全放心的网络食品消费环境,市场监管总局指导京东、美团、拼多多、抖音电商、小红书、淘宝、微信小店、快手电商8家网络食品交易第三方平台企业共同发起并签署《网络食品交易第三方平台食品安全管理自律公约》(以下简称《公约》)。提升网络食品安全水平,核心在于落实责任,关�

0评论2025-11-0911