分享好友 资讯首页 资讯分类 切换频道

工程院院士与DeepSeek过了一招 到底什么状况?

2025-03-03 10:4024056之窗百科网信网
 工程院院士与DeepSeek过了一招。美国当地时间2月17日晚间,马斯克旗下的人工智能公司xAI发布了最新人工智能模型Grok 3。在这场直播发布中,DeepSeek成为屡次被提及的比较对象,以此展示Grok 3的性能。前几年,中国企业每每推出模型时,都要和GPT-3.5、GPT-4进行对比。如今,Grok 3的主要比较对象变成了DeepSeek,这再次证明了DeepSeek在全球人工智能行业中的影响力。

工程院院士与DeepSeek过了一招
工程院院士与DeepSeek过了一招

过去,人工智能领域信奉“大力出奇迹”,即通过增加模型规模、数据量和计算资源来显著提升模型性能。而DeepSeek则开辟了一条新路,以低成本、高效率的方式改写了行业竞争法则,给全球人工智能界带来新的启示。早在DeepSeek“出圈”之前,青岛的人工智能企业就开始关注这个“不走寻常路”的新物种,并在DeepSeek推理模型推出的第一时间积极拥抱,用以提升自家行业模型能力。

对青岛的人工智能企业来说,DeepSeek的到来将加速大模型在各行各业的应用,为垂直领域的行业大模型带来新的机遇。但当前再强大的通用大模型对行业专业知识的理解仍有不足,大模型要在各个行业中真正发挥作用仍需学习更多专业知识,垂域大模型还有许多工作要做。

没有人会否认,DeepSeek是继ChatGPT之后全球人工智能领域最引人注目的产品。某种意义上,DeepSeek对于推动全球人工智能发展的意义要远甚于ChatGPT。如果说ChatGPT展示了大模型的强大,那DeepSeek则表明最强的大模型并非遥不可及。

更低的算力成本和开源路线,是DeepSeek与ChatGPT最显著的区别。正是基于这两点,DeepSeek改变了现有全球AI的竞争规则。算法、算力、数据被称为人工智能三要素。自ChatGPT引发全球大模型浪潮以来,算力的重要性不断上升。然而,DeepSeek重构了这种以算力为中心的竞争规则。通过多元专家混合的模型架构,DeepSeek V3版本的训练成本仅为600万美元,显著低于此前海外主流大模型的成本。中国工程院院士李国杰认为,DeepSeek的创新不仅是技术上的突破,也是发展模式上的颠覆性创新。(来源:信网)

收藏 0
打赏 0
80斤女子吃网红药丸暴瘦至50斤 结果导致重度营养不良、排便困难!
近日,上海市第十人民医院接诊了一位令人揪心的患者——一名原本体重80多斤的女子,因盲目追求快速减肥,每日疯狂吞服至少150粒网红减肥药“小粉丸”,结果导致重度营养不良、排便困难,体重急剧下降至仅50斤,胳膊和大腿瘦得如同柴枝一般。

0评论2025-07-1714

开空调最好别低于这个温度 医生:科学使用,有效预防“空调病”
近日,医生发出健康提醒,建议民众合理调整室内空调温度,开空调时最好将温度设定不低于26℃。医生解释称,若空调温度调得过低,人长期处于冷风环境中工作生活,易引发头晕、头痛、食欲不振、发热咳嗽、关节酸痛等一系列症状,这些均为“空调病”的典型临床表现。

0评论2025-07-1713