全国政协委员周鸿祎:要继续如履薄冰地前行保持优势

发布日期:2025-03-04     来源:

【字体:

【颜色:

浏览量:

连日来,中国人工智能企业深度求索DeepSeek推出的开源大模型,凭借性能优越、免费商用、训练成本低等优势,在全球引发高度关注。这一成果不仅为我国人工智能领域注入新活力,也激发了更多业内专业人士的思考。近日,团结报记者专访了全国政协委员、九三学社中央委员、360集团创始人周鸿祎。作为国内科技行业的领军者,周鸿祎结合360集团(以下简称“360”)在人工智能领域的探索,剖析前沿成果,分享独到见解,为读者展望了人工智能未来发展方向。

1.jpg

周鸿祎

DeepSeek为应用生态爆发奠定了基础

记者:DeepSeek推出性能优越、免费商用且训练成本低的开源大模型,在国际上引起广泛关注。从技术角度来看,它有哪些突出创新点和独特优势?从经济和市场角度来看,您认为DeepSeek会对全球人工智能产业的投资格局、市场竞争态势造成哪些影响?

周鸿祎:

第一,DeepSeek实现了技术范式的重大突破。其核心是从预训练范式转向强化学习范式的推理模型,DeepSeek-R1能够对复杂问题和任务进行逻辑拆解与规划,具备归纳总结和反思改进能力。最显著的突破在于其开放性:通过探索强化学习技术路径并坚持开源,DeepSeek大幅提高了全球推理型大模型研究的起点。DeepSeek—R1基于强化学习技术减少了对人类数据的依赖,为发展真正超越人类的AGI(人工通用智能,是指具备与人类相当或超越人类的广泛认知能力的人工智能系统)提供了可能性。

第二,DeepSeek实现了用户体验的颠覆性突破。春节期间,DeepSeek-R1在零广告投入的情况下7天增长1亿用户,创最快应用破亿里程碑,关键就在于优化用户体验。和其他预训练模型相比,DeepSeek-R1更能理解用户需求,并通过展示完整的思维链条增强用户信任,极大降低了用户的使用门槛。这把AI从过去的不可用、凑合用,变成大家都能用、都爱用,加速了中国爆发AI产业革命的步伐。

第三,DeepSeek以开源免费模式提供顶尖性能模型,打破了闭源垄断的市场格局,倒逼行业巨头转向开源生态。各国政府、企业、云厂商纷纷接入,使DeepSeek的开源技术成为全球AI的“根技术”,加速中国在全球AI领域跻身领先地位。同时促使全球公司、开发者等纷纷转向开源阵营,人人为我,我为人人,实现了新时代的集中力量办大事。

第四,DeepSeek降低了对硬件的要求,打破了堆算力、堆显卡的“大力出奇迹”模式,减少了推理成本、训练成本。同时政府和企业无需训练自己的基座模型,实现了“下载就能用”。另外,DeepSeek公开了模型蒸馏方法(一种将大型复杂模型的知识迁移到小型简单模型的技术,通过压缩模型参数和计算资源需求,同时尽可能保留模型性能),实现了像“工业母机”一样,用模型制造模型。

第五,DeepSeek的免费模式惠及全球人民,让大模型从“原子弹”变成了“茶叶蛋”,促进了科技普惠、科技平权,技术平民化。

对Deepseek的恶意网络攻击暴露AI面临的安全挑战

记者:DeepSeek作为备受瞩目的开源大模型,却频频遭受网络攻击,这无疑为整个开源模型领域敲响了警钟。从网络安全视角出发,您认为开源模型应该采取哪些有效措施,才能成功走出这样的安全困境?

周鸿祎:

大模型是数智化时代的重要基础设施,其应用贯穿众多行业和领域,但伴随而来的安全挑战同样不容忽视。大模型的开发、训练、推理和应用涉及复杂的软件生态系统,保障大模型安全,不仅是维护企业利益的关键,更是确保社会公共安全的必要举措。要加强大模型的安全性和可控性,既要保护好网络和数据安全、用户隐私安全,确保大模型的内容和行为合法合规,又要符合伦理道德,有正确的价值观。

据我所知,此前部分国家动用了“僵尸网络”针对DeepSeek进行攻击?,开辟网络攻击新战场。攻击者通过恶意消耗大模型服务器资源,导致服务不可用,严重影响用户体验和企业声誉。

针对DeepSeek等大模型服务应用遭受相关攻击的问题,360均有相关的安全解决方案。其中,解决大模型服务应用受到拒绝服务攻击、用户不可用的问题,可通过以下两种方案解决:(1)360安全云:通过360安全云为客户提供SaaS(软件运营服务)化云端网站安全防护能力;(2)360安全云服务:通过360安全云为客户提供DDoS攻击检测(分布式拒绝服务攻击,一种常见的网络安全攻击方式,主要通过恶意流量消耗网络或网络设备的资源,从而导致网站无法正常运行或在线服务无法正常提供)、网站可用性监测、篡改监测等7×24小时的安全云服务。此外360还可实现全链路安全检测,覆盖了从数据收集、模型训练,到模型推理、用户交互的大模型生命周期安全检测等。

对于未来DeepSeek-R1在政府、企业各类业务场景中实现大规模部署后可能引发包括客户端安全、知识安全、模型安全等一系列问题,360提出“以模制模”新解法,以人工智能重塑安全,用安全大模型应对大模型自身的安全问题。 

“要继续小心翼翼、如履薄冰地前行”

记者:美国长期在人工智能领域处于领先地位,DeepSeek的出现被很多人视作中国人工智能发展的重要突破。这是否是中国在人工智能领域实现“换道超车”美国的关键节点?

周鸿祎:

中美在大模型方面的差距并不大,DeepSeek-R1的出现表明中国正在从技术上实现了对美国的赶超,掌握了通向AI下一阶段的方法论。

目前,在国际上也有很多人对DeepSeek非常认可和支持。《Nature》发表了一篇文章,探讨了DeepSeek开源AI模型在科学研究领域的广泛应用。他们做了多项测试,表明DeepSeek在数学和科学问题的解决能力上,可以与OpenAI的o1模型相媲美。尽管DeepSeek-R1并不能解决所有既定任务,但它的高性价比为全球科学家提供了一种新工具,可以用于科学家定制以及训练自己专门的推理模型,以适应不同领域的科学研究。

一方面我们祝福和支持DeepSeek,另一方面我们还应该看到,不能被这个小小的胜利冲昏了头脑,而是要继续小心翼翼、如履薄冰地前行,保持住这种优势。

DeepSeek的开源实践揭示了一条“以开放破封锁、以协作促创新”的中国AI发展路径。未来,随着开源成为AI创新的主战场,开源模式可能进一步瓦解传统技术霸权,成为我国推动人工智能发展的基本策略。DeepSeek对构建AI开源生态有几点启示:

第一,开源是打破技术垄断的“战略武器”。DeepSeek通过全栈开放,引发了开源社区、云平台、芯片企业、AI应用开发者纷纷转向DeepSeek,证明开源模式能快速突破国际技术封锁,降低行业壁垒,形成技术扩散的“蒲公英效应”。

第二,开源正在超越闭源,成为产业主流共识。长期以来,AI产业一直存在开源路线和闭源路线孰优孰劣之争。DeepSeek-R1模型在强化学习训练强推理能力上的技术突破,使得开源第一次追平OpenAI所主导的闭源模式,打破了闭源神话,并且使得开源成为全行业的多数共识。

第三,生态协同优于单点技术突破。DeepSeek的成功不仅是模型性能的单点技术突破,更在于通过开源带动了云平台、开发者社区等生态伙伴的生态协同,引发了一场全球范围的你追我赶、群体创新的技术扩散热潮,形成了超越单点技术突破的协同效应。

人工智能不仅是新一轮科技革命和产业变革的重要驱动力量,更是我国赢得全球科技竞争主动权的重要战略抓手。以开源作为打破霸权、化被动为主动的突破口,把开源生态建设与核心技术攻关结合,构建国内和国际人工智能发展新格局,未尝不是一个好的方法。

AI技术助力个人成长和创新创业

记者:随着DeepSeek这样的人工智能技术不断发展,一些重复性、规律性强的工作可能会被替代。从职业发展角度看,您认为哪些职业会面临较大挑战?

周鸿祎:

DeepSeek的开源和低成本使得个人也能够实现拥有自有大模型,实现超能力,成长为超级个体,每个创作者都能拥有堪比科技公司的AI能力。AI个体户可以通过接单赚钱,实现自我价值和经济收益。游戏编剧使用70亿参数模型构建“剧情引擎”,可以实现单人年产3部AAA级剧本;自由翻译者通过领域蒸馏模型,接单效率提升40倍。这种现象催生新经济形态,个人在AI技术的助力下能够更好地进行创新和创业,为经济增长注入新的动力。

AI是未来职场的核心竞争力,对于即将步入职场或面临职业转型的人来说,不会使用AI的人将被熟练运用AI工具的人取代。但是,AI的目的并非替代人类,而是提升人类效率。无论是利用AI工具进行写作还是编程,通过AI工具,普通人的创意和执行力可被成倍放大。

“AI正式进入‘水电煤’式基础设施时代”

记者:有报告指出,DeepSeek的出现将推动软件、数据、半导体、互联网、电动汽车等多个行业的发展。您是否认同这一观点?除了这些行业,您认为还有哪些行业会因DeepSeek迎来新机遇?

周鸿祎:

DeepSeek的出现使AI服务的价格大幅降低,这一现象类似于当年互联网上网套餐的价格战,最终使得互联网服务变得普及和实惠。AI服务的降价不仅让更多企业和开发者能够负担得起,也促进了AI技术的广泛应用和普及。这种价格的降低将进一步推动AI产业的发展,使其成为一种基础性的服务,为各行各业提供支持和赋能,AI正式进入“水电煤”式基础设施时代。

DeepSeek的崛起促使投资者重新审视大模型公司的价值,更多投资开始转向AI支撑赋能的软硬件产品应用。投资者开始意识到,AI产业的未来发展不仅仅取决于算力的提升,更在于技术创新和成本效益。因此,资金的流向可能会发生改变,即从单纯追求高端算力的投资转向更加注重技术创新和成本控制的企业和项目。这一投资逻辑的转变,将对AI产业的发展产生深远影响,推动产业朝着更加高效、低成本的方向发展。

为全球AI竞争提供中国方案

记者:目前国内人工智能公司众多,产业生态逐渐形成。您认为国内的人工智能公司之间应如何加强合作与资源共享,以利用DeepSeek带来的技术红利,共同提升中国人工智能产业在全球的竞争力?

周鸿祎:

DeepSeek的技术突破为中国AI产业提供了“换道超车”的契机,当前也有多家国内的科技企业不同形式地接入了DeepSeek大模型。360在2024年7月与DeepSeek展开官方合作,在产品中对其大模型进行接入;今年1月,360已在纳米AI中接入DeepSeek-R1的官方API(应用程序编程接口),提供给用户免费使用。而在DeepSeek遭遇算力危机后,360也快速在安全专线机房部署了上万张GPU(图形处理器)来支持纳米AI用户免费使用DeepSeek-R1满血版。目前360已经成为除DeepSeek外免费提供R1模型服务的第二大供应商。

国内企业与DeepSeek的合作呈现技术互补、场景适配、生态共建三大特征,这一合作模式不仅加速了AI技术落地,更通过国产化供应链的合作打破了外部技术封锁,为全球AI竞争提供了中国方案。这种全链路的国产化AI发展模式,符合中国在数字经济时代的战略布局,有助于推动AI成为实体经济加速发展的新动能,还能在国际竞争日益激烈的AI领域中,增强中国的话语权和竞争力。

产学研合作聚焦“小切口,大纵深”

记者:在DeepSeek引发的人工智能发展浪潮下,政府、企业和科研机构在推动人工智能产业发展中应扮演怎样的角色?如何加强三者的协同合作,实现产学研用的深度融合?

周鸿祎:

人工智能的产学研合作应聚焦“小切口,大纵深”场景:例如医疗、教育、城市治理等领域,政府开放细分场景,企业提供定制化解决方案,科研机构优化算法模型,形成垂直领域的深度应用。

其中,政府应扮演顶层设计与生态护航者的角色,包括制定支持人工智能高质量发展的专项政策,明确技术路线和产业方向,并通过开放城市治理、公共服务等场景,为大模型垂直化落地提供“试验田”,以及通过法律框架,如《生成式人工智能服务管理暂行办法》明确人工智能数据开放、模型安全等规则和范围,同时推动制定通用大模型安全标准体系,联合企业开展安全评测与风险应对。

企业方面,应积极将自身业务流程与人工智能深度融合,推动“数转智改”。其中大型科技企业可带头参与开源项目,与科研机构合作构建开放生态,避免“重复发明轮子”,同时借鉴DeepSeek的“模型蒸馏+行业适配”路径,大幅降低大模型成本,实现AI普惠。

科研机构应扮演好基础研究与人才培养基地的角色,重点实验室和高校需聚焦人工智能基础理论与核心技术突破,通过“产研协同”模式与企业联合攻关产业化难题,培育既懂技术又熟悉产业需求的人才,例如通过联合实验室、实习基地等方式实现人才定向输送等。

“将大模型作为打造新质生产力的引擎”

记者:我们看到近年来360在人工智能领域持续发力,面对市场上激烈的竞争以及各类新兴技术的不断涌现,您认为360如何基于自身技术优势和安全基因,在人工智能的应用场景拓展方面实现差异化突破?

周鸿祎:

进入人工智能时代,作为中国数字安全的领军企业和互联网免费安全服务的倡导者,360以“安全+AI”为双主线战略,通过技术自研与场景应用协同发展,抢占AI产业制高点。技术自研方面,360响应国家“人工智能+”行动号召,将大模型作为打造新质生产力的引擎,与传统行业“数转智改”结合,推出企业级AI大模型解决方案,进一步服务产业数字化,帮助企业、城市和政府深度定制“可靠、向善、可信、可控”的垂直大模型,完成智能化升级。截至目前,360已为政务、交通、文旅、医疗等近20个行业提供大模型企业级解决方案,并成立大模型产业联盟,与生态合作伙伴携手共同为产业数字化场景赋能。

AI大模型安全成为世界前沿课题,也是360努力攻克的方向。360提出了“安全、向善、可信、可控”的四大原则,并推出多款相关产品,如大模型系统安全检测平台“360智鉴”、大模型内容安全护栏“360智盾”、大模型可信增强工具“360智搜”等。上述工具可以帮助企业在大模型上线前进行全方位的安全评估,满足不同场景的风控需求。

360坚持核心技术研发,首创大模型安全风险评估体系“AISE”为国产大模型发展筑牢安全底座。此外,360还实现人工智能与安全的双向奔赴,发布了国内首个免费的可交付安全行业大模型“360安全大模型”,安全垂直能力已超过GPT-4(OpenAI为聊天机器人ChatGPT发布的语言模型)。同时,360安全大模型进一步实现了对全网安全知识的深度理解,做到本地安全大脑在封闭网络下也能使用全网知识的重大突破。

人工智能应用方面,360去年11月底推出的“纳米AI”,并在最新版本中接入了DeepSeek-R1联网满血版(671B参数)和DeepSeek-R1高速专线(32B参数)模型,与官方版本的DeepSeek相比,纳米AI在更加稳定、顺畅使用DeepSeek-R1联网满血版模型的同时,也支持语音搜索、拍照问答,以及一句话生成图片和一张图生成视频等功能,大幅扩展R1模型的应用范围。此外,纳米AI还集成了包括豆包、文心一言、通义千问等国内16家大模型厂商的50多款模型,用户可根据实际需求切换模型,并可实现模型之间的相互协作。无论面对复杂的学术研究难题,还是日常生活中的琐碎疑问,用户都能获得快速且稳定的精准回答。用户还可借助纳米AI打造个人的专业知识库和智能体,拥有属于自己的AI工具和数字助手。

2.jpg

团结报2025年3月1日四版

(来源:团结报团结网  作者:李筱)