2457亿，全球最大巨量模型“源”发布：怎么用，挑战在哪儿？

作者 :钛媒体 App 2021-10-01 21:56:52 审稿人 : admin 围观 : 次评论

图片来源@视觉中国 F4w曹操读书网

图片来源@视觉中国F4w曹操读书网

浪潮日前发布的巨量模型源1.0引起了业界专家的关注。据说该模型参数规模达到了2457亿，训练采用的中文数据集达5000GB。相比OpenAI 去年推出的GPT-3模型（1750亿参数量，570GB训练数据集），源1.0参数规模领先40%，训练数据集规模领先近10倍。因此，浪潮源1.0也被称为全球最大规模的人工智能巨量模型。F4w曹操读书网

在源1.0发布当日，浪潮还同步举行了一个研讨会，来自国内自然语言理解领域的近20位专家、院士参加研讨，就巨量模型的应用前景与挑战都发表了个人看法。F4w曹操读书网

源1.0是什么？怎么用？

就像上文提到的，源1.0是用5000GB的中文数据集训练而来，所以源1.0本质上是一个偏向于中文语言的巨量模型，且其未来应用的突破点也主要会在NLP（自然语言处理）领域进行先期切入。F4w曹操读书网

在传统的人工智能语言模型训练中，由于计算资源等各种条件限制，业界的语言模型往往针对某个小场景，通用性不强。而由于巨量模型采用的数据集够大、形成的参数规模也够大，最终模型的通用性也会比较高，是真正的“见多识广”。F4w曹操读书网

但由于巨量模型在前期训练的过程中需要消耗的计算资源太大，所以一般业界做这种尝试的并不多。此前，全球已经推出千亿级巨量模型比较典型的是OpenAI 的GPT3模型，其参数模型达到了1750亿。F4w曹操读书网

据了解，源1.0参数量高达2457亿，训练采用的中文数据集达5000GB,相比GPT3 1750亿参数集、570GB训练数据，参数集规模提升了40%，训练数据规模提升近10倍。F4w曹操读书网

巨量模型训练出来了，有什么价值，亮点在哪儿？我们拿AI作诗举例。F4w曹操读书网

一般情况下，让人工智能写一首诗之前，首先要有一个学习了大量唐诗宋词的模型出来，人工智能才能自动填词。但是由于这个小模型只学习过唐诗宋词的语料，如果撰写文章，这类模型则很难完成。巨量模型就不同了，由于它提前学习的海量预料中包含了唐诗宋词、各种文体作文、甚至还是有明星八卦，所以无论问它什么，它好像都能从容作答。F4w曹操读书网

F4w曹操读书网

现场，浪潮人工智能研究院首席研究员吴韶华展示了它为源1.0的设置的指代、推理、理解等多方位的问题，比如完形填空，让AI在空白处填写正确的成语，它回答的都分毫不差。吴韶华也说，除此之外，巨量模型在写300-500字的主题创作上，也能够顺利完成。也就是说，有了巨量模型，在不久的将来，让成熟的文档自己写稿的日子或许真的指日可待了。F4w曹操读书网

挑战在哪儿?

在过去4个月里，一群浪潮AI专家，把近5年互联网内容浓缩成2000亿词，让AI在16天内读完，终于炼成了“源1.0”。源1.0的成果得到了在座专家的一致肯定。不过对于源1.0的应用以及后续迭代上，大家也都毫不讳言。其中，受到关注最多的问题是，源1.0这样的巨量模型怎么能够跟产业场景结合，怎么能够落地使用。F4w曹操读书网

在场景落地上，巨量模型首要挑战有两个，一是能不能找到杀手级应用；二是，巨量模型中包含的千亿参数怎么在低功耗的情况下落地。F4w曹操读书网

对于第一个挑战，当前业界还没有最佳实践可循，巨量模型的市场化表现还有待观察。与会专家抛砖引玉指出，希望可以在中文输入法、语音翻译质量（特别是方言场景）、谣言识别、智能客服、客户端个性化推荐等场景上看到巨量模型有所作为。F4w曹操读书网

不过也有专家指出，源1.0主要针对的是语言模型，但当前实际业务中，多模态模型需求是个趋势，他们希望源1.0不仅是针对中文文本的模型，在视频、图片、声音等多模态语境甚至是多语种语境中也能有所作为。F4w曹操读书网

对于巨量模型低功耗落地的问题，浪潮信息副总裁刘军回应称，人工智能巨量模型在发展过程中，势必会经历“把一本书读厚，再把一本书读薄”的过程。浪潮人工智能研究院正在基于对巨量模型规律的了解和掌握，用一些科学和技术方法在保证模型效果的情况下，降低参数，进而降低使用功耗和在产业落地的门槛。“至于能不能降到像大家非常关心的在手机上用，我们今天不能保证，但是至少会朝着这个方向去做。”刘军说。F4w曹操读书网

从技术上来说，专家们也表达了对巨量模型的可解释性和表现稳定性上的期待，原因在于，在实际落地的过程中，巨量模型即使有90%的可靠性，另外10%的风险也会给实际应用带来业务上的挑战。F4w曹操读书网

当然，源1.0模型的成功也让学界和产业界都看到了巨量模型背后的奇妙之处。“为什么在学习了海量数据集之后，计算机可以自己解释海量问题？它背后的计算肌理是否发生了变化？”这些问题都要留待更深入的研究。F4w曹操读书网

“浪潮今天已经把这个模型训练出来了，证明了效果，下一步会开放出来，让学术界和产业界大家都去用。这样使得我们在这方面的巨量人财物的投入能够成为学术界和产业界前进助推剂。”刘军总结。他相信，在学界和产业界的深入合作中，领先的智能模型、以及杀手级应用一定能够成为推进社会智能化的一部分。（本文首发钛媒体App，作者 | 秦聪慧）F4w曹操读书网

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体AppF4w曹操读书网

核心关键字：人工智能

标签巨量模型人工智能

上一篇：IASP主席首次由中国科技园区代表陈鸿波出任下一篇：返回列表

从理想照进现实，中国凭什么快速落地人工智能算力网络？

图片来源@视觉中国文丨智能相对论，作者丨曾响铃2021年5月底，国家发展改革委、中央网信办、工业和信息化部、国家能源局共同印发了《全国一体化大数据中心协同创新体系算力枢纽实施方案》，在这个方案中，关于算力资源的统筹协同发展在宏观层面定下了调，一个未来网络新愿景浮现出来；仅仅时隔四个月，在刚刚举办的华为全联接2021上，中国科学技术信息研究所、AITISA（新一代人工智能产业技术创新战略联盟）、鹏城...
2021-09-28 09:57:43 人工智能计算中心网络
2021中关村论坛首日，世界最大智能模型“悟道”助力冬奥

【猎云网北京】9月27日报道9月24日，由科技部战略规划司、高新技术司，北京市科委、中关村管委会，海淀区人民政府主办，北京智源人工智能研究院（以下简称“智源研究院”）承办的2021中关村论坛“人工智能与多学科协同创新论坛”在京成功举办。人工智能与多学科协同创新论坛科技部战略规划司副司长张旭、北京市副秘书长刘印春、清华大学副校长曾嵘、北京大学科学研究部部长张宁出席论坛并致辞。论坛由智源研究院院长黄铁...
2021-09-27 17:51:35 模型人工智能智源
知识产权强国建设纲要出台，加快大数据、人工智能、基因技术等知识产权立法

创头条9月23日消息近日，中共中央、国务院印发的《知识产权强国建设纲要(2021-2035年)》提出，要加快大数据、人工智能、基因技术等新领域新业态知识产权立法，建立健全新技术、新产业、新业态、新模式知识产权保护规则。纲要明确，建设面向社会主义现代化的知识产权制度，需要构建门类齐全、结构严密、内外协调的法律体系。同时，构建响应及时、保护合理的新兴领域和特定领域知识产权规则体系。纲要指出，在建立...
2021-09-23 17:55:49 知识产权纲要知识产权保护
人工智能计算中心，助力数字经济发展的算力“虫洞”

图片来源@视觉中国文|脑极体在线教育、远程医疗、居家办公……种种数字经济新应用的蓬勃发展，带给全社会的改变超乎想象。因此疫情之后，中国的数字经济建设明显进入了“加速度”。十九届五中全会中提出，要加快数字化发展，发展数字经济，推进数字产业化和产业数字化，推动数字经济和实体经济深度融合，打造具有国际竞争力的数字产业集群。当发展数字经济上升为国家战略，自然需要与之匹配的数字基础设施。在第四次工业革命的热...
2021-09-16 11:52:34 人工智能计算中心城市
汽车人工智能与七个月的孩子谁更聪明？

文丨来咖智库7个月大以后，多数孩子都已经学会了移出视线的物体仍然存在。把玩具放在毯子下面，孩子会知道玩具还在那里，并且可以伸手把它从毯子下面取回来。这种对于“物体永久性”的理解是常见的发展里程碑，也是基本的现实原则。但这也是自动驾驶汽车所不具备的，这会是一个问题。自动汽车越来越好，但它们理解世界的方式仍然与人类不同。在自动驾驶汽车看来，被经过的货车暂时挡住的自行车已不再存在。对于现在广泛存在的僭取...
2021-09-08 10:59:15 人工智能机器汽车
IDC：2025 年中国人工智能市场总规模将超 160 亿美元

IDC于近日发布了《2021年V2全球人工智能支出指南》（IDCWorldwideArtificialIntelligenceSpendingGuide），从人工智能（AI）技术、垂直行业、应用场景、部署类型等多个维度对未来五年（2021-2025）全球AI相关IT投资规模进行预测，同时回顾了2020年的市场发展情况。以下是详细内容：人工智能市场概览IDC预测，全球AI市场支出将在2021年达到8...
2021-09-01 10:13:40 人工智能支出维度
人工智能，也应该学会遗忘

图片来源@视觉中国文|每日科技前瞻我们的故事还是从AlphaGo这里说起，无他，我实在是太喜欢这个小家伙了。在AlphaGo的棋盘招式中，偶有出现之前出现在棋谱里的招式。他通过强化学习，“记住”（至少是我们认为那个意义上的记住）了围棋的局面较优解。这样超凡的学习能力和“记忆力”（虽然运行方式和人类的记忆不同）是AI在这些方面超越人类，出类拔萃的保障之一。如果把我们代入人工智能的视角，有了这样的记忆...
2021-08-24 17:53:06 人工智能记忆也是
圆桌论坛：DAO开放治理模型的社会化属性 | 2021赛博北京·数字艺术节

链得得、钛媒体集团、CryptoC发起主办的第一届“赛博北京·数字艺术节”于8月7日至8月10日在线上举办。在橙皮书创始人李阳的主持下，DAOSquare发起人Typto、OGLabs创始人&ICPL联合创始人Blockpunk、BeepCrypto创始人&WHALEChiefpartner MiaBao展开了主题为“坐而论DAO”的圆桌讨论，针对“DAO的发展现状与问题”“DAO与公司化结构的差...
2021-08-10 16:18:46 的人区块项目
阿里云发布数字化转型成长模型，建立“数字样板工程”

创头条消息，8月3日，阿里云在2021数字化转型影响力峰会上发布数字化转型成长模型，并宣布启动“2021数字样板工程巡礼”活动，建立“数字样板工程”长效运营机制，服务行业及区域的数字化转型。据阿里云智能政策与战略中心主任李颋介绍，过往几年，阿里云与众多客户在数字化转型方面做了有益的探索，并归纳出面向未来、立足成长的数字化转型模型。模型研究显示，企业数字化转型的关键能力包括战略、素养、组织、业务、技...
2021-08-03 15:59:32 阿里数字样板
技术革命下新锐品牌的“四力模型”

图片来源@视觉中国文丨王智远零售就像四维空间，在加速构建“点线面体”。在《三体》中，外星种族“歌者文明”扔出张名片大小的二向箔，太阳系成为二维化视角呈现。刘慈欣认为在四维空间中，三维物体的内部结构可以被人透视，人清晰可以看到人体的无限细节，骨骼，内脏，细胞，血液和心房间的流动。在中国零售40年的变迁中，我们甚至很难找到更为贴切的词语来表述其履历的厚重感。若将发展四维化来看，那早已从原始线下单点交易...
2021-08-02 19:00:32 品牌新锐技术