全球信息:生成式AI之战，谁能破局而出？

2023-05-04 12:56:29 来源：互联网那些事

随着腾讯的入局，国内生成式AI大模型赛道集齐BAT三大巨头，竞争日趋白热化。

4月14日，腾讯云发布面向大模型训练的新一代高性能计算集群，搭载英伟达最新一代H800 GPU，服务器互联带宽高达3.2T，算力性能较上一代提升3倍，号称目前国内性能最强的大模型计算集群。

(资料图)

除了算力基础设施，腾讯去年6月发布混元大模型，微信也在去年10月发布WeML大模型。在上月底的财报电话会议上，腾讯总裁刘炽平表示，对于腾讯整个业务来说，AI及大模型是一个增长的扩大器。

在腾讯下场之前，百度、阿里和华为等公司已经先后落子这一领域。

3月中旬，百度推出“文心一言”；半个多月后，华为在一场行业峰会上披露了“盘古”大模型的研发及落地情况；4月11日，阿里大模型“通义千问”高调亮相，未来将接入阿里全线业务。

与此同时，360、网易、知乎、科大讯飞、昆仑万维等先后公布自己的大模型；此前淡出中心舞台的王慧文和王小川重出江湖，迅速敲定数千万美元的融资，正在四处招兵买马。

掀起新技术浪潮的AI大模型，已经成为科技公司必须参加的一场大考。在AI领域深耕多年的商汤科技，也在本月交出自己的答卷。

入局AI大模型“马拉松”

4月10日，商汤公布以“大模型+大算力”推进AGI（通用人工智能）发展的战略布局，并发布“日日新SenseNova”大模型体系，涵盖自然语言处理、图片视频及3D内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

其中，最引人关注的是“商量SenseChat”，一款千亿级参数的自然语言处理大模型。在现场演示中，SenseChat能够结合上下文语境，流畅准确地回答各类问题，还具备超长文本理解能力，可以从复杂文档中提取和概括信息，帮助开发者编程，提供个性化的健康咨询等。

此外，商汤还展示了多款基于大模型体系的生成式AI模型及应用：“秒画SenseMirage”AI内容创作社区平台可以根据文本生成图片，拥有超10亿参数，支持二次元、三次元等多种生成风格，最高支持6K分辨率，还可支持自行上传数据集进行finetune、自训练等功能，定制训练属于自己风格的LoRA模型，显著降低模型的训练门槛；“如影SenseAvatar”AI数字人视频生成平台仅需一段5分钟的真人视频素材，即可生成数字人分身；“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台能够生成大模型3D场景和精细3D物件，为搭建元宇宙虚拟空间提供高效、低成本的工具。

秒画SenseMirage可根据文本生成多种风格的高清图片

AI大模型是中国科技企业的又一块兵家必争之地。随着BAT等互联网公司，以及商汤、科大讯飞等AI老兵的入局，每个人都摩拳擦掌、跃跃欲试，准备大干一场。

业内人士普遍认为，国产大模型与GPT至少有2~3年的差距。怎样尽快赶上世界先进水平，是摆在大大小小玩家面前的命题。将这一命题拆解开来，最关键的是数据、算法和算力三大要素。

三要素中，算法的研发难度相对较低，且有众多开源项目可作为参考，中国公司最容易缩短甚至抹平差距；但在数据和算力方面，想要拉近与OpenAI的距离要困难得多。它需要更漫长的积累沉淀，也需要企业持之以恒地拿出真金白银，投入到AI相关的“硬科技”中。

这也意味着，大模型之争不是一场停留在应用层面的百米赛跑，而是一场由综合能力定胜负的马拉松。谁能在数据和算力上建立壁垒，谁就有望率先踏入生成式AI的新时代，在新技术浪潮中吃到更多红利。

数据和算力，AI大模型两大根基

ChatGPT之所以一鸣惊人、经受住了上亿用户不同场景下的考验，首先得益于OpenAI给它“投喂”了大量数据。

OpenAI此前披露，为了AI像人类那样流畅交谈，研发人员给GPT-3.5提供多达45TB的文本语料，相当于472万套中国“四大名著”。这些语料的来源包括维基百科、网络文章、书籍期刊等，甚至还将代码开源平台Github纳入其中。

丰富而庞大的语料库，让ChatGPT不仅能够聊天、讲故事，还会回答专业问题、帮学生写作业、给码农写代码。在一些读写测试中，ChatGPT展现出来的能力不亚于高中生。

与之类似，商汤语言大模型SenseChat也使用了大量数据进行训练，并充分考虑中文语境，能够更好地理解和处理中文文本。在发布会上，SenseChat一问一答应对自如，甚至还能够根据《专利法》答疑解惑，结合法条和最新资讯给出合理答案。

可以看出，足够多、足够丰富的数据，是生成式AI大模型的根基。商汤在这方面有自己的独特优势。

商汤的AI技术和产品已经在众多领域得到应用，在长期实践中，商汤积累了大量真实世界的高质量视觉数据，视觉信息可以转化为更多结构化的表达，形成丰富的多模态语料库，为大模型研发奠定基础。正如商汤董事长兼CEO徐立所言，“商汤积累了大量视觉类信息，这类信息作为知识，输入我们的多模态网络中，会带来完全不一样的数据基础。”不断增长的多模态数据池，让商汤从源头上建立了壁垒。

视觉大模型是商汤的核心技术突破点。早在2019年，商汤就发布了10亿参数的视觉大模型，2022年扩大至320亿参数，为迄今为止全球*的视觉模型。而在自然语言处理、多模态和生成式AI大模型方面，商汤也已有产品落地。这些大模型的迭代生长和融合汇聚，最终造就了商汤SenseNova大模型体系。

除了海量数据，大算力是大模型的另一个根基。

AI大模型所需要的计算量，大致上相当于参数量与数据量的乘积。而大模型之所以“大”，就是因为参数众多和数据量庞大。过去5年，AI大模型的参数量几乎每年提升一个数量级，例如GPT-4参数量是GPT-3的16倍，达到1.6万亿个；而随着图像、音视频等多模态数据的引入，大模型的数据量也在飞速膨胀。

这意味着，想要玩转大模型，必须拥有大算力。OpenAI在生成式AI赛道上一骑绝尘，关键能力之一就是*强大的算力底座。仅仅是为了跑出GPT-3.5模型，OpenAI就使用了约1万颗英伟达GPU来训练。

商汤很早就开始建设自己的算力底座。2018年前后，商汤就着手筹备大模型所需的算力、算法、数据等方面的工作；2022年1月，造价数十亿元的商汤人工智能计算中心（AIDC）交付使用，初始峰值算力达到3740 Petaflops，已具备完整训练万亿参数规模的大模型的能力。再加上数据层和模型层，商汤AI大装置逐渐成型。

如今，商汤的AI大装置SenseCore，依靠2.7万块GPU，其算力达到5000 Petaflops，可支持20个千亿参数超大模型同时训练，并提供涵盖数据、训练工具、推理部署、性能优化一条龙的大模型基础设施服务体系。

不过，AI大装置的效能如何，总算力并不是*指标。在日常应用中，AI大装置需要尽可能提高多卡并行状态下的算力利用率，尽可能保持长时间稳定运行。目前，SenseCore支持*4000卡并行单任务训练，实现了多卡并行状态下的高算力利用率，还能持续7天以上不间断稳定训练。

此外，SenseCore提供了模块化、全链条的数据、训练及推理能力，可实现百亿级数据管理及检索、人工标注服务，一键量化、一键部署、一键应用，实现大模型快速上线验证。

自研自建的算力底座，为商汤在大模型领域施展手脚提供了舞台。

像SenseCore这样的AI大装置，其价值不仅体现在对于商汤现有大模型的支撑上，更指向未来发展。在源源不断的数据浇灌下，AI大装置能够以更高效、更经济的方式批量训练大模型，并缩短从研发到部署再到应用的链条，成为商汤大模型体系应用落地的推力引擎。

政策指引行业发展，AI大模型加速落地

目前，生成式AI大模型已经成为全球各国的关注焦点。作为下一代互联网的关键基础设施，中国科技行业正在积极自主研发大模型，而配套的监管政策也已在路上。

近日，国家网信办发布《生成式人工智能服务管理办法（征求意见稿）》。征求意见稿指出，国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作，鼓励优先采用安全可信的软件、工具、计算和数据资源。

同时，征求意见稿对于生成式AI产品及服务的提供者做出多项明确要求，包括遵守法律法规的要求，尊重社会公德、公序良俗等，为其发展路径指明方向、划定红线。

上述文件有望成为国内生成式AI产业的首份监管文件。它在释放鼓励发展的积极信号的同时，也设置了一系列监管规则，目标是促进生成式AI的健康发展和规范应用。

各领域企业正在积极拥抱生成式AI，利用新技术实现降本增效，并把AI能力输出给第三方企业，勾勒出充满想象空间的商业化图景。

以阿里为例，除了通义千问接入阿里的所有产品外，阿里云的AI能力和算力也已经在多个企业和机构落地，包括OPPO、南方电网、复旦大学等。此外，吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示，将与阿里云在大模型相关场景展开技术合作的探索和共创。

商汤最新发布的日日新SenseNova大模型体系，同样应用于诸多行业和场景，目前已落地20多个业务场景。

比如，智能汽车是商汤长期布局的赛道。2022年，商汤智能汽车板块量产交付数超50万辆，新增定点数超800万辆，覆盖30多家车企的80多款车型。如今，随着SenseNova大模型体系的推出，商汤正通过AI大模型进一步赋能自动驾驶和智能车舱的产品研发。

在本周的上海车展上，商汤展示了与SenseNova深入融合的绝影未来展示舱。在展示舱内，商量SenseChat可以与用户交流、推荐个性化内容，甚至自动提炼邮件信息，帮助节省阅读时间，如果是儿童上车后还会自动推荐进入儿童模式；而秒画SenseMirage能够为用户自动生成各种风格的照片，为出行增添乐趣。

商汤绝影未来展示舱

借助大模型能力，商汤实现了BEV环视感知在国内首批量产落地，还首创自动驾驶GOP感知体系。此外，商汤绝影通过大模型进行自动化数据标注和产品检测，搭建的完整数据闭环体系，将模型迭代效率提升数百倍，目前已获得知名车企的定点。

此外，在生物制药领域，商汤与企业合作，利用AI大装置为蛋白质结构大模型提供AI推理算力，并为蛋白质相互作用模型，提供研发平台及训练算力，使得抗体筛选效率提升60%。

商汤以AI赋能实体经济的能力矩阵进一步扩充。SenseNova一方面服务商汤自身业务，另一方面，向政企客户开放了多种API（应用程序接口）。客户可根据自身需求调用SenseNova的各项AI技术能力，比如文本生成、图片生成、视觉感知、标注服务等，从而低门槛、低成本、高效率地实现各类AI应用。

基于商汤大装置和SenseNova大模型体系，商汤面向行业提供 “大模型即服务（Model-as-a-Service）”，涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多项能力。

可以说，商汤已经实现了“技术-产品-应用”的商业化内外双循环。长期重注AI的商汤，正站在新一波技术革新的潮头之上继续前行。

全球信息:生成式AI之战，谁能破局而出？

焦点热议:看了《极限挑战第九季》，终于知道黄晓明为啥能实现口碑逆袭了

焦点热议:看了《极限挑战第九季》，终于知道黄晓明为啥能实现口碑逆袭了

全球信息:生成式AI之战，谁能破局而出？

焦点热议:看了《极限挑战第九季》，终于知道黄晓明为啥能实现口碑逆袭了

银镜反应实验步骤_银镜反应_当前快播

环球快消息！“五一”，在现场丨畅快淋漓！职工嘉年华 关爱“打工人”

精神的传承是一场接力，“马灯精神”在新时代散发新光芒-快看

焦点日报：福特汽车：2023年Q1营收为415亿美元 同比增长20%

速看：“2023华晨宇火星演唱会”成都站圆满落幕 自由包容多元共塑火星浪漫底色

文昌市侨联联合多单位开展“温暖从头开始”爱心义剪活动|热消息

后视镜怎么看车尾位置 后视镜怎么看车尾位置在哪-环球微头条

海南离岛免税提货新规满月 近3.5亿元免税品“即购即提”_天天最新

“五一”假期消费爆棚 旅游餐饮文娱三大板块都很“挤”

起酥油是什么油?对人体有害吗?_起酥油是什么油 焦点简讯

曹丽娟诗文集_对于曹丽娟诗文集简单介绍

独立事业法人单位是事业单位吗

朗逸油耗多少1.4t_朗逸油耗-全球通讯

以形演意 舞武联动--“舞动 武魂”在天津启动_环球精选

淡菜干的家常做法图片窍门_淡菜干的家常做法

环球看点！西安格局：共享流量，为全国文旅搭台！

世界新动态：法媒：米兰那不勒斯仍在尝试引进奥亚尔，但罗马已几乎敲定球员

济南假期电动自行车短租增长“翻倍”，成城市中短途出行新风尚 焦点观察

焦点短讯！素质报告册家长寄语怎么写 素质报告册

热消息：云南省江川县发布森林火险黄色预警

崔东树：1-3月中国汽车出口106.9万台 同比增长54%-天天新视野

泉州公交“五一”期间开通临时接驳线

房产更名和房产过户是一回事吗?_什么是房产更名 房产更名和过户的区别 天天观天下

当前聚焦：锁骨在哪个位置图_锁骨的位置在哪里

【港股异动】百威亚太(01876.HK)涨3.09%

全球头部半导体分销商大比武：大的头破血流，小的“金蝉脱壳” 每日信息

沈阳市气象台发布大风蓝色预警信号 世界动态

全球视讯！qq英语名字男_qq英语名？

环球即时看！5月3日生意社白炭黑基准价为6025.00元/吨

环球焦点！美前官员：货币政策缺陷造成银行风险累积

今日快讯：《浪客剑心》第二季pv公开！时隔近30年的热血番回来了！

职位空缺数据大暴冷！黄金一度涨超20美元_环球速读

模压板和吸塑板的区别_吸塑板的优缺点

每日热文：海狗补肾胶囊可以长期吃吗_海狗补肾胶囊

全国游泳冠军赛：覃海洋打破男子100米蛙泳亚洲纪录|即时焦点

焦香软糯！这道老上海传统小吃，你会做吗？-精彩看点

你学过哪些古诗 小学生常用古诗词都有哪些?

你来打卡了吗？邳州各景区人气旺-环球播资讯

抢劫罪最低判多少年

扛起农业大市担当 打造新时代鱼米之乡实践样板|全球最新

世界看热讯：离谱！游客给熊投喂蛋筒冰淇淋，网友怒了：狠狠罚！

1-溴丁烷商品报价动态（2023-05-02） 每日视点

焦点关注：中钞国鼎金条价格今天多少一克（2023年05月02日）

滋阴补肾的食疗方_滋阴补肾的食物有那些

一甲基三氯硅烷商品报价动态（2023-05-02）_天天头条

实时：诈骗罪起诉流程有哪些

世界观热点：商铺市道谷底大反弹 投资者跃跃欲试

谷爱凌顶级社交圈！与何超欣吃饺子，一身黑裙秀好身材-环球快看

五一出游，让“文明”始终在场|环球速看料

天天动态:打造旅行课堂 带来别样体验（经济新方位·新职业新活力）

苹果云服务登录入口官网_苹果云服务登录入口 新资讯

鲁H85Q38、浙DC6252、浙B6CY70，实名表扬！

如何不陷入欲望的漩涡，做一个真正理性的投资者？巴菲特：跟风投资是业绩从平庸滑向糟糕的起因-全球快资讯

激光切割技术_关于激光切割技术介绍 今日播报

5月发售三款不错策略新游戏 看好迷瘴纪事成为黑马|聚看点

美媒列出季后赛系列赛抢七大战最高分的十次，库里50分含金量高吗 视焦点讯

三星g3502格机方法_三星g3502恢复出厂设置

绵治村_关于绵治村介绍

取代途观Allspace并且外形更大 大众全新七座SUV开发中 全球通讯

“炸裂差评”入住网红客栈发现死尸？涉事客栈：虚假信息已报警 全球通讯

正则条件（关于正则条件介绍） 天天快资讯

杭州临平举办“七彩亚运•童绘精彩”书画展 全球时快讯

文字的世界老婆生气的原因怎么通关 环球消息

“剧本杀”引入旅游工业建设

环球今头条！连丢两罚！库里：过去两场比赛的罚球不像我 但仍微笑着享受比赛

【精彩有戏】 开票演出｜《迷你特工队超级特工:雷》、《敲开心》

环球动态:白鹤滩入浙工程再添4条500千伏消纳通道

看热讯：曝陈萌顺利产子，大衣哥办酒宴请村民，网友：未婚先孕先查查吧

【假期天气】今天阳光正好 出门转转吧 世界热推荐

铁路上海站今日客流仍处高位，预计发送旅客53.6万人次 焦点热闻

家长向老师介绍孩子的文章_家长向老师介绍孩子_全球新视野

社会保险费一般由谁承担_社会保险费的承担人_热点评

宋朝现代化政策_宋朝现代化

【环球新视野】香港故宫文化博物馆今日近7300人次入场 创开馆以来新高

全球今日报丨社保基金和养老金有什么区别 社保基数怎么计算

环球快消息！“五一”，在现场丨畅快淋漓！职工嘉年华关爱“打工人”

焦点日报：福特汽车：2023年Q1营收为415亿美元同比增长20%

速看：“2023华晨宇火星演唱会”成都站圆满落幕自由包容多元共塑火星浪漫底色

后视镜怎么看车尾位置后视镜怎么看车尾位置在哪-环球微头条

海南离岛免税提货新规满月近3.5亿元免税品“即购即提”_天天最新

“五一”假期消费爆棚旅游餐饮文娱三大板块都很“挤”

起酥油是什么油?对人体有害吗?_起酥油是什么油焦点简讯

以形演意舞武联动--“舞动武魂”在天津启动_环球精选

济南假期电动自行车短租增长“翻倍”，成城市中短途出行新风尚焦点观察

焦点短讯！素质报告册家长寄语怎么写素质报告册

崔东树：1-3月中国汽车出口106.9万台同比增长54%-天天新视野

房产更名和房产过户是一回事吗?_什么是房产更名房产更名和过户的区别天天观天下

沈阳市气象台发布大风蓝色预警信号世界动态

你学过哪些古诗小学生常用古诗词都有哪些?

扛起农业大市担当打造新时代鱼米之乡实践样板|全球最新

1-溴丁烷商品报价动态（2023-05-02）每日视点

世界观热点：商铺市道谷底大反弹　投资者跃跃欲试

天天动态:打造旅行课堂带来别样体验（经济新方位·新职业新活力）

苹果云服务登录入口官网_苹果云服务登录入口新资讯

激光切割技术_关于激光切割技术介绍今日播报

5月发售三款不错策略新游戏看好迷瘴纪事成为黑马|聚看点

美媒列出季后赛系列赛抢七大战最高分的十次，库里50分含金量高吗视焦点讯

取代途观Allspace并且外形更大大众全新七座SUV开发中全球通讯

“炸裂差评”入住网红客栈发现死尸？涉事客栈：虚假信息已报警全球通讯

正则条件（关于正则条件介绍）天天快资讯

杭州临平举办“七彩亚运•童绘精彩”书画展全球时快讯

文字的世界老婆生气的原因怎么通关环球消息

环球今头条！连丢两罚！库里：过去两场比赛的罚球不像我但仍微笑着享受比赛

【精彩有戏】开票演出｜《迷你特工队超级特工:雷》、《敲开心》

【假期天气】今天阳光正好出门转转吧世界热推荐

铁路上海站今日客流仍处高位，预计发送旅客53.6万人次焦点热闻

【环球新视野】香港故宫文化博物馆今日近7300人次入场创开馆以来新高

全球今日报丨社保基金和养老金有什么区别　社保基数怎么计算

干酪怎么保存打开的干酪怎么保存每日速递

FOF基金首季调仓仍以均衡配置为主，卫星策略新增计算机和医药环球报资讯

敕怎么念敕是什么意思

被莫宁称为英雄？巴特勒：我不是任何人的英雄只是不错的球员

这应该是今年最损的一幅政治漫画了天天百事通

世界快资讯丨晚来香如故结局什么意思晚来香如故