商汤科技推出“日日新SenseNova”大模型体系,为行业提供创新引擎
2023年4月10日,上海——商汤科技SenseTime举办技术交流日活动,分享了以“大模型+大算力”推进AGI发展的战略布局,并公布了商汤在该战略下的“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。活动上,商汤不仅展示了“日日新SenseNova”大模型体系下的语言大模型,还展示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,并公布了商汤依托AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。
当前业界训练大模型对大算力的需求非常旺盛,并且真正好用的基础设施十分稀缺。商汤历时五年,建设了业界领先的AI大装置,大装置上总共有27000块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。
商汤科技董事长兼CEO徐立表示:“在AI大模型时代,数据、算法和算力这三要素也在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,因此就必然会导致对算力需求的剧增。我们以AI大装置SenseCore打造AGI时代的基础设施,并基于此将大模型体系命名为‘日日新SenseNova’,寓意‘苟日新、日日新、又日新’,希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”
商汤科技董事长兼CEO徐立
“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。AGI将实现从‘数据飞轮’到‘智慧飞轮’的演进,最终迈向人机共智。”商汤科技联合创始人、首席科学家王晓刚表示:“商汤已建立了全栈的大模型研发体系,并已在多个行业场景中落地,场景的多样性,任务的复杂度,数据的丰富度均充分展示了我们大模型的能力和未来潜力。我们将持续推动基础设施建设,期待和合作伙伴一起投入到AGI的时代大潮中。”
商汤科技联合创始人、首席科学家王晓刚
“日日新SenseNova”也已为商汤的自身业务带来了诸多突破。例如在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,也构建了感知决策一体化的自动驾驶多模态模型,带来更强的环境、行为、动机解码能力。
自然语言是人机沟通的关键手段,“日日新SenseNova”也推出了商汤最新研发的语言大模型“商量SenseChat”。作为千亿级参数的自然语言处理模型,“商量SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。活动现场,“商量SenseChat”展示了出色的多轮对话和超长文本的理解能力。商汤也展示了语言大模型支持的几项创新应用,包括:编程助手,可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,能轻松从复杂文档中提取和概括信息。
扩散模型引爆了AIGC应用的流行,商汤展示了“日日新SenseNova”的各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用:
“秒画SenseMirage”文生图创作平台,展现了光影真实、细节丰富、风格多变的强大的文生图能力,可支持6K高清图的生成;客户还可根据自身需求训练生成模型。
“如影SenseAvatar”AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。
“日日新SenseNova”带来的这些强大而易用的内容生成能力,将会改变内容生产行业的生产范式,突破内容创意的天花板,将会重塑内容生产行业生态并打开新的增长空间。
无论是语言大模型,还是文生图或数字人生成,都离不开大规模AI基础设施的算力支持。商汤AI大装置SenseCore,拥有行业领先的算力输出能力、超大模型训练及大规模推理能力,将会成为AGI和大模型时代的基础设施服务领导者。
基于AI大装置SenseCore和“日日新SenseNova”大模型体系,商汤面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务:
基于预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升。
大模型并行训练和模型增量训练服务能够帮助客户快速利用自有数据训练模型,包括在预训练大模型之上进行垂域行业模型的开发,生产千行千面的自定义模型。
模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。
商汤也向行业开发人员开放大量预训练模型及AI开发工具链,全面赋能客户提升开发效率。
商汤将持续推进“日日新SenseNova”大模型体系的建设。“苟日新、日日新、又日新”,商汤大模型研发期待在数据量上、参数结构上、以及能处理的问题上,可以日复一日的提高,携手行业生态共同迎来更强大的AGI技术的突破,让AI技术惠及每个人。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
精彩阅读
-
科普海洋 文化先行 【蔚蓝中国】深圳大学海洋文化科普活动圆满举行...
2023年9月1日-11月30日,深圳市南山区科学技术协会主办的【蔚... -
中国恒大发布澄清公告:机构指公司从未盈利的报告并无实际依据...
:12月4日早间,中国恒大集团发布澄清公告指出,公司注意到一家机构发表了一篇关于... -
优质楼宇推介月|上报传悦坊...
新机遇·新未来 “优质楼宇推介月”专题推介活动 上报传悦坊 上报传悦坊是由... -
2023年度中国直播电商行业合规工作座谈会在京召开...
2023年11月28日,在中国商业联合会的指导下,中国商业联合会直播电商工作委员... -
南航近期将新开、复航和加密多条国际及地区航线...
为进一步丰富旅客出行选择,中国南方航空公司(以下简称“南航”)宣布,将于今年12... -
首届链博会数字科技专题论坛:以数字化赋能供应链现代化...
以数字化赋能供应链现代化 “全球产业体系和产业链供应链呈现多元化布局、区域... -
日元涨或跌,韩国人怎么做到“两头通吃”?...
Park是众多韩国散户投资者中的一员,他们押注日元的跌势必须结束。根据韩国央行的... -
河南省直机关“红旗渠杯”书画展在郑州开幕...
11月30日,由河南省委直属机关工委联合省委办公厅、省委宣传部、省直书协、省文联... -
融合智能、协同、全程数字化能力泛微全新低代码平台e-builder在...
低代码作为一种降低开发成本、提高开发效率的工具,其在行业的全面应用,不仅能满足各... -
论文查重系统的原理是什么,万方检测在线解读...
对于高校大学生、学术工作者以及科研工作者来说,查重一定不陌生。论文是衡量学生学习... -
华联康生物:多元化经营模式,撬动私护市场可持续发展...
中研网的数据显示,2022年中国女性私护品市场消费达到617亿,跃升为世界第三大... -
官宣!瑞士国宝级抗衰品牌NIANCE妮瑞斯进军中国...
2023年11月27日,杭州NIANCE妮瑞斯的足迹已遍布全球30多个国家和地区... -
德定安航空在上海设立新工厂法国驻沪总领事:相信法国企业能为中国市场提...
“德定安的业务增长规模足以证明,像德定安航空这样的法国公司能够为中国的市场提供高... -
中国科学院博士团队领衔研发的干眼症药物研发有了新进展...
(央视记者白爱军)由中国科学院博士团队领衔研发的治疗干眼症等眼部用药系列配方,历... -
福达数科建立上海运营中心,提升香料服务效率和市场影响力...
2023年11月28日上午8:18分,广西福达数字科技有限公司正式在上海建立运营...