AIGC深度布局 万兴科技即将发布“天幕”多媒体大模型

2023-09-15 22:04:24 来源:上海证券报·中国证券网 作者:田立民

  上证报中国证券网讯 9月15日,万兴科技出席2023世界计算大会,宣布即将发布国内首个专注于以视频创意应用为核心的百亿级参数多媒体大模型“天幕”,并焕新亮相嵌入“天幕”大模型能力的10余款AI应用。此外,万兴科技还与湘江实验室正式达成战略合作,助力大模型迭代升级。

  万兴科技董事长吴太兵表示,AI为创意软件带来前所未有的大机遇。AIGC时代,大模型作为基础设施将赋能千行百业。如果说AI是电力,大模型是三峡水电站一样的大型发电站,那么落地的AI应用则是各种电器。大模型时代,应用为王,但大模型可能是“王后”。万兴科技将首先聚焦应用,做AI时代的“美的”,同时积极开发升级多媒体大模型,夯实护城河。

  借力大模型,万兴科技此前已将AIGC能力在旗下数十款创意软件中落地应用并规模化商用。此次10余款AI应用产品中,AI数字人直播神器万兴播爆直播版、AI文字视频剪辑产品Wondershare Kwicut全球首发;AI讲演神器万兴智演、AI虚拟伴侣产品Trumate、AI电商图片生成工具Wondershare VirtuLook、在线图像音视频轻编辑AI创意平台Wondershare Media.io及卡点音乐视频模板产品Beat.ly等焕新升级。上述AI应用产品均有“天幕”强大的多模态能力支撑。

  据介绍,“天幕”依托基础大模型及高性能全球网络平台、计算集群算力平台、海量数据平台,由视频大模型、音频大模型、图片大模型、语言大模型组成。区别于市面大模型,“天幕”面向全球市场,以视频创意为核心,聚焦于视频处理和生成,对算力要求更高,技术复杂度更高,可支撑全局视频风格转换、局部视频内容编辑、创意视频生成、常规视频生成等,同时包含目前市面上语言、音频、图像的大模型能力,特色鲜明。

  此外,“天幕”围绕场景深耕,由用户需求驱动技术演化,实现了视觉、音频、语言多模态AI生成及优化,具备一键成片、AI美术设计、文生音乐、音频增强、音效分析、多语言对话等核心能力,并在视觉、听觉等多媒体关键能力上持续迭代。

  万兴科技副总裁张铮在当天的《拥抱大模型驱动下的AIGC创意软件新时代》主题演讲中表示,公司之所以能开发“天幕”,从外部趋势来看,大模型训练和推理成本下降,为垂直行业模型衍生、中间层及应用层提供了发挥空间。同时,AI能力继续向“大数据、小算力、通用小范式”的方向迭代,“通用大模型+行业小样本+应用及内容”能够帮助AI大模型快速适配垂类场景,是目前AI商业化进程最快的方向;从内部储备来看,公司已具备跨模态的算法和视频图像技术的长期积累,开发大模型将进一步巩固发展护城河。

  据介绍,万兴科技组建了百人算法团队,特聘行业专家张晓东为AI顾问,进行了百亿级数据集规划,并实现100+落地算法、分割/生成/增强为主的视频图像算法完备,跨模态/视频/音频布局靠前。此外,万兴科技已和湘江实验室等科研机构、燧原科技等算力行业领先者达成战略合作,共同构建数字创意新生态。

  未来万兴科技将依托“天幕”大模型能力,重塑“创意软件”,实现旗下产品的全面智能化;万兴科技也将通过基础平台建设与夯实、大模型能力的迭代训练,以及商业化应用的不断探索,体系化构建大模型应用生态,从技术到应用全方位赋能创作者,并将助力企业抢抓数字创意及出海市场红利。(田立民)