美图秀秀超能力鉴定(美图发布国内首个懂美学的视觉大模型MiracleVision)

6月19日,美图公司举办第二届影像节,发布以6款AI为内核的影像生产力工具以及美图视觉大模型Miracle Vision(奇想智能),正式形成由底层、中间层和应用层构建的AI产品生态。在AI与影像生产力工具的紧密结合下,优质内容的创作门槛将不断降低,影像行业的生产效率也将不断提升。我们看好AIGC应用端的突破,AI可直接应用于文字、图像、视频等创作工具,实现内容创意自动化生成,直接带来生产力效率的提升。

事件

6月19日,美图公司举办以“AI时代的影像生产力工具”为主题的第二届影像节,现场发布7款新品:美图视觉大模型Miracle Vision(奇想智能)以及6款以AI为内核的影像生产力工具:包括AI视觉创作工具WHEE;AI口播视频工具开拍;桌面端AI视频编辑工具Wink Studio;主打AI商业设计的美图设计室2.0;AI数字人生成工具Dream Avatar;美图AI助手Robo Neo。这7款产品主要偏向B端市场,将于7月开始陆续内测上线。

简评

1.1 美图正式形成全链路AI产品生态

经过产品的完善,美图正式形成由底层、中间层和应用层构建的AI产品生态。在AI与影像生产力工具的紧密结合下,优质内容的创作门槛将不断降低,影像行业的生产效率也将不断提升。


应用层:美图通过WHEE、美颜相机、美图云修、Wink、Wink Studio、开拍、美图设计室2.0、Dream Avatar数字人等产品和服务,在AI图片、AI视频、AI设计、AI数字人四大领域创新探索,并由美图秀秀提供AI影像服务聚合。


中间层:由美图AI开放平台、美图创意平台、美图AI助手Robo Neo组合而成,分别负责开放共享AI技术、搭建创作者生态、聚合美图影像服务。


底层:新发布的Miracle Vision视觉大模型,为美图全系产品提供AI模型能力。


1.2 Miracle Vision:懂美学的AI视觉大模型

作为美图的首款自研视觉大模型,Miracle Vision定位于美学创作,涵盖了美学趋势研究、美学评估系统、美学创作者生态三个落地场景。

在技术层面上,Miracle Vision主要有以下三点特色:

1) 用美学点亮人工智能:模型搭建了基于机器学习的美学评估系统,为模型的生成效果从美学的角度打分数,从而提升模型对美学的理解,数据和评估结合,使得视觉大模型Miracle Vision具备了独特的美学创作者生态。同时在大模型的建设过程中,引入艺术家、设计师等具有深厚美学背景的专业人士,提升美学理解。

2)以视觉创作场景来反推技术演化。挖掘最适合AI协作的场景——绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景,反推技术演化,例如采用更高容量的扩散模型。

3)运用零样本学习算法,无需微调就能够刻画人物的特征。未来将陆续支持图像、视频、3D等多模态内容的生成。


模型生态的构建上,Miracle Vision通过模型训练、模型分发以及模型商业化的方式同创作者和开发者共建模型生态。


1)模型训练:创作者可以基于Miracle Vision进行二次训练,并且美图会为创作者提供创作支持,例如课程、社区模型创作大赛等。


2)模型分发:创作者训练的模型可在美图旗下的产品进行分发,且分发的过程中可以持续对模型进行优化。


3)模型商业化:行业客户可以通过Miracle Vision的API和SDK进行商业使用,创作者和开发者通过商业合作获得经济收益。

从模型效果来看,Miracle Vision视觉大模型尤其擅长创作亚洲人像摄影、国潮国风、商业设计等生成方向。


1)亚洲人像摄影:市面上常见的视觉模型对亚洲人像有一定的刻板印象,对亚洲人像的生产不够自然,Miracle Vision基本已经可以从人物的五官、表情、皮肤质感和服饰呈现出真实自然的效果,但在光影调节方面仍有较大进步空间。

2)国风国潮:美图将中国传统文化元素的理解融入模型中,可以生成相对和谐自然、细节讲究、拥有东方美学的内容。

3)商业设计:Miracle Vision可以辅助设计师进行包装设计、工业设计等内容。

近期MiracleVision视觉大模型将陆续在美图产品矩阵中开展内测,有望将美图公司的产品和服务由生活场景,全面进入生产力场景,迎来AI时代超强的工具价值。我们看好AIGC应用端的突破,我们认为内容创作是非常契合AIGC落地的场景,能够直接带来生产力效率的提升。AI可直接应用于文字、图像、视频等创作工具,实现内容创意自动化生成,实现降本提效。


风险提示

新业务发展不及预期:AIGC 及相关新技术领域仍处于快速发展阶段,技术距离成熟存在较大差距,当前发展预期可能存在过度乐观的情况,业务实际发展仍存在较大不确定性。


技术风险:大模型的部署和维护可能涉及技术上的挑战。需要强大的计算资源和存储能力来支持大模型的运行,这可能会增加成本。此外,大模型的训练和更新也需要大量的时间和人力投入。


数据数量与数据质量不及预期:大模型需要大量的高质量数据进行训练,若数据数量和质量存在短板,则会影响模型效果。


商业落地风险:由于大模型业务处于探索期或成长期,业务模式尚未成熟,同时宏观、行业环境可能发展变化,因此当前时点对未来的预判多数依赖上述环境变化不大或基本稳定的假设。大模型相关的监管尚未明确,可能涉及一些数据隐私、数据偏见、滥用等的法律风险。


以上文章转载于公众号-中信建投证券研究:崔世峰 于伯韬

声明:好星座所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者AIGC研究社所有,原文出处。若您的权利被侵害,请联系 删除。

本文链接:https://www.haoxingzuo.com/w/36976.html