焦点短讯!36氪专访 | 美图创始人吴欣鸿:AI让我如履薄冰
36氪 2023-06-30 08:57:16

文 | 周鑫雨

编辑 | 苏建勋

很长一段时间,美图的危机感来源于Adobe。


(相关资料图)

“为什么做美图秀秀?就是被Adobe虐的。”美图公司创始人、董事长兼CEO吴欣鸿在6月19日的“美图影像节”上直言。他表示,美图秀秀一开始的定位是简化版的Adobe。

只是相较于更专业的Adobe,美图秀秀恰如其分地踩在了亚洲“颜值经济”的风口上。此后15年,这个一键就能帮用户修图、美颜的App一直是美图业务的“门面”——一个明显的标志是,美图后续推出的“Wink”、“美图设计室”等产品,都在用户量最高的“美图秀秀”上拥有引流入口。

但2022年后,美图危机感的来源,成了奔涌而来的AIGC浪潮。

2022年下半年Stable Diffusion等AI绘画工具的开源,是美图感受到的第一波冲击。太平洋东岸卷起的AIGC工具开源热潮,让小团队甚至普通用户制图、修图的成本接近于0。

2022年,美图首次实现全年盈利,撑起总收入37.5%的VIP订阅代替广告,成为美图第一大收入。在当年的战略会上,美图把主题定为“居安思危”,准备在盈利的基础上进行业务升级。

伴随着Midjourney创造的《太空歌剧院》横空出世,一举夺下绘画大奖。吴欣鸿发现,AI生成图像的效果已经达到了足以“冒犯艺术家”的水平,美图一直引以为傲的“审美”正在被AI挑战——“居安思危”的主题,被他改成了“居危思危”。

在访谈中,吴欣鸿对36氪直言自己和团队的工作状态:没日没夜研究AI技术和测试。美图公司集团高级副总裁、影像产业事业群总裁陈剑毅则在与合作方的交流中将美图的状态称为“生死存亡之秋”。他特意在影像节上回应:近半年埋头研究AI,很多合作未能及时响应,跟合作方们说声抱歉。

美图公司创始人、董事长兼CEO吴欣鸿。图源:美图

美图公司集团高级副总裁、影像产业事业群总裁陈剑毅对“生死存亡之秋”的回应。作者拍摄

影像节上,美图交出了“近半年埋头研究AI”的答卷,一口气发布了7款AI新品——比较明显的转变是,主打让用户变美的美图秀秀,准备帮助用户工作和赚钱

比如新发布的“WinkStudio”,是让专业剪辑师用AI像修图一样“修视频”。“开拍”则面向了具有口播需求的商家和短视频创作者,用AI帮助用户生成脚本和能自动跟着语速翻页的提词器。

为什么会有这样的转变?吴欣鸿在专访中回应:VIP订阅的渗透率还有增长的空间,这就迫使美图从生活场景往生产力场景延伸,“要么切实帮用户赚到钱,要么能给用户心理上的愉悦或者优越感,如果你能做到,大部分用户都会买单的”。

这次美图发布的新品中,视觉大模型MicroVision的出现也令人惊讶。按照最为快捷的路径,具有众多美颜、修图工具的美图,只需要接入某家大模型的API(接口),就能较低成本迅速完成对产品的AI化迭代,无需自研大模型。

但美图选了一条荆棘路。吴欣鸿对36氪表示,花了近半年搭建模型的主要理由有二:一是市面上通用模型的效果有限,二是出于对数据安全的考量。

推出7款新AI产品后,吴欣鸿认为美图的危机仍没有解除。除却对修图、图片生成等“舒适圈”的AI改造,如今的美图还踏足了数字人生成、口播视频生成等市场竞争愈发激烈的新领域。新推出的视觉大模型MiracleVision,也更意味着持续的研发投入和效果验证。

AI带来很多机会和挑战,但这个机会不一定是我们的机会,而挑战是实实在在存在的。我还是一个如履薄冰的状态。”他在专访中直言。

影像节结束后,36氪与吴欣鸿、陈剑毅就美图在AI浪潮下的机会和挑战进行了交流。以下是对话:

对“生死存亡之秋”的回应:逼自己一把

36氪:为什么美图选择在这个时间点与大家交流大模型的成果?不少友商在3、4月份的时候已经发布了相关的动态。

陈剑毅:原计划3月份发布,但当时一些产品还没落地,美图要真的做出产品来才会对外说。

吴欣鸿:既然发布了产品,就得做好。如果按照原有的经验、习惯去做事情,对AI创新来说是很大的阻碍,要用全新的视角和思维去看,才有可能做出创新的东西。

36氪:危机感是什么时候产生的?

吴欣鸿:当时Midjourney生成的《太空歌剧院》拿了美国科罗拉多州博览会艺术比赛的大奖,很多艺术家第一次感受到被冒犯,这是标志性事件。

AI在视觉和语言上齐头并进,不可否认,语言大模型的爆发力比较强,应用也比较广泛,但第一波爆发应该是在视觉上,对美图而言,AI在视觉上的爆发和我们的业务相关,所以对我们潜在的颠覆性更强。

所以当Midjourney出圈后,美图也加快了步伐。

36氪:为了应对这波冲击,美图内部做了哪些决策?

陈剑毅:第一,进行人员调整。把受AI影响比较大的同学,调整到需要加快AI布局的岗位。比如说把设计转到产品岗,让算法的同学去做模型相关的事,客户端的同学转去做前端。

第二,迅速将相关的生产力工具引入公司,进入大家的工作流里面,比如说通过AI绘画来进行物料的创作等。

第三,内部快速引入AI相关培训,我们请了AI领域的讲师,给大家普及AI发展局势,让大家对AI有更深入的理解和认知,把团队的认知搭建起来,才能更好地做事情。

36氪:哪些业务需要调整原来的思维?

陈剑毅:从产品角度看,产品经理又回到互联网早期的状态,需要持续挖掘需求,重新去看行业的需求、用户的需求,就像苹果和安卓刚出来的时候,产品都需要做场景的深挖,这也是产品经理最核心的能力之一,也就是“开荒”。

从技术角度看,现在对市面上的开源模型配置一些中间参数或扩写,自然而然能快速地做出成千上万的AI应用,但是真正能被应用的有多少,这是很关键的。到底能覆盖多少用户规模?能不能形成自然的口碑传播?是否需要砸钱去推广或者是买量?这是需要产品团队去做判断的。

36氪:对于算法工程师而言,思维的转变大吗?

吴欣鸿:工程师被迫去跨界,因为模型的训练其实涉及很多学科的融合,具体到某些功能上,比如美图新发布的AI演员生成功能,和影视特效相关,所以工程师必须具有对电影拍摄和后期的理解能力,才能去做效果的调适以及开发。AI的创新要求很多人都必须是多面的,具备快速的学习能力,不管是工程师还是产品经理。

陈剑毅:这波AI浪潮对工程师的挑战和要求是更大的,一旦看到市面上有新的产品出现,工程师需要去推导背后的技术,当确定要做相关产品之后,就要研究如何让新的技术在场景中落地。现在,工程师不仅要对层出不穷的新技术进行研究,还需要具备相关的专业知识,了解用户需求和偏好以及使用场景。

“希望行政、财务都是懂AI的人才”

36氪:美图产品的应用属性很强,为什么这次美图选择自研视觉大模型,而非调用第三方的模型服务?

吴欣鸿:我们决定要做大模型,是今年春节后。我们认为用别人的大模型,没有办法对效果提出意见和要求,就好比说要有高清的画质,人家不支持,那你就没有办法了,最大的问题就是受限。另外也有一些出于安全性的考量,所有我们现在用的技术绝大部分都是自研的。

视觉大模型MiracleVision。图源:美图

36氪:在影像节上关于视觉大模型MiracleVision的技术特征其实并未提及,作为一个“大模型”,MiracleVision的参数量达到了怎样的级别?

吴欣鸿:参数量很大,我可以说个数字,但我们不想公布。因为大模型应该是求质不求量,目前有很多号称十亿、百亿、千亿级参数量的大模型,但你实际去看的效果并不好。我们认为视觉大模型最核心的是生成效果,生成效果不是靠参数量,更重要的是要有优质的原始数据集。参数量会对模型训练产生影响,但不是全部,特别是对于视觉模型而言,如何实现更优的视觉效果生成才是最重要的。

陈剑毅:参数对于大模型的关系,类似硬件参数对于电子产品的关系。你知道自己的手机用的是什么芯片吗?是几核的吗?其实很少有消费者关心这些事,他们更在意的是应用生态。

36氪:您觉得算力、算法、数据、人才几个方面,哪个对视觉大模型训练而言是比较关键的?或者可以称得上是“卡脖子”难题?

陈剑毅:我觉得得分场景,如果你想做一个通用的模型,你什么效果都能生成,极其容易,但可能生成的画质比较低,或者是效果本身不太好。

实际上这些生成效果是要具体去抠的。比如我们会将几千个品类收敛到目前来看商业模式以及应用场景比较广泛的重要类目,例如生成国风国潮风格的图像,我们需要对应地去挑效果,不断地对效果进行调试,还是有蛮多细分的规则。

36氪:这是不是意味着算法是最大的难点?

吴欣鸿:这个过程是用策略去验证调试,跟纯粹的算法不太一样。效果要实现持续优化,需要不断地去进行调试,有点像匠人一样不断地去打磨细节,这个过程是很枯燥的。除了人力以外,也涉及到美学评估系统,不断告诉AI哪个好,哪个不好,以及用户喜欢什么样的。

陈剑毅:就跟你带孩子一样,不断告诉他什么能做,什么不能做。能做就继续加强,不能做,下次就不用了。

36氪:训练这样一个视觉大模型,美图用了多少人力?

陈剑毅:美图具体去做大模型训练的人,也就十几个,但是效果调试团队是很多的。Midjourney开发团队称自己只有11个人,也是最核心的11个人去做模型训练,我个人推测其背后还是有其它团队持续在做数据的标注、优质数据的挖掘等等,只是没有公开

吴欣鸿:除了核心技术人员,产品和运营也或多或少参与到模型训练中。我们的要求是让公司所有人对视觉大模型有概念,至少基础认知得拉起来,或多或少都参与其中,不断扩大参与的人数。只有这样的话,大家才会有足够的理解深度,才能把自己的工作做好。

36氪:美图会有人才焦虑吗?

吴欣鸿:会有。所以我们也在看一些对AI有很大兴趣、已经做出成绩的大牛。有热情,会学习,并且有成果,这种人是我们很缺的。

陈剑毅:没有人才焦虑的公司不是好公司,不光是技术大牛,我们甚至希望行政、财务都是懂AI的人才,这样大家能够拉齐认知,沟通效率会很高

把工具做好,是一件确定性很强的事

36氪:这次美图发布的7款产品,其中不少是很多友商已经涉猎的领域,比如数字人、口播,美图的核心竞争力在哪里?

陈剑毅:效果和应用场景。

吴欣鸿:美图一直在美化人的真实形象,所以它对用户的美学偏好是敏锐的。美图做的数字人在美学上也会有比较高的追求。

在应用场景上,跟我们现有的场景紧密结合,就像这次发布的AI数字人模特,它跟电商是紧密结合的。包括美颜相机做的AI写真,某种意义上也是数字人的应用,需要创建一个自己的写实数字人,帮你去拍写真。

我们不会因为别人做所以跟着做,而是说切切实实有这些场景的需求。我们是围绕美图独特的场景,然后把美学的标准提到比较高的位置。

目前美图的AI产品生态。图源:美图

36氪:AI技术产生新需求,与此同时AI工具的竞争也愈发激烈,美图如何应对?

吴欣鸿:AI技术大爆发,也造成了需求大爆发,大家体验到了AI带来的生产力提升,尝到这种好处就回不去了。所以需求在那儿,又有那么多的公司加入这个战场,逼着我们把获客的时间缩短。在新的领域,不再是我们一家,可以精耕细作多年,那么多公司都在里面找机会,意味着我们要缩短获客流程。

36氪:美图缩短获客流程的方式是?

吴欣鸿:首先确保自己在某个领域有非常独特的、无可取代的价值,所以美图也会在自己擅长的领域深挖,确保我们提供的产品力是这个领域中最强的,并且能帮助用户去创造价值。说白了就是:要么切实帮用户赚到钱,要么能给用户心理上的愉悦或者优越感,如果你能做到,大部分用户都会买单的

36氪:两位会觉得工具型应用竞争加剧会让获客成本变高吗?

吴欣鸿:应该是降低的。大家尝到AI的好处后就回不去了,这会促使大家去找不同的领域最好用的AI工具是哪个,所以会诞生很多需求和口碑传播。之前的产品还要花钱打广告和买量,效率很低,现在产品都是由用户推动的,比如我们这次发布的“WinkStudio”和“开拍”,就是根据用户需求来推出的。

陈剑毅:是的,AI相关的功能很容易出现“人传人”的现象。

36氪:从美图去年财报来看,5.86亿的研发投入已经占到总收入的28%,这部分投入到AI的比重有多少?今年美图的AI研发会有侧重点吗?

吴欣鸿:美图未来研发投入AI的占比会越来越高,现在再去投入一些(其他)技术或者什么,意义也不大了。

36氪:这次发布会强调了美图是聚焦工具型产品服务的企业,AI对业务的再造会让美图的业务从工具型应用转型到其他领域吗?比如之前尝试过的社交。

吴欣鸿:在可见的时间里,我们还是把生产力工具做好。生产力工具的领域,诞生了很多伟大的公司,我们如果能成为其中之一,那已经很了不起了

我们没有太多的野心,也不想太扩展自己的边界。我们如果能够把AI图片、AI设计、AI视频、AI数字人这四个场景做好,或者说能做好其中两个场景,那就已经很了不起了。毕竟光“美图秀秀”这个应用,我们都做了15年。

我们去年的收入是20亿多一点,未来几年靠工具,收入和利润可能还会有增长。其实做工具也能赚到不少钱,但社交可能是一千家企业去做,最后能成一家就不错了,失败率太高了。把工具做好,是一件确定性很强的事

欢迎交流!

热门推荐

猜您喜欢