中新网12月27日电 当地时间12月26日晚,被誉为“印度经济改革之父”的印度前总理曼莫汉·辛格在新德里去世,终年92岁。
传播学者对谈科普博主:算法造不了网红
当下,人工智能越来越走进我们的生活之中,「算法」也从一个技术名词成 为了社会讨论的热点。 算法的学术定义是「以数学方式或者计算机代码表达的意见」,在今天的真实生活中几乎无处不在,小到打车、找餐厅,大到自动驾驶、AIGC 大模型,背后都有算法的身影。
算法在社交媒体和内容平台的应用,也受到人们的关注。李子柒回归涨粉千万,理发师晓华全网爆红,算法与流量的关系是什么?从编辑推荐到算法推荐,信息茧房真的存在吗?除了根据网友喜好推荐内容,算法还能带来哪些价值?
中国人民大学新闻学院副教授董晨宇与抖音科普博主「三一博士」、B 站知识区 UP 主「老蒋巨靠谱」,共同录制了一期节目《爆款,谁说了算?》,揭开算法的神秘面纱。在节目中,「老蒋巨靠谱」从创作者的视角分析, 流量的背后是共情 ;「三一博士」认为 算法是为内容服务的,二者不可本末倒置 ;董晨宇则提供了更多学术视角,提到信息茧房这个概念在学术上被证伪了, 平台算法也没有能力去「造神」 。以下是他们讨论内容的整理。
01
共鸣、共情是驱动流量的底层逻辑
董晨宇:先从一个最简单的问题聊起,2024 年你印象最深的网红或者网红事件是什么?
三一博士:李子柒回归,停了三年,一出来之后单日涨粉 1000 多万,播放量好几个亿,外网的话也特别火。
老蒋巨靠谱:李子柒是个特殊的案例,如果看流量生态,总有一些最火的、现象级的网红,反而跳出流量的规律,它跳出了职业网红的流量规则,它才可能成为这样一个现象级的 IP。
三一博士: 李子柒确实不遵守流量规则 ,因为她和其他人不一样,她在退隐之前就已经是「中文互联网第一 IP」,她在中文互联网和外网都没有人比得上她。还有一点就是李子柒回来的姿态,她拿回来的第一期内容,你会觉得还是当年那个仙气飘飘的感觉,这个也很重要,跟之前的无缝对接过来了。
董晨宇:我补充一个案例,发型师晓华,有人说看不懂她为什么走红。
三一博士:我小时候理发的人,其实就是像晓华这样的人。晓华营造了一个构像,像一个符号一样,很大程度上让人返回原来的生活。尤其现在的大家都很忙,每天节奏跟以前成长的环境完全不一样,所以你会觉得突然一下子穿越回去了,会有一种很强的共情。 共情永远是驱动流量的底层逻辑。
老蒋巨靠谱:我觉得流量世界里有两种力量一直都存在,一种就是让我们共鸣、共情的力量。另一种力量是呈现我们未曾接触甚至想象过的生活的力量。其实早期的网红带我们看的都是我们没有想象过的生活,而晓华这种是深植在我们记忆中的那些非常真实的部分。她用另外一种东西把它勾出来了,她是真实生活的一种侧面,是凭借这种一种非常真诚、非常真实的东西打动我们。
董晨宇:有另外一个说法,说网红其实是被选中的那个人,在各位看来,他们是被社会情绪选中的吗?还是他们是被其他的力量选中的?
三一博士:其实我认为 晓华这种相当于艺术品,像我这种职业化创作者属于工业品, 这两者之间不太一样。有些确实是那种天选之子,有一定的运气成分,各个方面的资源、元素、情绪都堆到这一块了,就等这么一个人出来。
老蒋巨靠谱:理发师晓华虽然取得了更大的流量意义上成功, 但是普通人没法学。 如果另外一个理发师完全按照晓华的内容和机位开播,完美复制一切,依然没法红。职业化网红的成功是有迹可循,可以复制的。但晓华是反流量逻辑的。
董晨宇:很多人看不懂晓华为什么走红。包括我在内,往往倾向于用网红行业最普遍的职业化方式去看待他们,所以看不懂。但 晓华和郭有才其实并不是在网红经济的标准动作中去成长的,无法单纯用技术视角去衡量。
董晨宇:其实很多创作者都想知道一件事,就是流量来自哪儿?
三一博士: 流量来自于观看。我认为流量来自于多大程度上能引发大家的共情, 所有人拿开手机的那一刻探求的都不是真理,而是共情。 所有事的底层是情绪。
老蒋巨靠谱:我对自己的定位是观点型的博主,所以我最主要的标准就是能不能做出差异化内容。假设一个话题流量很大,但是我聊不出自己独特的东西,我宁愿不做。我也在思考,假设我不顺着共情的市场规律走,我不提供他们想要的情绪的话,那我能给他们提供什么?可能这才是我真正要思考的。
董晨宇: 流量不是一个技术问题,它可能承载了更多社会性的议题或社会性的情绪。 我在创作的时候也有一个感觉,就是流量好的视频未必是我拍的最好的,而是我切中了某一个情绪。再往前推一步,我觉得流量其实是中国社会情绪的一个调色盘。
02
「平台造神」夸大了算法的作用
董晨宇:各位怎么理解 MCN 机构呢?
老蒋巨靠谱:对于跟着规则走的创作者来说,他们可能需要 MCN。因为 MCN 是中介角色,对接了博主和商业世界。而且 MCN 是摸透了某些流量规则的,比如几点发视频,视频拍多长。我觉得这些操作没什么用,顶多会让我的流量增加 20%,但我又不是每天做 5 条内容。我一年才产出 30 个视频,「AB 测」都测试不过来,所以 我宁愿去抓更准的用户需求,去做差异化的内容。
董晨宇:我接触了很多创作者,我有一个比较笼统的感觉是, 越成熟的创作者越不在乎算法。 对他们来说,更重要的是对标账号在做什么?他们怎么转型的?他们更在乎的是:我这期评论有哪些在夸我,哪些对我不满意?我的评论数、转发量是高了还是低了?他们会及时做复盘,这些内容侧的,还有这种生态侧的,其实都比技术侧要重要。
三一博士:对, 算法是服务于内容的,不能本末倒置。 如果算法有一天不能服务内容的话,那要调整的就是算法。平台搭好台子,在这个基础之上, 只要创作者能够产出打动人的内容,它自然会有流量。
董晨宇:你觉得平台有可能去造就「神一样的人物」吗?比如说我听过很多的传言,说「郭有才」是平台造出来的,「发型师晓华」是平台造出来的,你们觉得这个有可能吗?
老蒋巨靠谱:创作者是被筛选出来的,根本不是被培养出来的。如果平台运营说就是他了,这个月让他火, 这其实很「反效率」,不是效率最大化的方式, 不一定是对平台好的东西。
董晨宇:你会发现这些走红的素人是平台不可控的。就算平台有能力捧红,但捧红之后,他可能是福,也可能是个祸。我打一个比方,对平台来说, 所有账号就像是气球, 有的会升快一点,有的会升慢一点。平台除了技术一端,它还会有人工的运营端,运营负责做什么呢?负责举把枪,把坏内容打下来,另外一只手得举个打气筒子,比如说有账号是做三农的,非常正面,又受欢迎,平台可以锦上添花。我觉得站在地上,从原点开始给账号打气儿,这事儿吃力不讨好,这应该不是事情的真相。没有任何一个平台,想把气球打到天花板上,就是平台过分依靠一个网红,这个网红可能会反向牵制平台,会让平台的发展受到限制。
03
传播学研究发现信息茧房
与算法没有直接关联
董晨宇:算法让内容分发方式变了,从编辑推荐到算法推荐,我们经历了怎样的改变?
三一博士:这两年有一个说法,就是大家都被算法「框死了」。我个人不是很认同这个说法。如果说,今天大家被算法框死了。回到 20 年前,大家是不是就被编辑框死了呢?原来我们看杂志的时候,同样一本杂志有讲旅游的,有讲美食的,有讲娱乐八卦的,你自己也会筛选的。你不喜欢的东西,你也不看它,那不也是信息茧房嘛? 其实我觉得如果把所有的问题都推到算法头上,不是很公平。
三一博士:除了算法以外,平台还有一个功能叫搜索。如果你真的想试点别的东西的时候,你可以主动去搜。在搜索过程中,我相当于拓大了自己的边界,算法不是一成不变的,它要不断地去迭代。
董晨宇:我们不是一直说大家只爱看自己爱看的东西。我还看过一篇论文说,事情不是这样的, 人们其实特别喜欢看自己不同意的东西,因为这要为他们的反驳提供素材,这也是一种情绪价值。
董晨宇:还有一个我觉得特别有意思,就是公众如何看待这事儿?
三一博士:其实我觉得从传播的角度上来说,「阴谋论」永远是有市场的。
老蒋巨靠谱:在我看来,公众会有强烈「了解世界运行背后黑幕」的意愿,这是一种非常强的知识原动力。另外对于一个复杂生态,绝大多数人会进行简单归因。因为想把复杂的原因弄懂太费劲了,你把一个复杂系统的各个环节、各个零件都弄明白,而且得不出一个让你爽的结论,最后发现大家都有责任,那坏蛋到底是谁呢?要么是一个人,要么是一个词。 算法很多时候就是这样一个「背锅」的词, 而且它还是一种新技术,作为一个新技术出现时,大家总是对它抱有怀疑的。
董晨宇:我可以补充一个传播学的视角,在人类历史上新技术出现的时候,几乎没有不被骂的。最夸张的是中世纪英国教会说「自行车毁了青年一代」。为什么?因为青年人有了自行车,周末就不去教堂了,去郊游了。 算法不是万能的, 算法也不是完美的。任何一个技术,最开始都免不了被大家所广泛的讨论,但讨论能够促进算法继续向善,让技术为社会服务。
三一博士:其实技术永远都是工具,大家经常会把工具的问题,一定要归因到技术本身是好是坏。
董晨宇:从传播学的角度来讲, 绝大部分研究者其实是证伪了「信息茧房」概念,就是信息茧房和算法之间并没有非常直接明确的联系, 但这个事在公众心中仍然解不开这疙瘩。
三一博士: 其实不管有没有算法,茧房都是必然存在的, 即使你能平等的获取各个领域的信息,个人也是有偏好的,就像原来咱们看电视一样,比如有人喜欢体育,看到戏曲频道就是会快速换台。在传统媒体时代,这个东西很难归因,但是在今天的话就是有背锅的,算法就很容易被推到风口浪尖之上。
04
算法机制拓展知识边界,
促进教育普惠
董晨宇:我还有一个问题,对于二位来讲,算法给你们带来过哪些意料之外的惊喜?
老蒋巨靠谱:抖音经常给我推「某个城市+摸底」,就是这么一个标题。我很喜欢看这类内容,比如诸暨是最大的袜子产地,江西的某一个县城是全球最大的某某品类生产基地。这种东西带给我的惊喜,让我了解到之前不知道的信息,而且它又是跟我高度相关的,就是在咱们这片土地上发生的事情。
董晨宇:我也是通过短视频才知道一个事,河南桑坡是中国最大的雪地靴生产地。 如果不是短视频,我可能这辈子都不知道。
三一博士:我之前看到有一个小伙「湖远行」,骑自行车周游全世界,那小伙岁数不大,骑自行车全世界跑。他沿路会遇到其他骑行的人,他们可能换个面包吃,或者你的车爆胎了,我带你走一段。可能我一辈子永远不会经历这样的事, 但是通过算法推荐,我见到了一个完全没见过的世界, 一种完全没见过的生活方式,这让我觉得还是挺惊喜的。
董晨宇:我补充一个觉得特逗的事。我是当老师的,我特别在意乎教育方面的内容。有一天,我在抖音上刷到了清华大学的课程直播,我天天干这工作,其实我不想看,但是真正把我留住的是那个留言,因为一堆人在底下喊:「妈妈我上清华了」。如果严肃地说这个事,其实代表着一种教育的民主化。有人在一线城市,有人在乡村,但是通过互联网, 通过平台的算法 ,每个人都有可能去接受中国最好的教育,我觉得它至少给我们燃起了一个希望, 成为了教育普惠的一个起点。
董晨宇:我们聊了这么久,流量是怎么来的,创作者是怎么工作的,一直聊到了更社会化的问题,算法和社会之间复杂的交叉关系。这期视频并不想给大家留一个确定的答案。 当我们理解一个新技术,理解一个新行业时, 应该保留更多可能性和开放性,去思考不同的侧面。 只有这样,一个新职业的发展才能更快速,新技术与社会的交融才能更加顺畅,我想我们的交流也是一个起点,相信在未来我们能见证算法、平台、内容等这一系列的东西,对社会产生更深刻的影响,让我们拭目以待吧。
2024 年末决战,AI 视频「卷麻了」
AI 视频又卷起来了。
12月中旬 Sora 正式发布,几天后谷歌推出了号称最强的 Veo 2 模型,紧接着国内 AI 视频的“卷王”可灵 AI 也宣布再次升级,更新到了 1.6 版本。
今年 6 月推出以来,可灵 AI 在过去半年里已经完成了好几轮基础模型能力和产品功能的迭代,而今年 9 月推出的可灵 1.5,已经是国内乃至全球性能最出色的视频生成模型之一。
在智源研究院的横向测评中,可灵 1.5 版本以其出色的表现排名第一;而在谷歌的横向测评里,在拿谷歌自己的 Veo 2 与包括可灵在内的四个市面上主流视频模型的生成效果对比中,可灵 1.5 模型也是除 Veo 2 外表现最好的一个。
谷歌基于外部数据集,测试 Veo2 与其他四个视频模型的表现对比
而相较于此前的 1.5 版本,新发布的可灵 1.6 在文本响应度、动态质量以及画面质量等多个核心指标上都做出了显著提升。
可以说作为「赛道卷王」,可灵再次拉高了视频模型竞赛的天花板。
从武侠招式到漫威皮卡丘,可灵 1.6 让想象力无缝衔接现实
综合测试结果,可灵 1.6 能够更加精准地理解复杂的文字描述,特别是在运动、时序动作和镜头运作方面的反应更为灵敏,生成的视频不仅在运动表现上更加合理,人物表情也更具自然感,视觉效果则在色彩、光影、细节处理上做到了进一步优化。
此外,可灵 1.6 还在图生视频的能力上进一步优化。据极客公园了解,可灵团队内部评测 1.6 的图生视频效果比 1.5 模型整体效果提升 195%,带来了更加出色的创作体验和视觉效果。
更新一出,不少 AIGC 创作者马上用可灵 1.6 尝试创作,其中有不少惊艳的作品。
AIGC 创作者 @Jadewu 的作品|视频来源:可灵AI
首先是这个表现武侠小说的经典招式——「万剑归宗」的短片。这个最早出自经典武侠漫画《风云》的招式,由于招式设定复杂,即使在火遍国内的电视剧版《风云》中,由专业的演员配合后期特效制作,也并不容易在电视剧中完美还原漫画中对这一绝招的描述。
可以看到,在可灵 1.6 创作的短片里,不仅很好地理解了「万剑归宗」这个复杂的招式,呈现效果、人物动作和兵器的特效也非常惊艳,整个场景充满真实感与震撼力。即使是在快速移动的镜头下,画面依旧保持清晰,每一个动作都生动流畅,毫无卡顿或割裂感。
创作者北邦发表在爱智岛上的作品|视频来源:可灵AI
创作者北邦则从「尚舞国风」这一风格化测试的角度对可灵1.6进行了测评。风格化测试通常涉及到模型对风格化指令的理解和执行能力,以及生成视频的视觉质量。
该创作者使用了SD Flux @ Liblib Webui 进行文生图,再用可灵1.6图生视频以及Flux LoRA混合生成,「目前可灵1.6已经对复杂的画面风格有了更多的理解和动态塑造能力,这个主要得益于1.6升级了对提示词语义理解和动态表现力。」
丝滑的舞蹈动作、浮世绘的色彩,以及精细的背景渲染,都是可灵1.6在风格化测试中展现出的亮眼表现。相比于以往的版本,1.6在对复杂画面风格的理解上有了显著的进步,能够精准捕捉并再现用户设定的艺术风格。不仅如此,模型在动态表现上的提升,也使得画面中的动作更加流畅自然,仿佛真正的舞者在其中翩翩起舞,令人惊艳不已。
AIGC创作者温维斯的作品 |视频来源:可灵AI
AIGC创作者温维斯则用可灵1.6生成了9个「漫威皮卡丘」,从生成效果来看,酷炫的漫威「外壳」跟可爱的皮卡丘融合得毫无违和感。
整体来看,动态场景流畅,动作生动自然,画面质量也很高,无论是皮卡丘的动作,还是漫威角色皮肤的细节,1.6都流畅、逼真地呈现了出来,不知道的还以为漫威真和皮卡丘梦幻联动了。
细节与动态的较量:可灵 1.6 对比 Sora
AIGC创作者归藏的作品|视频来源:可灵AI
在可灵推出1.6版本前些天,OpenAI也终于将铺垫了长达10个月的Sora正式推出,也因此,AIGC创作者归藏在对比可灵1.6、1.5版本的同时,对Sora也进行了对比。
首先来看看模型在理解文本描述并生成相应视频内容的不同能力。特别是在涉及复杂动态场景和时序动作时,模型是否能够准确地将文字转化为画面。
从文本响应度上来看,Sora对文本的理解似乎不太到位,比如在第一组里,Sora的「猛兽」并没有站起来,更没有抬头咆哮,更没有雨水落下,而可灵1.5里,「猛兽」做到了咆哮,随后天空也开始落下雨滴,但还是缺失了「抬头」这一下,1.6里则将「抬头咆哮」这一点完整地实现了。
在视频生成过程中,动态场景的流畅性和运动的自然度至关重要。这一点在第二组的小兔子吃月饼体现的比较明显。这一组里的Sora,兔子只是捧着月饼塞在嘴边,并没有「吃」这个动作,月亮的移动也是「倏」地一下,而可灵1.5则生动体现了「吃」这个动作,不过月亮的移动还是算不上「缓慢」,但1.6版本则在「吃」的基础上,将月亮的移动也变得「缓慢」了。
AIGC创作者归藏的作品|视频来源:可灵AI
画面的质量直接影响观看体验。这组关于柿子树的测试,可以比较明显地看出模型在色彩还原、光影效果和细节处理方面的不同表现。
在这组对照里,Sora呈现出的柿子树首先就看着有点「假」,柿子的颜色亮的实在有点突兀了,在镜头的推移上基本没有变化,而可灵1.5里「柿子」的形态首先就看着跟真的差不多,镜头由近拉远的同时,冬雾也在空中腾起,可灵1.6则更进一步,不仅柿子在树上的分布有所变化,还有阳光从远处的群山处折射过来,并且雪花在空中飞舞,画面的丰富度与质感都明显优于前两者。
从“中国的Sora”到“世界的可灵”
在过去的一年里,视频生成模型迎来了持续的更新迭代。从Sora的首发引发业界轰动,再到各大国内外厂商相继推出新版本,AI视频生成领域无疑进入了一个加速发展的阶段。
可灵 AI 刚问世时曾被外界称为中国版 Sora,备受业界内外期待,推出后一度位列全球访问量最高的AI视频产品,时至今日,从前述可灵1.6的升级以及对照中超越Sora的表现可以看出,可灵 AI 已成为国产 AI 的代表,在国际上证明了自己的实力,成为全球视频生成领域的标杆之一。
在这场竞速中,可灵 AI 无疑扮演着“赛道卷王”的角色,正在以一系列创新和技术突破不断刷新行业天花板。
6月,可灵 AI 初次亮相,就以全球首个真实影像级视频生成大模型的姿态惊艳全场,随后,其技术能力迅速进化,快速推出了图生视频、视频续写、运动笔刷等创新功能,不仅显著提升了画面质量、动态表现和指令响应能力,还将文生视频的生成时长扩展至10秒,为创作者提供了更加自由的发挥空间。
到了9月,升级版可灵 1.5发布,进一步增强了画质、动态质量、运动合理性、语义理解等方面的表现,展现了可灵 AI 在细节和创意上的强大潜力,全球用户在社交平台上创作了大量创意视频,充分展示了这一技术在艺术创作和内容生产中的无限可能。
自推出6个月来,大大小小迭代10余次的可灵 AI ,不仅此前每一次的更新都超越了以往的局限,不断推动生成效果达到新高度,赋予了模型更强的适应性和创造力,此次从1.5到1.6的升级,则更是体现了对细节的极致打磨。
(可灵1.6模型概念宣传片)
无论是文本响应、动态效果,还是画面质量的提升,可灵 AI 在技术上实现精细化调整的同时,也在无形中推动了整个行业天花板的提升。这一版本的发布不仅展现了国产技术的强大实力,更加速了全球AI视频生成领域的技术进步,可以说是「卷王之王」。
如今的AI视频生成不仅仅是技术层面的比拼,更是各大厂商在算法优化、细节呈现、生成质量上的全面较量。在这场竞争中,可灵 AI 凭借其不断升级的技术和强大的创造力,已位列行业前沿。数据显示,可灵 AI 发布半年来,已拥有超过600万用户,累计生成超6500万个视频和超1.75亿张图片。
在这一轮竞争中,可灵 1.6 的亮相,不仅进一步拉高了行业天花板,也意味着,随着技术的不断突破和创作空间的扩展,AI视频生成的未来将不仅仅停留在技术层面的革新,而将开启全新的视觉创作时代。