您现在的位置是:首页 > 创业新风口创业新风口

抖音的奇幻漂流:为什么海外版抖音TikTok让用户如此着迷?

AIboAdmin2022-07-24 18:32:54

简介  TikTok正像风暴一样席卷全球。据Sensor Tower的数据显示,这一短视频App在苹果应用商店和谷歌Play商店上的全球下载量已经超过了20亿。它背后究竟有什么魔力让人如此着迷?答案是机器学习推荐引擎。 坦白说,谁不喜欢猫猫狗狗的搞笑视频呢?尤其是隔离在家时,刷短视频是打发时间的最佳选择。但这只是TikTok取得成功的一部分原因。不

 

TikTok正像风暴一样席卷全球。据Sensor Tower的数据显示,这一短视频App在苹果应用商店和谷歌Play商店上的全球下载量已经超过了20亿。它背后究竟有什么魔力让人如此着迷?答案是机器学习推荐引擎。

坦白说,谁不喜欢猫猫狗狗的搞笑视频呢?尤其是隔离在家时,刷短视频是打发时间的最佳选择。但这只是TikTok取得成功的一部分原因。不到两年的时间,TikTok从小规模传播的App成为了2020年月活8亿、病毒式扩散的App。

2020年1月,TikTok成为美国下载量最高的应用程序。

我是陇海(+V775 741 355免费领取抖音和海外版抖音运营资料),我这里给大家安排一堂海外版抖音直播课,可以系统的帮你解决做海外版抖音的各种问题。

人们平均每天花52分钟刷TikTok,而Snapchat,Instagram和Facebook的用户使用时长分别是每天26分钟、29分钟和37分钟。

图源:Oberlo

除了增长黑客策略,这个60秒短视频App充满了玩梗、搞笑、舞蹈和才艺。它有业内最优秀的推荐引擎之一,用户无需搜索,也不用纠结看哪个博主,轻点手指就会有个性化推荐的视频。

这种快速、简单、无穷无尽的快乐使人很难停止刷TikTok,有人称它为终极时间杀手,占据所有的空闲时间,以某种方式创造了一个现实扭曲力场——“TikTok 5分钟等于现实生活1小时”。

本文将讨论TikTok如何运用机器学习技术,通过互动分析用户的兴趣和喜好,并为不同的用户展示个性化的视频内容。

推荐引擎对数据科学界来说并不陌生。有人认为它是上一代的AI系统,确实,它不像图片识别和语言生成技术那样有着炫酷的影响力。但尽管如此,推荐引擎依然是主流AI系统之一,应用广泛,几乎所有线上服务及平台都使用推荐引擎系统,比如YouTube的视频推荐、亚马逊发送的促销邮件、浏览kindle书店时出现的“你可能也喜欢的书”推荐。

戈麦兹·乌里韦发布的研究报告以及Netflix产品总监尼尔·亨特都称,个性化和推荐的结合每年给Netflix省下的钱超过10亿美元,80%的用户都从引擎的推荐列表中选择视频。

我是陇海(+V775 741 355免费领取抖音和海外版抖音运营资料),我这里给大家安排一堂海外版抖音直播课,可以系统的帮你解决做海外版抖音的各种问题。

那么是什么让TikTok与众不同的呢?一起来看看吧!

推荐引擎介绍

有太多关于推荐引擎的有用文章和网课,本文不再一一赘述,下面两个资源有助于对推荐引擎建立基本了解:

· 从零开始创建推荐引擎的综合指南(阅读时间约35分钟,复制python代码需40-60分钟):https://www.analyticsvidhya.com/blog/2018/06/comprehensive-guide-recommendation-engine-python/

· 吴恩达的推荐引擎(视频时长一小时):https://www.youtube.com/playlist?list=PL-6SiIrhTAi6x4Oq28s7yy94ubLzVXabj

除了基础部分,产业化的推荐引擎需要强大的后端和架构设计才能实现一体化。下面是一个基本示例:

推荐引擎

一个实时推荐系统应该有坚实的数据基础(用于收集和存储数据)来支持多个顶部抽象层(包括算法层、服务层和应用层),通过这些抽象层解决不同的商业问题。

TikTok推荐引擎的设计原型

图源:unsplash

“以用户为中心的设计”是这一原型的核心。简单来说,从冷启动期的后台调整到为活跃用户提供明确推荐,TikTok只会推荐用户喜欢的内容。

如果用户点击了舞蹈视频,一开始看到的内容就定制为这一娱乐类型,随后的机制是跟踪用户行为,进行进一步分析,最终提供该用户独有的精准推荐。

高级工作流如下所示:

3个主要组成部分

在TikTok的原型中,有三个主要的构成要素:标记内容、建立用户画像和用户场景以及训练并提供推荐算法。

数据和特征

首先是数据。推荐模型的正式描述是:利用用户原创内容满足用户的功能。要提供这一功能需要输入三个方面的数据。

· 内容数据——TikTok是一个有大量用户原创内容的平台。每种内容都有其特质,系统应该能够识别和区分内容,才能提供可靠的推荐。

· 场景数据——这一数据记录的是使用场景,以及不同场景下用户的喜好转变。比如,某用户在上班、旅行、通勤时分别喜欢看什么类型的视频。

· 用户数据——既包括兴趣标签、职业、年龄、性别、人口统计数据等,也包括以机器学习为基础的用户聚类分析得到的潜在特征。

一旦收集到了相关数据,模型就会从中导出四种严谨设计的特征,输入推荐引擎中。

· 关联特征:代表内容属性和用户标签之间的关联,包括关键词配对、分类标签、来源匹配、主题标签以及潜在特征(比如用户与内容发布者的距离)。

· 流行特征:以用户交互为基础,代表国际潮流、热门话题、搜索热词、流行主题等等。

· 用户场景特征:由场景数据而来,包括地理位置、时间段、事件标签等。

· 协同特征:以协同过滤技术为基础,平衡了狭义推荐(根据喜好推荐)和协同推荐(综合用户喜好推荐)。具体而言,该算法不只考虑某个用户的浏览历史,还分析类似用户群体共同的行为(点击、兴趣、关键词、主题等)。

模型会学习以上的特征,以此预测某个内容是否适合某用户在某种场景观看。

无法度量的对象

在推荐模型中,点击率、浏览时间、点赞数、评论和转发都是可量化对象。程序员可以让模型或算法适应这些对象,然后做出最终预测。

关于我们

现在最火的自媒体,就是抖音运营。而关于抖音 运营网上的很多文章都是过时的,落伍的。我联合互联上的大牛组织了抖音运营大佬的学习社群,这里有免费的学习资源,每天直播分享自媒体教学与抖音运营和网络营销的引流最新技术,需要的可以联系我的微信:aibo474,不是学习的就不要加了。

添加学习