前言

推荐系统在当今时代已然成为网络生活不可忽视的一部分。时常可以得见犹如无数巧合重叠般的推送结果,昨日刚听闻新品爆红,今日便可刷到此品优惠:这就是推送算法的力量。
那么,在当今时代,了解如何正确利用这一系统就显得尤为重要了。因此,我在这里以我个人的一点力量做些分析,然后谈谈我个人的使用心得。
本计划本文是单篇的,最后还是决定分为多篇章。你现在看到的这一篇是第一篇。

在本篇章中我们主要描述技术原理和我的个人理解。

推送的技术原理

本文此处大量参考 美团推荐算法实践 - 美团技术团队 进行书写,并加入个人自身理解

表象

推送给我们带来的直观感受显而易见。今天刷到一个信息停滞一会,第二天就能看到一堆相关信息。时不时还能突然发现熟悉的好友也在某某社交平台发视频,而平台犹如精准投送一样询问她/他是否是你“你熟悉的人”。

从行为出发

数据乃算法、模型之本
各类平台凭借众多使用者,大量产生了行为数据。从使用的人的行为,可以暗示他们的意图。

我们不妨如此假设。如果你今天搜索了“猫”,这对平台意味着什么?你可能是个喜欢猫的人,可能是云吸猫,也可能是你刷到了一些关于猫的梗图想要了解。你点开了第一个搜索结果,是关于可爱的猫咪对主人撒娇的视频。这一点,可以体现你的目的更加贴近于想要吸猫。
进入视频之后,你完整的刷完了15秒的视频三轮,打开评论区评价了想要你自家的猫咪也可以更黏人一些。你评论了视频,还让视频反复播放,这就侧面体现了你真的很喜欢这一类的内容。这便是正反馈数据,体现你对这一类内容的喜爱。

反之亦然。如果你刷到了一个关于猫的视频,但是你觉得这只猫对你反复哈气,不太喜欢,快速的划过了。对于平台,快速划过视频便暗示了你不喜欢这种类型的猫视频,对他形成了负反馈,你不喜欢这种视频。

行为,侧面反映了使用者的心理。

再量化行为

但单靠这些孤立的行为是无法定义一个视频、一篇推文,更是无法定义一个人的特质的。我们常说推送是依赖“用户画像”,不过要我来说,用户画像更像是一个橡皮泥做的精致雕塑。一些如同前文所提到的基本数据,再加上一些处理过的数据,在使用过程中不断重塑修改原本的刻画,让这些内容更加贴近人心中他们的类别

在利用数据推算本质之前,我们需要产生数据。生活中处处有数学,我们可以利用各类算法将这些行为量化成数据。不过,数据也并非全部可以采用。如果一个人是广告账号,只会发送没有实际意义的帖子,那么他的数据必然是要被舍去的。

比如美团的技术团队就提到在过滤时需要对数据进行处理。像是刷单、代购、作弊这些数据,他们会严重影响算法,需要清洗掉。而训练数据应该更加注意近期的行为,这更能反映用户接下来将要做些什么。

同时,你的IP属地这样没有主动告知平台的行为也显得非常重要。一个长期在上海的用户,今天突然IP变成杭州了,还发了几张风景美图,这是在做什么?必然是到杭州去旅游看风景去了。这些额外的信息也可以被量化,加入基本的推理算法,从而达成更好的推送。

此外,再由你作为一个用户,整体的行为总结处理。然后,得到与你相近的这一人群行为的模式。而你的单个行为表现,则更可以体现出你自身的行为特制,直接有效的反映出你的个性
最直观关于群体行为模式的案例就是某短视频平台,如果你的好友观看了某分类的视频而你尚未观看过这一类,便会表现出尝试推送他的喜好,试图寻找你和这一好友共性的特质。
个体行为模式则反之,更加注重你这个人本身的兴趣