抖音给咱们弄了个“算法体验”的小程序,专门让人看看抖音到底是咋把视频推送到咱面前的。为了让大家伙儿看明白,抖音安全与信任中心官网把这事儿做得特直观,搞了个可交互动画,甭管是懂行的还是零基础的,都能上手玩。想体验?直接去官网搜“看得懂的算法”,或者在抖音App里找这关键词就行。 虽说抖音每天都得给大伙儿推送上亿条新内容,但算法这活儿可不像咱想的那么容易,它得在一堆素材里给咱挑最顺眼的。这个过程大概分两步:先把觉得可能对的内容捞出来(叫召回),再排个顺序(叫排序)。 先说说召回这一步,“体验算法”板块特意给咱们演示了双塔模型和兴趣时钟。双塔模型是个干活的主力,你选个不同的用户角色看看,它能算出虚拟用户对视频的好感度是多少。这里头还藏着不少玄机呢!只要你拨动兴趣时钟的指针,你就会发现算法不光看你爱看啥,还会看时间点来调整推荐内容。比如上午喜欢看科技新闻的用户,晚上没准就变成爱看电影了。 召回的活儿干完了,系统大概挑出了几千条候选内容,接下来就进排序环节了。这一步也用了Wide&Deep模型来演示。所谓排序,说白了就是给这些视频打个分,谁的分数高谁就排在前面。打分的依据主要看咱们的操作行为(点击、点赞、转发啥的)。模型不光看咱们以前爱看啥(Wide部分负责“记忆”),还想帮咱们挖掘出那些没发现的潜在兴趣(Deep部分负责“泛化”),这俩部分加起来就算出了最终的“排序分”。 为了不让大家老是看到同一类东西(这叫“信息茧房”),算法在推荐的时候还会搞点小动作:打乱顺序、加些不一样的内容混进来。在互动演示里你只要拖动那个滑块(叫随机扰动强度),你就能看到推荐列表是咋从单调变得丰富多彩的。这就是算法打破“信息茧房”的妙招!它不光帮咱们发现和记住喜欢的东西,还把那个更广阔的世界给咱们露了出来。 IT之家那边也注意到了这事:去年3月抖音安全与信任中心刚上线时就把算法原理给公开了;到了今年1月又说了要进一步做好透明化工作。看来这次把技术细节拉出来说事儿的意思就是要让所有人都明白:AI这事儿咱也能看懂!