极端实验:推荐算法如何探寻我们的兴趣边界?

  • 时间:
  • 浏览:0
  • 来源:5分赛车娱乐平台-5分赛车下注平台_5分赛车注册平台

声明:本文来自于微信公众号 另另另一个 胖子的世界(ID:we_the_people),作者:柳胖胖,授权站长之家转载发布。

算法到底让朋友的信息环境更闭塞,还是更多元?机器让推荐和送达更容易了,但朋友比刚刚懂了更多吗?你什儿 世界并全是是是不是就像是一套算法,只提供给你前要的东西,这套算法并全是是是不是也在进化?

新闻实验室的方可成老师在系统性地阅读了近年来发表在国外一流学术期刊上的研究后发现:使用社交媒体和算法推荐App的人,并越来越明显跳出视野变窄的什么的大问题,大多数人阅读的内容依然有相当的多样性。

“研究者们选择了 21 个月的数据。朋友将用户分为两组,一组是根据算法推荐选择电影观看的,叫做“跟随组”;另一组是不理会算法推荐的电影,叫做“不理会组”。朋友发现:算法向“跟随组”推荐的电影,时不前要比向“不理会组”推荐的电影更加多元化。也假如有一天说,根据算法的推荐选择电影,假如有一天进行打分,实在会让算法更好地学习到你的喜好,假如有一天给你推荐更多样的片子;而将会不根据算法的推荐来看电影和打分,反而会让算法给你推荐更窄的片子。也假如有一天说,在不使用算法推荐的请况下,用户的视野反而变窄得放慢。”

学术的研究结果当然值得参考,不过,将会是针对另另另一个 非常极端的内容消费用户,推荐算法又会带给他什么呢?基于另另另一个 严谨的产品工作者的好奇心和动手欲,以及对什么什么的大问题的困惑,我买了另另另一个 新手机号,找了一台越来越装过今日头条的廉价安卓测试机,现在开始了我的“反人类”探索之旅。

我的思路大慨是原先的:在今日头条上只关注另另另一个 从体量上来说极其小众的内容领域,逐步成为它的资深内容消费者,假如有一天观察在你什儿 过程中,头条会何如投喂我在你什儿 兴趣领域的偏好,以及最重要的,最终头条是是不是会用你什儿 领域的内容完整淹没我,我我刚刚并能看得人你什儿 领域的内容。

在第一次打开头条的刚刚,我是另另另一个 空白未登录的请况,还越来越任何操作行为或关注任何账号,头条推荐页给我的内容也是比较随机的,相对以社会新闻和热点内容为主,何如让 类内容随机分布各每根。

何如让 何如让 ,我先注册登录了一下,假如有一天在推荐内容的“更多”里,我忽略了头条置顶给我推荐的娱乐,健康,科技,体育和历史五大分类,假如有一天直接把列表拉到了最下方,关注了最小众的“收藏”领域。

一同,我还一次性关注了头条推荐的 20 个收藏类的内容创作账号。收藏你什儿 品类,主要包含的假如有一天文物和古玩类的内容,包括诸如字画、钱币和邮票等等同类的都算,而我当事人对你什儿 领域基本属于一无所知的请况。

关注完 20 人后,我还做了一件事,假如有一天把收藏标签移到了最靠近推荐标签的位置,原先内容阅读起来最方便,理论上,这也应该增强了系统判断给我推荐收藏类内容的权重。

今日头条App里默认进入的推荐页,前三位一般被国家重要新闻给存在了, 2 条是默认置顶, 1 条是人民网原先的官媒发布的热点新闻,从位置上来说,从第四条现在开始才是是不是经过算法推荐展现给你看的内容。

在第一次的刷新中,头条似乎还越来越给我打上很强的"收藏爱好者“的标签,整个前 10 条就每根和收藏相关的,剩下 9 条里,除了两条社会新闻两条娱乐新闻,其它五类内容各每根。

在我第二次的刷新中,结果依然差太满,收藏并能每根,社会娱乐两条,其它随机的五类内容(与第一次的不同)各每根。

第三遍还是越来越。

我判断头条不言而喻将会我假如有一天关注了一堆收藏类账号,就判断我只对收藏类的内容感兴趣了,将会我每次假如有一天在推荐流里刷下来看标题,还越来越跟任何的收藏文章之间产生互动(转评赞),也越来越和何如让 类的内容有过互动,何如让 何如让 我的推荐流里时不时保持了原先的比例:10%的收藏类内容+不断更换的其它类内容。

不过实在内容流里收藏内容太满,假如有一天在“朋友也在用头条的”横向推人的流里,跳出了越来越另另另一个 请况,左右滑动的区域内一共可不前要显示 10 个账号,其包含 9 个是收藏类账号。

从这里也可不前要看出,对于荐人和荐内容,头条将会是采用分开的两套策略我猜测,账号推荐上,头条希望快速收拢以获取你的关注关系,增强它App结构的连接,何如让 何如让 直接给你推将会关注过的同类账号,但内容推荐上,头条前要你进一步有更多反馈数据后,才会逐步让某一类内容更多存在你的推荐流。

于是从新的一次下拉刷新现在开始,我做了越来越一件事:对头条在推荐流里给我的每每根收藏类内容,都点击进入文章,慢慢再慢慢地下拉到底部(当然我另另另一个 字也没看进去),假如有一天点赞,点收藏,评论(一般就几个 字:真棒,好喜欢,不错,同类的)。

大慨从第五次刷新现在开始,收藏类内容的比例终于现在开始变多(我缘何要说终于),一同,推荐流里跳出我未关注的收藏类账号发的内容,我会在内容互动后一同关注作者。

大慨从第 8 次现在开始,收藏类内容达到了200%的比例,而一同推荐流里还现在开始跳出人文和历史类的内容。

我判断这两类内容会跳出,是基于算法的“协同过滤”,将会想精通收藏的领域头上前要非常了解文化和历史类的知识,原先才有助判断各种文物和古玩的价值,何如让 何如让 另另另一个 “收藏爱好者”必然也得看文化和历史的内容。

(解释一下:常见的协同过滤算法有并全是,并全是是基于用户的(user-based),也即计算用户之间的同类性,将会A和B的兴趣相近,越来越A喜欢的电影,B也很有将会喜欢。另并全是是基于物品的(item-based),也即计算物品之间的同类性,将会电影C和电影D很同类,越来越喜欢电影C的人,将会也会喜欢电影D。)

这里可不前要看出,尽管收藏类内容越来越小众,但头条的算法依然找到了一批和我同类的“收藏爱好者”,并把朋友同样爱看的“人文和历史”内容推到了我的头上(尽管比例还很小,各每根)。

(不过实在关注了收藏的人,很大慨率会关注文化和历史类的内容,但反之貌似大慨率不言而喻,文化和历史爱好者不言而喻对古玩钱币什么的有兴趣。假如有一天对于头条的机器算法来说,更好的推荐策略肯定是,给另另另一个 对文化和历史有兴趣标签的用户在推荐流里偶尔夹杂每根收藏类内容,视乎其反馈来决定是是不是推荐更多。头条算法架构师曹欢欢曾表示:“朋友会留一次要比例流量,探索用户的兴趣,比如每几刷,或有一刷的位置假如有一天探索用户的兴趣,推荐何如让 模型不确认用户是全是感兴趣,假如有一天模型想探索一下,会有何如让 原先的流量。”)

说回我的实验,我在刷新后“对每条收藏类内容给予重度反馈假如有一天忽略其它一切内容”的行为放慢获得了算法的深度重视,收藏类内容从比例来看快速升高,最多的刚刚达到了每 10 条里有 6 条收藏强相关的内容,大慨1- 2 条人文将会历史的内容,剩下 2 条还是社会热点和娱乐新闻。

假如有一天一般在前三条里,必有每根是直接关注账号发的收藏内容,剩下两条将会是相关人文历史领域的内容将会还未关注的账号发的收藏类内容。

最后,我把你什儿 “极端收藏爱好者”的身份坚持了两周左右,每天重复十几个 到数十次不等的刷新,假如有一天只对收藏类内容进行点击阅读、评论、点赞、收藏和关注。

不过,最终头条给我的推荐比例却越来越继续增加,前 10 条里,除了广告比例提高(将会是实在老用户更能忍?),最多的刚刚还是5- 6 条收藏类相关内容,少的刚刚2- 4 条。其中,必有 2 条以上是收藏类强相关的内容(直接探讨收藏物并全是),1- 2 两条收藏弱相关的文章(或我关注的收藏领域账号发布的其它领域内容),以及1- 2 条文化和历史强相关内容,而剩下还有4- 6 条则全是非收藏相关的内容。

看起来,推荐算法不言而喻会跳出 10 条里 9 条全是收藏类内容的请况。经过你什儿 十分极端(真实用户不将会只在新闻资讯App里盯着收藏内容不放)但实在不言而喻麻烦的实验刚刚,我整体的感受有以下几点:

1、推荐算法在做的并全是以某每根内容去压中你的兴趣,假如有一天以“组”为单位(10- 20 条)来测试你(身份标签)、你将会会喜欢的内容(兴趣标签)和你当下的请况(环境标签),命不命中是另另另一个 概率游戏;将会要条条命中、甚至单条命中实在很困难,但以组为单位去看压中过(1- 2 条)的概率,很有将会在90%以上。

2、何如让 何如让 纯以兴趣推荐为基础的产品,最难的是用户前三次使用的刚刚,将会流失率很高、印象很差,中间基于用户在内容消费上的需求和行为为基础,使用大慨率会越来越顺。

3、资讯推荐类平台没将会最终只提供特定某一类内容给你看,将会这本质不言而喻有助它当事人的日活和时长,当你的今日头条完整变成“收藏头条”后,也是另另另一个 用户被抛弃的刚刚。

4、比如头条架构师曹欢欢曾提到:“聪明算法工程师全是希望当事人的用户兴趣窄化,就像越来越另另另一个 商场的经理,希望顾客每一次来到商场都只关注同一类别的商品。商场经理都希望顾客关注尽将会多的产品品类,算法工程师也希望用户尽将会的拓展当事人的兴趣。”

“另另另一个 喜欢鞋子的用户,假如有一天每次来商场都能快速买到当事人喜欢的鞋子,用户的单次消费就很开心,但最终用户会减少来你什儿 商场的消费次数(包括每次来商场逛的“用户时长),除非他又产生了买鞋子的需求。要把用户长期留存下来,就要穿透他的兴趣,拓展他的视野,给你衣服、饮食、看电影什么消费,全是商场里完成。”

5、要注意的是,传统上朋友时不时提到的“信息茧房”并全是并全是理论(theory),假如有一天并全是假设(hypothesis),至今仍未得到数据量化和案例的证明。学术上更常见的是概念是“信息回音室(echo chamber)”和“过滤气泡(filter bubble)”:朋友在何如让 社交和新闻类产品里更容易听到回声和信息被过滤,但这全是同类茧房的完整束缚,假如有一天代表“另另另一个 人的信息获取不再多元”“意见被单一来源的信息左右”

6、相对算法推荐,过去报纸、杂志和门户网站更有将会造成“信息茧房”何如让 ,将会朋友的内容本质上是由一群天天泡在一同相互影响的编辑们推荐给你的。而朋友圈的信息将会是最容易造成“信息茧房”的,前提是你只通过朋友来获得资讯和看法,但你什儿 什么的大问题本质上这可是我能是是不是“社交偏食”而已,自古以来人总倾向于和当事人喜欢的人多打交道和聊天;

7、从认知心理学的深度来说,人类大众时不时难以除理的是“确认偏见”(confirmation bias),也即更我刚刚相信当事人将会认同的内容。

将会你只和当事人聊得来的人交朋友和聊天,且只看当事人认同的内容,坚持相当长一段时间后(封闭环境不被打破),越来越他还真有将会无限接近信息茧房请况,只不过你什儿 茧房是并全是作茧自缚。

但你什儿 刚刚,推荐算法反假如有一天可不前要帮你进行茧房穿透的武器之一,并对抗将会年岁增长而原困的好奇心的衰减。

比如在我作为另另另一个 “极致的收藏爱好者”的数据反馈之下,头条并未给我推的全是收藏类内容,还是保持了社会热点新闻的比例,假如有一天渐渐为我找到了文化和历史内容,并在后期持续测试我的兴趣边界,不断找到了将会和我作为另另另一个 “收藏重度爱好者的用户画像”相匹配的内容(对整理有历史价值的物品、及其相关交易极度感兴趣、大慨率是男性、注重传统文化、年龄在估计在 40 岁以上),给我推荐了财经、科学、钓鱼和养生类相关的内容。

8、文初提到的方可成的学术研究里,还说到原先原困解释了朋友缘何会对“信息茧房”信以为真,那是将会朋友的“心口不一”:朋友会向研究人员过度报告当事人常看的何如让 媒体(通常是和当事人的态度相近的媒体),而越来越报告另何如让 当事人也实在看得人的媒体(和当事人的意见相反的媒体)。比如你是另另另一个 美国政治自由派,你平常将会既看自由派的媒体,也接触到了保守派的媒体,假如有一天在向研究人员报告当事人的媒体消费请况时,你只报告了自由派媒体,而隐藏了当事人消费的保守派媒体。

朋友喜欢宣称和坚持当事人的人设,假如有一天有时越来越正确回忆当事人的行为,造成了同类“幸存者偏差“的效应。但整个世界实在时不时在滚滚向着多元化的一面发展,用户和内容在多元化,算法实在也在多元化。