算法推荐也有分男女?知乎合伙人李大海讲述算法推荐的另一面
在今日头条、微博、快手等平台上,用户深刻地体会到了人工智能、算法推荐在内容分发方面的价值,那么,算法推荐在内容领域还有哪些应用?母爱算法和父爱算法有什么区别?机器人“悟空”和“瓦力”是如何工作的?带着这些问题,新京报记者独家专访了知乎合伙人、高级副总裁李大海。
在使用多数信息流产品时,用户会发现平台推荐的内容与兴趣是强相关的,以记者为例,在某短视频平台上,选择了“美妆”、“王者荣耀”、“内蒙古”等标签后,就很少看到在此之外的内容了。而知乎的“推荐”信息流却显得很任性,经常推荐让人“出乎意料”的内容。
对此,李大海介绍称,在内容分发领域有两种流派,有人形象地把它们称为,母爱算法和父爱算法。所谓母爱算法就是比较宠溺的算法,知道你喜欢什么,就不断给你推这个内容,让用户觉得幸福,但这也会带来信息茧房问题。
理想状态是母爱算法和父爱算法地结合。父爱算法对知乎和知乎的用户来说,尤其重要。“我们在父爱算法上花的精力尤其多,其中包括优质内容识别、排序方式优化,以及运营同学对于分发的干预。目前,以首页为例,整体的内容分发量提升了200%,人均时长提升了45%,CTR(Click-Through-Rate,点击通过率)提升了26%”,李大海介绍称。
易观新媒体分析师马世聪此前接受新京报记者采访时也表达了同样的观点,没有人工的编辑和运营,可能会由于用户的劣根性,最终出现劣币驱逐良币的后果。
李大海坦言,在知乎的运营过程中,会更倾向于父爱算法,但具体的算法是在不断动态调整的。在他看来,推荐内容首先要了解内容,知乎会首先找到专业人士定义“什么内容是好的内容”,然后再逐步把这个理解沉淀为机器的理解。
在对内容进行画像的时,会有非常多的纬度,包括发布内容的人是不是权威、内容的信息量怎么样、内容整体要表达的意图等。但最终的出发点,还是看这个内容对用户有没有价值,这个是最关注的。
李大海向新京报记者透露,未来会从自然语言理解,扩展到对音频、对图象、对视频的处理上,今年会将人工智能和算法处理团队扩大到数百人规模。目前这些技术还只是对内使用,未来不排除对外输出的可能性。
目前,知乎已经上线了视频的功能,用户可以在提问或者回答时使用视频。李大海称,视频肯定是未来重点规划的方向。“视频作为媒介的一种,非常适合在某些场景去分享自己的经验和见解,图文是取代不了视频的优势的,所以我们一定会支持好视频。”
今年3月至4月期间,国家广电总局、国家网信办、国家文化与旅游部等多部委对网络信息环境进行了清理整顿,多家平台被约谈、整改。
3月初,亦有媒体报道称,“知乎”平台因管理不严,被要求下架七天,具体时间为3月2日15时至3月9日15时。对于“被要求下架一周”的消息,知乎在此前回应新京报称:“我们将尽快调整上架”,但并未解释“被下架”是基于何种原因。
李大海称,知乎是UGC(用户内容提供)平台,并且设定由所有用户参与投票,这个机制天然就有优胜劣汰的作用,好的内容容易浮上来,不好的内容是往下沉的,这一点减小了在内容控制上的压力。
知乎还在探索人工和算法结合的“智能社区”模式。“我们有两个算法机器人,悟空机器人是反作弊的,会广告、假货等;瓦力机器人侧重语义理解,可以对辱骂、反讽等进行控制,在部分场景中瓦力准确率最高能达到99.13%。总体的思路是,先让人工智能去发现可疑的东西,再根据我们对算法的自信程度,决定要不要人工编辑介入,或者要不要其他算法介入。”李大海说。
他同时称,算法也有不完美的地方,也会存在“误伤”的情况,这就需要人工编辑进行审核。且在每个场景、每个领域,算法的能力是不同的,需要结合具体的领域进行策略分析,但人工智能的应用确实帮人力编辑降低了很多工作压力。
2016年4月,知乎上线了站内“原生广告”,即俗称的信息流广告。而2018年3月底,今日头条最先被曝光的正是信息流广告的非法“二次跳转”问题。知乎怎样做到用户体验和商业价值的兼顾?如何规避广告问题?
李大海称,知乎的商业审核可以说是整个互联网公司里面最严格的一家。“我们在内部有非常明确的运营规则,它在这个规则里面的,我们才会接受,并且会仔细对它的广告进行审核。”李大海说。
此外,在广告投放的过程中,知乎会尽可能地给用户提供,可能感兴趣的广告。“我们认为在某些情况之下,广告不仅是广告,对用户来说也可能是有价值的。但这都是在我们对广告和对用户理解的基础上进行的。”
“总体目标是建立一个开放、包容、理性的一个讨论氛围,让大家好好说话,让你发表观点的时没有顾忌”,李大海对新京报记者说。
- 标签:知乎男女
- 编辑:程成
- 相关文章