Professional and persistent, keep improving
短视频推荐算法中的数据收集是怎样的?
1.用户行为数据
浏览历史:这是最重要的数据之一。算法会记录用户观看过的视频,包括视频的主题、类别、时长等信息。例如,如果用户经常观看体育赛事的短视频,系统就会标记用户对体育内容有兴趣。
点赞、评论和转发:这些互动行为能够强烈地体现用户的喜好。点赞表示用户对短视频内容的认可;评论则反映了用户更深层次的想法,可能是对内容的提问、补充或赞美;转发意味着用户希望将这个视频分享给更多的人,也说明用户认为这个视频有较高的价值。比如,一个用户频繁点赞和评论美食制作短视频,并且经常转发给朋友,算法就会判定该用户对美食制作内容有较高的兴趣。
关注列表:用户关注的账号代表了他们长期感兴趣的内容领域。如果一个用户关注了许多健身博主,那么算法会倾向于认为该用户对健身相关的短视频有持续的需求。
搜索记录:用户在平台内的搜索关键词也能体现他们的兴趣点。例如,用户搜索 “旅游攻略”,说明他们可能正在计划旅行或者对旅游相关的短视频感兴趣。
2.视频内容数据
标签:创作者在发布短视频时会给视频添加标签,这些标签通常描述了视频的主题、类型、风格等关键信息。比如一个旅游短视频可能会被贴上 “旅游”“风景”“攻略” 等标签。
视频类别:平台会对短视频进行分类,如生活记录、知识科普、才艺展示等类别。这有助于算法在推荐时,从相应的类别中筛选出符合用户兴趣的视频。
视频时长、画质等基础信息:这些因素也会在一定程度上影响推荐。例如,对于喜欢快速获取信息的用户,算法可能会推荐时长较短的短视频;对于对画质要求较高的用户,画质较好的短视频可能会优先被推荐。