1 NSAgold 2019-06-14 00:34:42 +08:00 via Android 微博现在有时间线了 |
![]() | 2 leeZoom 2019-06-14 00:45:02 +08:00 via Android 布隆过滤器? |
![]() | 4 rogwan 2019-06-14 08:14:42 +08:00 via iPhone 微博应该是冷热数据分开处理的,主轴现在基本上都不是按时间顺序了,都是算法推荐。会给每个用户维护一个推荐列表,刷新过的内容,直接在列表里删除,所以你看不到重复推荐的内容。抖音推荐也是一样的思路,你重复刷新都是看不到相同内容的,因为数据是提前算好等在那里喂你的。 |
5 kingfly OP @rogwan 没个用户一个表成本还是有点高了吧,最低也要百万级别了吧?不能用 MySQL 了,每个用户提前算,这成本也不小。抖音没怎么用过,也是乱序吗? |
![]() | 7 rogwan 2019-06-14 08:37:41 +08:00 via iPhone ![]() @kingfly 维护一个列表,不是维护一个表。热数据列表的实现方式很多了,只需要处理最近几天或者最近几百条数据,不会很大的。这种数据的更新策略也有不同的方式,数据量小就全局更新,数据量大可以按策略更新。 |
![]() | 9 rogwan 2019-06-14 10:31:00 +08:00 via iPhone @kingfly 你可以测试一下微博的信息流,直接翻 100 页、200 页这样往下翻,就知道热数据用完了,微博系统其实自己就乱套啦。 |
![]() | 12 lifespy 2019-06-14 13:45:19 +08:00 我们最近也在做这个,插眼来看看大家的思路 |
![]() | 13 dragonszy 2019-06-14 14:07:07 +08:00 战略马克,不太懂。信息茧房把人群分成 2000 种应该可以了吧?维护 2000 个细分信息流,中间随机插点实时的消息,分配给千万的用户,每个用户都以为是个性化。 |