微博基于Docker的混合云平台设计与实践

微博目前有 8 亿注册用户,单日活跃用户数达 1 亿多。微博总体分为端和后端平台,端上主要是 PC 端,移动端和第三方开发者,后端平台主要是 Java 编写的各种接口层,服务层及存储层。就前端来说,每日超过 600 亿次的 API 调用,超过万亿的 RPC 调用,产生的日志就达百 T+。对于这么大体量的业务系统,对于运维的要求也很严格,就接口层来说,SLA 必须达到 4 个 9,且接口平均响应时间不能高于 50ms。因此技术团队会面临下述各种各样的挑战。

亿级用户下的新浪微博平台架构

新浪微博在2014年3月公布的月活跃用户(MAU)已经达到1.43亿,2014年新年第一分钟发送的微博达808298条,如此巨大的用户规模和业务量,是什么样的后台系统在支撑呢?现在,技术框架在平台发挥着越来越重要的作用,驱动着平台的技术升级、业务开发、系统运维服务,本文限于篇幅限制,没有展开介绍,后续会不断地介绍核心中间件的设计原则和系统架构。

微博推荐算法简述

基础及关联算法 1.分词技术与核心词提取 2.分类与anti-spam 3.聚类技术 4.传播模型与用户影响力分析 主要推荐算法 1. Graph-based 推荐算法 2. Content-based 推荐算法 3. Model-based 推荐算法 混合技术 1.时序混合 2.分层模型混合 3.瀑布型混合 4.交叉混合 Online 与 offline 1.计算过程拆解的离线部分 2.离线挖掘的优质候选集 3.具有较高相似度的推荐结果集

微博推荐引擎体系结构简述

任何不拿出干货的技术文档都是耍流氓,首先上体系结构图,如图所示,在整体体系结构上,微博推荐可以被划分为4层:前端展现层、应用层、计算层以及数据层,其中我们把数据日志、统计、监控以及评估也都分在数据层。接下来我会逐一介绍他们的目的,作用、技术与发展。更为细致的描述应该会在以后的博客中体现。