2020年12月10日 14:57供稿中心:北大青鸟总部
Lambda架构通过把数据分解为ServingLayer、SpeedLayer、BatchLayer三层来解决在不同数据集的数据需求。在Batch层主要是对离线数据进行处理,将接入的数据进行预处理、存储,查询的时候直接在预处理结果上查询并不需要再进行完整的计算,最后以View层提供给到业务;在Speed层主要是对实时增量数据进行处理,每来一次新数据就不断的更新View层,提供给到业务;在Serving层主要是响应用户的请求,根据用户需求把Batch层和Speed层的数据集合到一起,得到最终的数据集。Lambda架构优点是将流处理和批处理分开,很好的结合了实时计算和流计算的优点,架构稳定,实时计算成本可控,提高了整个系统的容错性、降低了复杂性。缺点是离线数据和实时数据很难保障数据的一致性,开发人员需要维护两套系统。
提交成功,感谢您的反馈。
我们会认真阅读和考虑每个用户的反馈。