工作多年,期间既做过要求强一致的系统,也做过要求低延时、高吞吐的系统,还搞过微服务的拆分和管理等工作。
在这个领域里做了这么久,零零散散写过些东西,但是一直没有完整、系统地总结过这个领域里的方法论,现在是时候完成它了。
千言万语一张表:(注意里面子项有链接,可以深入了解)
Beyond the Tech!
工作多年,期间既做过要求强一致的系统,也做过要求低延时、高吞吐的系统,还搞过微服务的拆分和管理等工作。
在这个领域里做了这么久,零零散散写过些东西,但是一直没有完整、系统地总结过这个领域里的方法论,现在是时候完成它了。
千言万语一张表:(注意里面子项有链接,可以深入了解)
自身
与合作方的桥梁
合作方
在数据开发领域做了两年左右的时间,因为工作原因,视野只是集中在离线数仓搭建这一小块内容上。两年时间并没有看到更多广阔的发展空间,导致数据开发的工作面越来越窄。为了扭转这个局面,特写此文从宏观上去重新审视这个领域的机会点在哪里。
分析框架:从得到APP上舶来的“点线面体”分析视角。个人理解,每提升一个维度,都应该有给上一维度“赋能”的能力。
graph TD A[数据集成]-->C; B[数据开发]-->C; K[数据质量]-->C; L[数据安全]-->C; M[数据服务]-->C; C[离线数据生产线]-->E; O[实时PV]-->D I[实时UV]-->D D[实时数据生产线]-->E; E[存储和查询: 数仓理论体系]-->Z F[挖掘关系:知识图谱]-->Z J[挖掘能力:机器学习]-->Z Z[数据价值]
大概率的说,比我们想像的更重要。
一个常见的情况是,很多工具的使用往往提供了一些概念上的扩展点,比如:
这些多层次的实体概念在权限管理、资源分配等管理操作上提供了很多灵活性。但也带来了一个常见的问题:在文档交代不明确的时候,会让使用者在不明确一个概念的系统定位时,出现误用的现象,导致工具本身使用的过程充满了坎坷和限制,达不到最好的使用效果。如: