2023,重新起航
许久没有写博客,也从来没有写过公众号,那就从这篇年终总结开始吧。
2022 年对我个人来说是一个重大转折的一年。经过许久的犹豫、挣扎和思考,最终下定决心从大厂出来创业,我这艘不甘于稳定、日复一日生活的小帆船,又开始重新起航,不过这次,我的身边有一群小伙伴。
创业的动机跟我过去 4 年的工作有关,在解决超大规模互联网技术平台的可用性保障过程中,我们自研了一整套时序数据处理系统,通过采集丰富的可观测数据,构建可观测实体的模型以及它们之间的关联关系,结合海量数据挖掘技术、专家经验和智能算法(或者称之为 AIOps),我们构建了一个可观测的实时数据集市,来解决软件服务的异常巡检、可用性监控、预警及根因定位等问题,达到了非常好的效果,并且这样的数据集市在构建完成之后,在更多业务场景中也找到用武之地,例如容器资源的弹性智能调度、全站的资源和性能诊断优化等。
这个过程中,我抽象出三个底盘的理念:
-
数据底盘:也就是上文提到的实时数据集市,解决数据的采集、清洗、建模(实体及关系)、治理等。将所有层次(物理层、IaaS、网络、中间件、数据库、应用、业务、大数据生态)等数据汇总到一个时序数据湖里,打破数据孤岛,让用户可以找到数据,数据可以找到应用。
-
算法底盘:在大量的数据面前,依靠人工挖掘分析是不够的,我们需要提供算法的能力来帮助用户挖掘和分析数据。比如一个配置预警阈值的场景,当监控指标超过 10 万的时候,不可能靠人去一个一个去配置了,你需要智能的时序异常检测及预测算法来帮助你。同时,也需要建设一个算法平台来帮助算法研发、测试和运行。
-
代码底盘:仅有算法也是不够的,深度学习模型需要大量的高质量的样本数据,基于统计的算法总有局限性,特别是在泛用性上不够(无法适配未知场景),因此我们还需要结合专家的规则来做算法结果的校准和降噪,专家规则的沉淀和执行就需要一个低代码研发的平台,当时我把它称为 MaaS(Monitoring as a Service,所谓监控即服务)。将数据查询、算法、可视化等等能力都 API 化,并在低代码平台里提供,方便专家编写各种各样的规则。
随着这样思考的形成,以及后续接触到外部的一些场景,特别是工业领域、物联网领域以及金融方面,随着软件和硬件的传感器入侵到各种各样的产品和业务里,海量产生的时序数据的处理、存储和分析,会非常需要上述这样的产品及能力。
当然,我们不是去复制过去做过的的系统,而是基于上述的思考,在企业上云以及云原生的大潮下,重新思考整体的设计和架构,从头去做一套更极致和优秀的产品,这样的产品不仅是可以服务于中大型的客户,并且可以灵活地以标准化甚至 SaaS 的方式服务中小客户,将我们拥有的丰富实践服务到更广大范围的用户。
从更大的范畴来看,中国互联网在中国这个复杂、丰富并且规模巨大的业务场景下,已经锤炼出不少过硬的技术,我们也有非常优秀的工程师,是可以去参与全球的市场竞争,只是在产品化、UI 体验、国际化以及对用户需求的更细致挖掘上面,还有很多值得提升的地方。
告别稳定的、有保障的生活并不容易,不过我在加入大厂之初就想过,下一份工作要么就是创业,要么就是一干到底了。转眼之间已经是奔四的年纪,回忆当初成为一个程序员的初衷是创造一个世界级的软件,我距离这样的目标仍然非常遥远,我仍然热爱编写代码,仍然对世界拥有一份好奇心,在和即将创业和已经创业的朋友聊过之后,痛并快乐的体验吸引着我。我从来不是一个完全理智的人,否则也不会在 12 年离开淘宝加入 LeanCloud 创业,况且,一个理智的人应该不会在这个年份去创业吧,哈哈。在萌生这样的想法并且不可抑制之后,我也找到了志同道合的伙伴,说干就干。
从 4 月份离职到现在,公司的成立,团队的构建,产品的设计和研发,这个过程有太多值得总结和回味的地方,有机会再细细分享。这个过程中得到许多人的帮助和信任,心里充满感激。我自己一个不成熟的感受就是,创业其实是将你过去一段时间的积累重新梳理、挖掘并且充分发挥的过程,创业其实是从很早就开始的。同时,创业的过程仍然需要去注重知识、人脉和技能的积累,否则总有一天会把过去的积累掏空,你就很难去面对未来的挑战。
既然是我们说了算的公司,我们当然不想再去做一家我们“讨厌”的公司。我们希望公司的氛围是开放、透明,充满信任和鼓励,简而言之,它必须是一家常识意义上的好公司。常识我们都懂,什么是好人,你有一些基础的判断,什么是好公司,大家也有基础的判断。回归到常识,很多事情的价值判断是一目了然的。但是好,不意味着是和稀泥,不是老好人,而是在充分的、透明的沟通下,大家对做事的目标、方法达成一致,有一致的追求和品味,并且对这些目标有严格的定义,完成的过程和结果有严格的要求。
我们也希望做一个好产品,它不能只是我们说好,它必须真正能帮助到客户,解决客户的痛点,同时,它必须有好的文档和 UI/UX 体验,它也应该是国际化,因为作为开源的 Infra,它天然就应该是面向全世界的。它需要是实用的、解决问题的、酷的、有品味的(P.S. 我觉得我们的 Logo 和网站设计都挺有品味,哈哈)。这当然非常非常难,不过却是我们想去追求的目标。
开源是一开始既定的策略,原因也很简单,我们几个人都热爱开源,也从开源学习和吸收了大量的知识,我们想回馈开源社区。作为创业公司,做基础类的软件,开源也是一个很好的策略,国内这几年涌现出来优秀的开源软件公司也给了我们极大的启发和信心。不过做开源,我们想第一天代码就按照最终开放的标准去要求,无论是 code style 的规范、commit message 的规范,还是研发分支管理和 PR 合并的规范、issue 和文档的规范等等,我们从写下第一行代码就逐步去完善和执行,我们也希望未来所有的功能里程碑的制定、方案的设计以及完整的研发流程,也能以开放、透明的方式在开源社区里呈现,也欢迎志同道合、感兴趣的朋友来玩。
(我们在一起等将研发了半年的项目 repo 公开)
(Repo 公开那一刻的 Github 机器人消息截图)
2022 年,我们顺利将 GreptimeDB 开源,也开始基于这个 OpenCore 构建我们的产品,团队也初步磨合成形。我自己又开始大量地参与研发,Github 的热度也起来了,虽然跟团队里的优秀的年轻人没法比,哈哈。年轻人一定是越来越优秀的,如果不是,那一定是哪里出了问题。
2023 年从任何一方面来讲,都将是更具挑战性的一年,宏观层面不会很乐观,但是打铁还是需要自身硬,我们需要去走一遍技术到产品,产品到商品,以及商品走向主流市场的路,这对我和团队来讲,都是没有完全走过的路(尽管我们在 LeanCloud 已经经历了部分)。不过既然已经扬帆起航,无论前方是风平浪静的碧海晴天,还是疾风暴雨的惊涛骇浪,也只有妥善掌舵,勇往直前!
-
GreptimeDB: https://github.com/GrepTimeTeam/greptimedb
-
Greptime: https://greptime.com/