不提升性能也拿奖?Dynamic Copysets 降低数据丢失概率 | TiDB Hackathon 2020 优秀项目分享
近日,由 TiDB 社区主办,专属于全球开发者与技术爱好者的顶级挑战赛事——TiDB Hackathon 2020 比赛圆满落幕。今年是 TiDB Hackathon 第四次举办,参赛队伍规模创历届之最,共有 45 支来自全球各地的队伍报名,首次实现全球联动。经过 2 天时间的极限挑战, 大赛涌现出不少令人激动的项目。为了让更多小伙伴了解这些参赛团队背后的故事, 我们开启了 TiDB Hackathon 2020 优秀项目分享系列,本篇文章将介绍 CNCF 特别奖森海飞霞团队赛前幕后的精彩故事。
Q
为什么叫森海飞霞这个队伍名?
Q
你们最初为什么会想到要做这样一个项目?能分享下你们的灵感是什么吗?
队长高松:项目起源于上海 Office 的一次争论,这次讨论发生在 2020 年 2 月,当时冯立元在群里提出了「假设一个集群机器无限多,Raft Group 无限多的情况下, 我随便挑 3 台 总能找到一个 Raft Group,所以命中 3 台就会丢数据」起初东旭不相信这个结论,直到冯立元甩出论文,看似反直觉的结论竟然是经过论证的。这次辩论也为 Hackathon 埋下了种子。目前最大的 TiKV 单体集群可能只有几百台,但我们不能等到有上千台集群时才考虑这个问题。Copysets 离真正生产环境 GA 的标准还需要非常久的调试和测试,必须在集群规模达到之前做好应对。由于 Dynamic Copysets 本身是一个调度问题,我的工作也与调度相关,因此在 Hackathon 消息刚公布时就我默默想好了选题,加上讨论中舌战群儒的冯立元,我们两人一拍即合组成了队伍。
评委唐刘:Copysets 是我一直关注的领域,几年前我就写过相关文章,但这个实现难度高并且很难模拟,所以能在 Hackathon 上看到静态的 Copysets,并通过 PD simulator 模拟出来真的很振奋。
Q
知乎上你们的帖子里写到是唯一一个让 TiDB 性能倒退的项目,能详细说说为什么吗?
Q
在比赛过程中你们遇到过比较大的技术困难是什么?后续维护的最大的挑战是?
Q
你们认为 Dynamic Copysets 为什么很少有人做呢?
Q
在参赛过程中有什么有趣的事儿可以分享吗?
Q
除了自己的项目,最喜欢哪个项目?
To 冯立元:
在 2020 年我们一起合作了很多项目,谢谢你帮助我成长了很多,希望今后还能继续合作。
——高松
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 脑子里要有个“紧箍咒” 4901942
- 2 正部级老虎被逮捕 曾督办孙小果案 4976710
- 3 网传女外卖员冒雨送餐跌入水中去世 4862065
- 4 移轴镜头看一场超梦幻的春耕 4716454
- 5 央视主持人采访雷军:Are you OK? 4683122
- 6 第一批过五一的人把汉服店挤爆了 4558798
- 7 唐一军被撤销全国政协委员资格 4497135
- 8 #电影穿过月亮的旅行# 4375621
- 9 红曲保健品可长期服用系谣言 4277539
- 10 字节跳动4人涉嫌刑事犯罪被立案 4105217