Meta平台公司今天详细介绍了一项酝酿多年的内部举措,重点是升级其数据中心的计时协议,这是该公司许多服务赖以运作的核心技术组件。数据中心的每台服务器都有一个时钟,使其能够记录进行计算的时间。由于技术原因,数据中心运营商必须使其服务器的时钟相互同步,以确保它们都显示相同的时间。

这个过程是必要的,因为某些基本的计算任务需要准确的服务器时间测量,比如建立网络连接时涉及的任务。

Meta项目负责人Ahmad Byagowi和生产工程师Oleg Obleukhov今天在一篇博文中解释说:”为了支持全球数十亿人使用我们的技术,我们需要确信每台服务器–在每个数据中心–都知道并同意现在是什么时间,尽可能的准确和精确。”

同步服务器时钟的过程是在一种被称为计时协议的技术帮助下进行的。直到最近,Meta公司都一直使用一种名为NTP的计时协议来执行这项任务。作为该公司今天详述的内部举措的一部分,其工程师将其数据中心从NTP切换到PTP,这是一种更新、更先进的技术。

overall.png

PTP在电信领域被广泛使用,但在超大规模数据中心运营商中的应用却很有限。Meta公司采用该技术是该行业的一个技术里程碑。此外,此举将使Meta公司的数据中心系统能够更有效地执行某些核心计算任务。

同步两台服务器的时钟需要其中一台服务器向另一台机器发送关于目前是什么时间的信息。第一台服务器发送的信息需要几分之一秒才能到达另一台机器,因此,出现了轻微的延迟。这种轻微的延迟使得服务器时钟不可能完美同步。

虽然以完美的精度执行这项任务是不可能的,但数据中心运营商可以在很大程度上减轻出现的不准确情况。Meta公司实施的PTP计时协议将使该公司更容易减轻时间数据的不准确性。

OTS_concept.png

NTP能使一台服务器的时钟与另一台服务器的时钟同步,精确度为几毫秒,一毫秒等于一秒钟的千分之一。PTP是Meta公司实施的新的计时协议,它的精确度为几纳秒,比NTP好三个数量级。

Meta公司说,PTP所带来的精确度的提高在很多方面都有好处。该技术可以提高协作应用和视频游戏的用户体验。此外,Meta公司认为,PTP有可能提高其用于构建和运行人工智能软件的图形处理单元的效率。

Meta公司开发了多种新技术以实现来在其数据中心实施PTP。Byagowi和Obleukhov解释说:”虽然PTP比NTP更精确(以纳秒对毫秒进行测量),但它也对网络硬件提出了更多要求。当Meta公司的工程师正在努力实施PTP时,我们很快发现现成的组件并不是为大规模处理PTP而设计的。”

OTS_assembly.jpeg

Meta公司为支持这一举措而开发的技术之一是一个被称为时间设备的专门设备。据该公司称,它是为帮助服务器准确确定当前时间的任务而设计的。该设备在原子钟的帮助下执行任务,原子钟是一种高度精确的时钟,通过观察原子属性的变化来测量时间。

Meta公司以开源许可的方式发布了时间设备的设计及其开发的其他技术,作为该计划的一部分。