conclusion
7 结束语
联邦学习使分布式客户端设备可以协作学习共享的预测模型,同时将所有训练数据保留在设备上,从而将进行机器学习的能力与数据存储在云中的需求去耦。 这不仅限于通过在设备上进行模型训练来在移动设备上进行预测的本地模型。
近年来,无论是在工业界还是在学术界,该主题的兴趣都呈爆炸性增长。大型技术公司已经在生产中部署了联邦学习,并且成立了许多初创公司,目的是使用联邦学习来解决各个行业中的隐私和数据收集挑战。此外,在这项工作中调查的论文的广泛性表明,联邦学习正在广泛的跨学科领域中获得关注:从机器学习到优化到信息理论和统计再到密码学,公平性和隐私性。
出于对联邦学习研究日益增长的兴趣的驱使,本文讨论了最新进展,并提出了许多未解决的问题和挑战。为了达到实用性,系统约束对算法施加了效率要求,其中许多要求在其他设置中并不是特别有挑战性。我们认为数据隐私不是二进制的,而是提出了一系列威胁模型,这些模型在各种假设下都是相关的,每个假设都提出了自己独特的挑战。
这项工作中讨论的开放性问题当然不是全面的,它们反映了作者的兴趣和背景。特别是,我们不会讨论在实际机器学习项目的过程中需要解决的任何非学习问题,这些问题可能需要基于去中心化数据来解决。这可能包括一些简单的问题,比如计算基本的描述性统计,或者更复杂的目标,比如计算一个开放集的直方图的头部[437]。解决此类问题的现有算法通常没有明显的“联邦版本”,在激励该工作的系统假设下或不接受有用数据保护概念的情况下,这种联邦版本是有效的。此外,研讨会的算法使用率更高,因此尽管与联邦学习相关的系统构建从根本上来说是一个具有挑战性的问题,但与系统相关的研究主题却没有得到很好的体现。尚未讨论的另一组重要主题是法律和商业问题,它们可能会激发或限制联邦学习的使用。
我们希望这项工作对在联邦学习和相关领域的进一步研究进行范围界定方面有所帮助。
致谢
作者感谢Alex Ingerman和David Petrou在审阅过程中提供的宝贵建议和深刻见解。
Last updated