霁彩华年,因梦同行—— 庆祝深圳霁因生物医药转化研究院成立十周年 情绪益生菌PS128助力孤独症治疗,权威研究显示可显著改善孤独症症状 PARP抑制剂氟唑帕利助力患者从维持治疗中获益,改写晚期卵巢癌治疗格局 新东方智慧教育发布“东方创科人工智能开发板2.0” 精准血型 守护生命 肠道超声可用于检测儿童炎症性肠病 迷走神经刺激对抑郁症有积极治疗作用 探索梅尼埃病中 MRI 描述符的性能和最佳组合 自闭症患者中痴呆症的患病率增加 超声波 3D 打印辅助神经源性膀胱的骶神经调节 胃食管反流病患者耳鸣风险增加 间质性膀胱炎和膀胱疼痛综合征的临床表现不同 研究表明 多语言能力可提高自闭症儿童的认知能力 科学家揭示人类与小鼠在主要癌症免疫治疗靶点上的惊人差异 利用正确的成像标准改善对脑癌结果的预测 地中海饮食通过肠道细菌变化改善记忆力 让你在 2025 年更健康的 7 种惊人方法 为什么有些人的头发和指甲比其他人长得快 物质的使用会改变大脑的结构吗 饮酒如何影响你的健康 20个月,3大平台,300倍!元育生物以全左旋虾青素引领合成生物新纪元 从技术困局到创新锚点,天与带来了一场属于养老的“情绪共振” “华润系”大动作落槌!昆药集团完成收购华润圣火 十七载“冬至滋补节”,东阿阿胶将品牌营销推向新高峰 150个国家承认巴勒斯坦国意味着什么 中国海警对非法闯仁爱礁海域菲船只采取管制措施 国家四级救灾应急响应启动 涉及福建、广东 女生查分查出608分后,上演取得理想成绩“三件套” 多吃红色的樱桃能补铁、补血? 中国代表三次回击美方攻击指责 探索精神健康前沿|情绪益生菌PS128闪耀宁波医学盛会,彰显科研实力 圣美生物:以科技之光,引领肺癌早筛早诊新时代 神经干细胞移植有望治疗慢性脊髓损伤 一种简单的血浆生物标志物可以预测患有肥胖症青少年的肝纤维化 婴儿的心跳可能是他们说出第一句话的关键 研究发现基因检测正成为主流 血液测试显示心脏存在排斥风险 无需提供组织样本 假体材料有助于减少静脉导管感染 研究发现团队运动对孩子的大脑有很大帮助 研究人员开发出诊断 治疗心肌炎的决策途径 两项研究评估了医疗保健领域人工智能工具的发展 利用女子篮球队探索足部生物力学 抑制前列腺癌细胞:雄激素受体可以改变前列腺的正常生长 肽抗原上的反应性半胱氨酸可能开启新的癌症免疫治疗可能性 研究人员发现新基因疗法可以缓解慢性疼痛 研究人员揭示 tisa-cel 疗法治疗复发或难治性 B 细胞淋巴瘤的风险 适量饮酒可降低高危人群罹患严重心血管疾病的风险 STIF科创节揭晓奖项,新东方智慧教育荣膺双料殊荣 中科美菱发布2025年产品战略布局!技术方向支撑产品生态纵深! 从雪域高原到用户口碑 —— 复方塞隆胶囊的品质之旅
您的位置:首页 >速递 > 科技速递 >

开源平台支持隐私保护机器学习研究

密歇根大学的研究人员已开源发布了迄今为止最大的基准数据集,用于机器学习技术的设计并考虑到数据隐私。这种称为联合学习的方法在最终用户设备(如智能手机和笔记本电脑)上训练学习模型,而不需要将私人数据传输到中央服务器。

“通过在生成数据的地方进行现场训练,我们可以在更大的真实世界数据上进行训练,”UM 计算机科学与工程博士生 Fan Lai 解释说,他在国际机器学习会议上展示了 FedScale 训练环境本星期。

“这也使我们能够减轻与将原始数据从最终用户设备收集到云中相关的隐私风险以及高昂的通信和存储成本,”赖说。

联邦学习仍然是一项新技术,它依赖于一种充当集中协调器的算法。它将模型交付给设备,在相关用户数据上对其进行本地训练,然后将每个经过部分训练的模型带回并使用它们生成最终的全局模型。

对于许多应用程序,此工作流程提供了额外的数据隐私和安全保护。消息应用程序、医疗保健数据、个人文档和其他敏感但有用的培训材料可以改进模型,而不必担心数据中心漏洞。

除了保护隐私外,联邦学习还可以通过减少甚至消除大数据传输来使模型训练更加资源高效,但在广泛使用之前它面临着一些挑战。跨多个设备进行培训意味着无法保证可用的计算资源,并且用户连接速度和设备规格等不确定性会导致数据选项池质量参差不齐。

“联邦学习作为一个研究领域正在迅速发展,”密歇根大学计算机科学与工程副教授 Mosharaf Chowdhury 说。“但大部分工作都使用了少数数据集,这些数据集非常小,并不代表联邦学习的许多方面。”

这就是 FedScale 的用武之地。该平台可以在几个 GPU 和 CPU 上模拟数百万用户设备的行为,使机器学习模型的开发人员能够探索他们的联合学习程序将如何执行,而无需大规模部署。它服务于各种流行的学习任务,包括图像分类、对象检测、语言建模、语音识别和机器翻译。

“任何在最终用户数据上使用机器学习的东西都可以联合起来,”Chowdhury 说。“应用程序应该能够学习和改进它们提供服务的方式,而无需实际记录用户所做的一切。”

作者指定了几个必须考虑的条件才能真实地模拟联邦学习体验:数据的异质性、设备的异质性、异质的连接性和可用性条件,所有这些都能够在各种机器学习任务上以多尺度运行。Chowdhury 表示,FedScale 的数据集是迄今为止发布的最大的数据集,专门针对联邦学习中的这些挑战。

“在过去的几年里,我们收集了几十个数据集。原始数据大多是公开的,但很难使用,因为它们有各种来源和格式,”赖说。“我们也在不断努力支持大规模的设备上部署。”

FedScale 团队还推出了排行榜,以推广在 UM 系统上训练的最成功的联邦学习解决方案。

标签:

免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!