伯克利大学研究者用AI构建更强负载均衡算法

实在来说，作家声称利用OpenEvolve完成了专家并行负载平衡器（EPLB）算法的5倍加快。该算法用于大讲话模子中，将Token途由到特意的专家模块，这是一种裁汰执掌参数数目的功效机制。

作家外现，通过AI驱动的编制钻探（ADRS），AI模子可能迭代天生、评估和优化办理计划，希望更改编制钻探。论文指出：跟着AI正在算法策画中阐发重心效用，咱们以为人类钻探者将越来越一心于题目同意和政策诱导。咱们的结果优秀了损害性潜力以及正在AI期间适宜编制钻探实施的紧急需求。

Google正在5月份扩大了AlphaEvolve，这是一个进化编码智能体，它提升了Google数据核心编排的功效，优化了张量执掌单位硬件中的矩阵乘法操作，并优化了基于Transformer的AI模子中的FlashAttention内核完成。

为了进一步夸大呆板研习行动算法创造机制的潜力，本周颁发正在《自然》杂志上的一篇来自Google DeepMind钻探职员的论文描摹了一种通过众代智能体与百般境遇交互的履历来自立创造深化研习礼貌的手段。到目前为止，DeepMind钻探职员声称，主动化手段未能超越人类策画的深化研习编制。

伯克利大学团队现正在通过让OpenEvolve寻得执掌大讲话模子推理的GPU负载平衡的更高效手段，闪现了基于AI优化使命的价钱。

钻探职员从DeepSeek的开源EPLB完成最先，他们指出该完成速率较慢，由于它用Python编写并依赖for轮回来举办线性查找以找处处理专家模块使命负载的最佳GPU。均匀而言，DeepSeek版本需求约540毫秒来从新平均GPU上的专家模块。

他们还钻探了来自一个未公然前沿测验室的非公然EPLB完成，该完成正在19.6毫秒内执掌从新平均。

OpenEvolve利用80%的Gemini 2.5 Flash和20%的Gemini 2.5 Flash Lite组合，本钱不到10美元，用时5小时，提出了一种将专家模块打包到GPU中的更高效手段——它用向量化张量操作更换了轮回，并完成了锯齿分区计划，运转韶华仅为3.7毫秒。

伯克利大学论文中描摹的另一个案例钻探陈诉称，通过利用OpenEvolve，作家可以将相干理解的速率提升3倍，此中SQL盘查对每行挪用大讲话模子推理操作。

当被问及OpenEvolve的推理是否只是结合人们正在可用数据中漏掉的点，仍旧显示出新鲜手段的证据时，联合作家、伯克利大学博士候选人Audrey Cheng通过电子邮件告诉The Register：我以为这些题目很难了了回复（由于它们归结为大讲话模子是否线;或只是举办繁杂的概率估量）。

大讲话模子确实受益于正在比任何局部钻探者可以明白的更大文献语料库上的磨练，这使它正在创造行使其他范围思念的新手段方面具有上风。目前正在编制/数据库功能钻探中，倘若算法正在某种水平上显示出明显革新，咱们就以为算法是新鲜的，纵然它们借用了其他范围的思念（比如，睹我的将汇集/操作编制公道共享思念行使于数据库的论文）。基于这个圭表，是的，这些起色将被钻探圭表以为是新鲜的。

当被问及OpenEvolve是否只是从已知数据中暴力破解新鲜性仍旧具有创建性时，Cheng说这也是一个难题的题目。

我以为考虑这个题目的一种方法是考虑人类现正在怎么念出念法，Cheng说。行动钻探者，咱们清楚咱们站正在伟人的肩膀上。唯有深远明白他人的念法，咱们技能念出新鲜的办理计划。创建流程需求已知数据。OpenEvolve利用这些数据并将其行使于新题目（也恐怕念出意念不到的办理计划）。以是，我会说ADRS框架是有创建性的。

咱们一心于编制功能题目，由于AI曾经可能正在这里击败人类专家办理计划，她诠释道。功能题目广泛更容易验证，咱们曾经能手业中看到了少许开头采用（比如，睹Datadog比来的博客作品）。我预期大无数大领域运转编制的公司最终将利用某种外面的ADRS举办功能调优。

一朝钻探职员弄明了怎么对安然性和容错性等其他题目举办验证，Cheng巴望ADRS可以提出更众新鲜的办理计划。

目前的瓶颈是具有重大的评估和验证框架，她诠释道。倘若这些到位，我联念ADRS可能广大行使于百般编制题目（也超越估量机科学）。

A：OpenEvolve是Google DeepMind的AlphaEvolve的开源完成，它是一个进化编码智能体。正在这项钻探中，OpenEvolve被用来革新负载平衡算法，通过向量化张量操作和锯齿分区计划，将专家并行负载平衡器的运转韶华从19.6毫秒缩短到3.7毫秒，完成了5倍加快。

A：AI驱动的编制钻探（ADRS）可能让AI模子迭代天生、评估和优化办理计划。目前重要用于编制功能题目，由于AI曾经可以超越人类专家办理计划。钻探显示，这种手段不但能优化负载平衡算法，还能将相干理解中SQL盘查挪用大讲话模子推理操作的速率提升3倍。

A：本钱相对较低。钻探中利用80%的Gemini 2.5 Flash和20%的Gemini 2.5 Flash Lite组合，总本钱不到10美元，用时5小时就完结了专家并行负载平衡器算法的优化，完成了明显的功能擢升。

联系人：	王先生
电话：	15640228768
微信：	1735252255
地址：	沈阳市铁西区兴华南街58-6号

思陌产品

使用帮助

关于我们

资讯反馈

联系我们