服务器 频道
  • OR算法+ML模型混合推理框架架构演进

    本文介绍了OR算法+ML模型混合推理能力建设思路及业务背景,此场景相比常规模型推理更具特殊性和复杂性,在工程实现上面临多维挑战,因此本文分别从性能、稳定性和扩展性三个维度分析问题和解法,并以推理框架架构演进为线总结了过去两年的分期迭代实践历程和收益,其中有一些较为通用的经验,希望能够给大家带来一些帮助或启发。

    陶然 · 2025-07-11 09:22
  • OceanBase向量检索在货拉拉的探索和实践

    货拉拉基于自身在物流领域 AI 落地的深厚积累,已在 14+ 个业务或部门,50+ 个真实业务场景探索和落地大模型应用。在引入大模型的过程中,面临着其在垂直领域知识的缺乏、时效性不足以及数据安全隐患等挑战。

    陶然 · 2025-07-10 10:03
  • 这两年大模型在整个领域到底发展了哪些方面

    本文深入探讨了自2023年GPT-4发布以来,大型语言模型(LLM)领域的发展趋势及其技术演进路径。

    陶然 · 2025-07-08 09:30
  • 搜索数据建设系列之数据架构重构

    主要概述百度搜索业务数据建设的创新实践,重点围绕宽表模型设计、计算引擎优化和新一代业务服务交付模式(图灵3.0开发模式)三大方向,解决了传统数仓在搜索场景下面临的诸多挑战,实现了搜索数据建设的高效、稳定、低成本;为百度搜索业务敏捷迭代奠定夯实基础。

    陶然 · 2025-07-04 14:34
  • 汇金资损防控体系建设及实践 | 得物技术

    随着互联网电商平台竞争的加剧,各平台的业务复杂度不断提升,线上环境的稳定性面临更大挑战。在汇金领域,由于其高资金属性,除了确保链路可用性达到99%%以上,防止资损亦成为关键保障事项。得物汇金业务涉及复杂的资金流和大额资金敞口,因此实施资损防控尤为重要。

    陶然 · 2025-07-02 17:47
  • 闪存普惠,一步到位 | 华为商业市场极简全闪数据中心Pro+重磅发布

    近日,华为商业市场极简全闪数据中心Pro+暨明星产品发布会在北京隆重召开。本次发布会以“闪存普惠、一站购齐、极简易用、数智加速”为主题,重磅推出华为商业市场极简全闪数据中心Pro+解决方案,并正式揭幕中央戏剧学院“智能艺术教育空间”样板点,展示了华为在推动AI技术产业落地、助力行业数智化转型方面的持续突破与探索。

    陶然 · 2025-07-01 16:47
  • 百度日志中台前端重构实践

    日志中台是百度内部针对打点数据的全生命周期管理平台,作为公司日志数据的唯一入口,承担以下核心职能:1.功能覆盖:提供从数据采集、传输、存储到查询分析的一站式服务,支持产品运营分析、研发性能监控、运维管理等多元场景。

    陶然 · 2025-06-24 10:08
  • 浅谈阿里云服务领域Agent构建的方法论

    本文我想要探讨的一个主要话题就是“如何构建真正能在业务上落地的、可用性高的Agent”。当然,这个问题也是一个比较复杂、庞大的话题,我无法在文中给出通用的解决方案,仅仅是从阿里云服务领域的Agent构建视角出发,来讨论一下我们在Agent开发和调优的过程中走过的路、踩过的坑。

    陶然 · 2025-06-23 09:27
  • 一致性框架:供应链分布式事务问题解决方案

    在当今微服务架构盛行的时代,分布式系统已经成为企业级应用的标准模式。然而,随之而来的分布式事务问题也成为了开发人员的一大挑战。在复杂的供应链系统中,各个业务模块之间的数据一致性一直是一个重要且棘手的问题。物流、库存、订单等系统相互协作,如何在保证业务高效运转的同时,确保跨系统操作的数据一致性?

    陶然 · 2025-06-20 14:27
  • 百度垂搜数据管理系统弹性调度优化实践

    百度垂直搜索系统将搜索核心能力赋能阿拉丁(百度搜索特型结果)、垂直领域搜索、应用内搜索等场景,支撑了数百个检索场景、百亿级内容数据的检索。随着接入业务数量和数据量不断增长,系统在海量数据管理与调度上遭遇新的挑战,通过垂搜数据管理系统弹性调度优化实践来满足业务增长需求。

    陶然 · 2025-06-19 14:08
  • BaikalDB架构演进实录:打造融合向量化与MPP的HTAP查询引擎

    BaikalDB作为服务百度商业产品的分布式存储系统,支撑了整个广告库海量物料的存储和OLTP事务处理。随着数据不断增长,离线计算时效性和资源需求压力突显,基于同一份数据进行OLAP处理也更为经济便捷,BaikalDB如何在OLTP系统内实现适合大数据分析场景的查询引擎以应对挑战?

    陶然 · 2025-06-12 09:41
  • 货拉拉基于LWS实现的大模型分布式实践

    海豚平台是货拉拉自研的一站式云原生AI开发平台,覆盖了从数据处理、镜像构建到模型开发、训练、部署及在线推理的全流程。经过近两年的建设,海豚平台已成为货拉拉AI开发的核心基础平台,显著提升了AI开发人效和算力资源利用率,有力推动了公司AI技术与业务的发展。然而随着大模型技术的快速发展,海豚平台在部署大模型时迎来新的挑战。

    陶然 · 2025-06-06 15:59
  • B站服务器故障管理实践与探索

    随着B站业务的快速发展,用户规模和内容生态不断扩展,平台的技术架构也在不断演进。伴随着这一增长,服务器数量呈现出爆发式增长,支撑起了海量用户请求和复杂的业务场景。然而,随着机器规模的持续扩大,服务器故障管理面临的挑战也愈发严峻。

    陶然 · 2025-06-03 14:18
  • 鲲鹏昇腾开发者大会2025在北京成功举办

    以“心怀挚爱,共绽光芒”为主题的鲲鹏昇腾开发者大会2025(KADC2025)在北京中关村国际创新中心成功举办。大会现场发布一系列新技术、新工具和新平台,使能伙伴和开发者高效开发,持续创新。

    陶然 · 2025-05-25 00:57
  • 亿级核心表如何优雅扩展字段?中台团队实战揭秘

    亿级数据的核心表新增一个字段,远不止一句简单的“ALTER TABLE”,锁表风险、页分裂、索引性能衰减……每一个问题都可能引发线上事故。如何在不影响业务的前提下,只需简单的配置,即可实现字段的动态扩展?本文将带你揭秘中台团队的实战解决方案。

    陶然 · 2025-05-22 16:34
  • 戴尔科技:以软件驱动的解耦架构创新重塑数据中心运营

    戴尔科技集团基础架构解决方案事业部总裁Arthur Lewis表示:“戴尔科技正为现代化企业定义未来架构,我们的解耦架构方案帮助客户构建安全、高效的现代化数据中心,将数据转化为现代化洞察,真正做到化繁为简。”

    陶然 · 2025-05-22 14:56
  • 货拉拉数据安全合规制度框架、构建与展望

    货拉拉作为大型的互联网货运平台,面临对自身数据安全保护的严峻课题,是否合理保护与使用平台所拥有的个人信息与重要数据涉及国家和个人的重大利益,平台负有重要的保护责任,监管部门近年来不断加强对平台企业的数据安全管理与监督,出台法律、法规、条例、标准,开展各种保护行动,因此,在货拉拉建立完善的数据安全的合规管理体系是保障企业安全的一个重要环节。

    陶然 · 2025-05-21 09:10
  • 联想服务器全新升级三大家族 领跑后训练时代

    如果说ChatGPT的发布为生成式AI开启了一扇探索之窗,那么DeepSeek的横空出世则推开了通往这片新大陆的机遇之门。DeepSeek通过突破性的稀疏化架构设计与开源生态战略,将大模型研发成本降低80%%以上,加速了“AI平权”,也标志着AI正式迈入后训练时代。与此同时,算力基础设施迎来了关键进化节点。

    任跃婷 · 2025-05-20 15:12
  • 某地铁控制中心数据机房空调系统改造方案探讨

    以某地铁控制中心数据机房的空调系统为研究对象,针对水冷式精密空调系统的安全隐患,提出了增设风冷型精密空调和改造冷却水系统管路2种方案。对比2种改造方案在既有建筑环境中的受限条件,提出相应解决措施,以分析空调系统改造方案的适用性和可靠性。

    陶然 · 2025-05-19 14:22
  • F5G-A万兆全光园区 AI时代标配 华为举办园区网络“以光惠算”先锋行动发布会

    5月16日,华为隆重召开园区网络“以光惠算”先锋行动发布会。本次发布会深度聚焦AI时代园区网络建设需求,创新推出基于F5G-A技术架构的万兆全光园区解决方案。该方案通过构建超大带宽接入能力与确定性网络时延,致力于打造AI时代智慧园区网络的新标杆,为各行业数智化转型升级提供全光联接底座与智能算力支撑。

    陶然 · 2025-05-17 09:39