服务器 频道
  • 浅谈B站效果广告在线推理服务的性能优化

    在保障业务持续迭代的同时,通过对在线服务进行多轮不断的升级和优化,服务性能有了显著提升,其中CPU、内存、网络IO等资源的使用效率得到了明显改善,在线集群整体节省了上万核的CPU算力。在此过程中,研发团队也积累了丰富的经验和知识,将为未来的项目研发提供了重要支持。

    陶然 · 2024-01-02 10:47
  • 抖音为何要不断提升画质体验?

    本文从抖音集团内部画质优化方案的孵化历程着笔,主要分享了画质优化对于业务的价值、主要应用场景和内部产品的一些典型实践案例。通过分享业务视角遇到的一些问题和我们的解决思路,希望能抛砖引玉,为遇到类似困扰的伙伴们提供有价值的参考。

    陶然 · 2024-01-02 09:43
  • 网易有道关于实时湖仓的实践之路

    有道的数据层架构可分为离线和实时两部分,离线计算主要采用Hive、Spark,采用批处理的方式定时调度。实时部分采用 Flink+Doris(版本 0.14.0)构建实时数仓,用于处理实时埋点日志、业务库变更数据。

    陶然 · 2023-12-29 09:50
  • 揭秘货拉拉大模型应用平台的应用部署

    随着大语言模型(Large Language Model, LLM)涌现,如何高效落地应用LLM成为关键,以LLM为核心搭建各种Agent落地应用(AI Agent )成为新风向。货拉拉在司机邀约、AI客服、创意生成等业务已经应用自研大模型提效,推进AI应用。各业务在摸索大模型落地的过程中,存在以下困难:

    陶然 · 2023-12-29 09:39
  • 腾讯网关TGW架构演进之路

    TGW全称Tencent Gateway,是一套实现多网统一接入,支持自动负载均衡的系统, 是公司有10+年历史的网关,因此TGW也被称为公司公网的桥头堡。本文从山海网关TGW的应用场景、背景需求讲起,重点解析了从山海1.0到山海2.0需要解决的问题和架构规划与设计实现,以及对于未来山海网关的发展和演进方向。

    陶然 · 2023-12-28 11:07
  • 得物云原生容器技术探索与落地实践

    得物 App 作为互联网行业的后起之秀,在快速的业务发展过程中基础设施规模不断增长,继而对效率和成本的关注度也越来越高。我们在云原生技术上的推进历程如图所示,整体上节奏还是比较快的。

    陶然 · 2023-12-28 10:25
  • 全国产 高可靠 舜源科技推出新国产化服务器

    勤龙QL208-KH-4000服务器是一款基于兆芯开胜KH-40000/16处理器平台开发的2U机架式服务器。支持IPMI2.0远程管理,支持国产化TCM芯片及银河麒麟、统信UOS等国产化操作系统,可满足各种不同应用场合。

    鸿途 · 2023-12-27 16:20
  • 数据中心液冷技术发展趋势与分析

    本次分享内容主要包括四个部分:一是讲数据中心为什么需要液冷?二是为什么现在液冷会成为一个趋势?三是现状与挑战。最后是关于未来的展望。

    陶然 · 2023-12-27 10:41
  • 货拉拉国际化测试之深度学习实践

    随着货拉拉国际化业务市场的飞速扩张和产品的高速迭代,质量保障工作遇到了前所未有的挑战。特别是我们的业务覆盖了13个不同的国家和地区,涉及近20种语言,横跨8个时区,17种支付方式,除了常规的逻辑功能测试之外,错综复杂的‘国际化’因素也大大增加了QA的单一重复性劳动。

    陶然 · 2023-12-27 09:53
  • 一次订单系统重构实践

    重构发生的背景是,原有的系统架构采用all-in-one的方式,随着业务的快速发展,用户访问量急剧上升,系统请求流量成倍增长,陆续出现了各种问题。当时的系统架构的示意图如下

    陶然 · 2023-12-26 10:58
  • 理想汽车基于Flink on K8s的数据集成实践

    本文将介绍理想汽车在 Flink on K8s 的数据集成落地实践。分享分为四个部分:1. 理想数据集成的发展与现状;2. 数据集成的落地实践;3. 数据集成云原生的落地实践;4. 未来规划。

    陶然 · 2023-12-26 09:51
  • AIOps在美团的探索与实践——事件管理篇

    美团服务运维团队从事前防御、事中处理、事后运营多个阶段探索AIOps在事件管理领域的应用。本文介绍了在各个运维领域中AIOps的赋能场景,详细阐述了每一个运维场景的业务价值以及算法的具体的落地效果。

    陶然 · 2023-12-25 13:40
  • 货拉拉系统容量保障方案及实践

    保证服务在大量用户、司机访问系统时,依然可以正常为用户、司机提供服务。比如,在“国庆高峰保障”拉货节的超高访问量下,各个线上服务都能稳定运行,保障业务高峰平稳过渡。

    陶然 · 2023-12-25 09:44
  • 基石可视化数据分析平台设计实践

    在当下数字化转型的大环境中,数据成为企业发展重要基石,如何利用好数据进行分析也成为更多企业面临的首要问题。随着信息技术发展,数据分析平台作为一种新型的企业管理工具,可以帮助企业实现数据收集、处理、分析和应用的全过程,为企业提供全面、准确、及时的数据和决策支持。

    陶然 · 2023-12-22 10:29
  • vivo 容器平台资源运营实践

    容器平台针对业务资源申请值偏大的运营问题,通过静态超卖和动态超卖两种技术方案,使业务资源申请值趋于合理化,提高平台资源装箱率和资源利用率。

    陶然 · 2023-12-22 09:51
  • ByteHouse查询优化器的设计与实现

    本篇文章来源于火山引擎ByteHouse技术专家《ByteHouse查询优化器的设计与实现》的分享,从现状分析、设计思路、实现方案、高阶优化、优化效果五个部分,拆解ByteHouse查询优化器如何实现性能10倍提升。

    陶然 · 2023-12-21 16:13
  • 1000+台Kafka集群扩张的自动化治理实战

    我们拥有1000+台Kafka机器,组成了20多个集群,针对不同业务场景配置了不同规格的机器,磁盘类型包括HDD,SSD和NVME。每日PB级输入,输出数十PB,肩负着公司数据传输的重任。随着集群规模的扩张,我们也遇到了越来越多的挑战。

    陶然 · 2023-12-21 10:37
  • 转转One-Service数据服务体系建设

    本次分享主题为转转 One-Service 数据服务体系建设,主要介绍转转在建设数据服务体系过程中的三个阶段,其中将详细介绍 One-Service 统一查询服务建设思路。

    陶然 · 2023-12-21 09:46
  • 算法工程师如何拿结果:走过低谷,先立信念

    知道什么是要事,那接下来的事情就是做到“第一”了。第一简而言之就是集中优势兵力去打歼灭战。另外一个相关但是没那么重要的事情是如果减少给不重要的事情投入兵力。我们需要把80%%以上的精力和时间都放到这件要事上,从各个角度去揣摩它,试探它,分析它。

    陶然 · 2023-12-20 16:26
  • 云原生架构下B站Flink存算分离的改造实践

    在当前整个行业及公司内部降本增效的大背景下,B站内部也在积极推进实时与在线业务资源的整合,往云原生架构迁移,统一资源池与调度,提升资源利用效率。不过面临的现实问题就是,不同业务场景下,资源的规格诉求不尽相同。

    陶然 · 2023-12-20 14:24