服务器 频道
  • KubeAI大模型推理加速实践|得物技术

    最近我们在生产环境批量部署了大模型专用推理集群,并成功让包括70B在内的大模型推理速度提升50%%,大幅缩减部署成本,稳定应用于生产环境。本文基于我们在部署大模型推理集群时的一些经验,分享一些有效提升大模型的推理速度方法。最后,我们在结尾处推荐了几个经过我们评测且表现优异的大模型推理框架。

    陶然 · 2024-05-16 09:42
  • 中台过气、微服务回归单体,DDD的意义何在?

    十年过去了,中台已经过气,微服务回归单体也一度成为技术圈讨论的热点话题,曾经神坛上云遮雾绕的 DDD 在今天看来是否还有讨论的意义?在过去一两年的实践中,笔者对 DDD 有了更深的体会,本文将阐述我的一些浅见,如果有理解不到位的地方,也希望同学们一起讨论。

    陶然 · 2024-05-15 16:57
  • Elasticsearch 在滴滴的应用与实践

    滴滴 ES 发展至今,承接了公司绝大部分端上文本检索、少部分日志场景和向量检索场景,包括地图 POI 检索、订单检索、客服、内搜及把脉日志 ELK 场景等。滴滴 ES 在2020年由2.X升级到7.6.0,近几年围绕保稳定、控成本、提效能和优生态这几个方向持续探索和改进,本文会围绕这几个方向展开介绍。

    陶然 · 2024-05-15 11:13
  • 哔哩哔哩直播通用榜单系统实践

    榜单遍布B站直播相关业务的各个角落,直播打赏、直播间互动、付费玩法、互动玩法、活动、主播PK、语聊房、人气主播排名、高价值用户排名、增值集卡、up主充电等等,在这众多的业务场景中,我们能看到各种各样的榜单。

    陶然 · 2024-05-14 14:28
  • 上云下云怎么选?这些常犯的错误给出了答案

    据思杰(Citrix)今年对350名实施云计算战略的IT领导者的调查,94%%的受访者在过去三年中参与过云计算遣返项目。曾几何时,以低成本、高敏捷性闻名的云还是现代架构设计的热门选项,为何如今“下云”又成了不少公司相继实践的新趋势?

    陶然 · 2024-05-14 10:29
  • 播放全链路压测实践之路

    播放链路是爱奇艺最重要的业务,链路稳定性极其重要,随着爱奇艺用户的不断增长和热播剧集的推广,播放链路往往面临着难以预估的用户流量的突增,考验着链路中各个服务系统的稳定性和性能,这也直接影响着大量用户的观影体验,实施全链路压测已经成为重要且必要的课题。

    陶然 · 2024-05-13 13:45
  • 百度推荐资源冷启动实践

    百度 feed 推荐是一个月活数亿的综合信息流推荐平台。该平台涵盖了图文、视频、动态、小程序、问答等多种内容类型。它不仅提供类似于单列或双列的点选式推荐,还包括视频沉浸式等多种推荐形式。同时,推荐系统是一个多利益方的系统,不仅仅包含 C 端用户体验。

    陶然 · 2024-05-13 11:17
  • 多域图大模型在百度推荐系统的实践与思考

    图是一种描述复杂数据的常用语言。常见的图结构包括:社交网络、分子结构、知识图谱、商业广告、地图等,其中推荐系统和商业广告是大家更为熟悉的场景。

    陶然 · 2024-05-11 14:15
  • 腾讯PCG搜广推机器学习框架GPU性能优化实践

    本次分享的主题是腾讯 PCG 搜广推机器学习框架 GPU 性能优化实践。主要介绍:1. 为什么 GPU 推荐模型训练框架是刚需;2. GPU 推荐模型训练框架怎么做才最高效;3. 未来展望。

    陶然 · 2024-05-10 15:20
  • DDD在大众点评交易系统演进中的应用

    本文整理自美团技术沙龙第73期《基于领域驱动设计(DDD)的架构演进和实践》,主要介绍了DDD的核心概念、常见的设计思路,并结合DDD介绍大众点评交易系统的演进过程,最后做了一些总结和思考。希望这些内容能够对大家有所帮助或启发。

    陶然 · 2024-05-10 09:31
  • 火山引擎ByteHouse:如何为OLAP设计高性能向量检索能力?

    不仅仅是LLM,向量检索也早已在OLAP引擎中应用,用来提升非结构化数据的分析和检索能力。ByteHouse是火山引擎推出的云原生数据仓库,近期推出高性能向量检索能力,本篇将结合ByteHouse团队对向量数据库行业和技术的前沿观察,详细解读OLAP引擎如何建设高性能的向量检索能力。

    陶然 · 2024-05-09 16:47
  • Twitter如何改进4000亿事件实时处理架构?

    Twitter每日需实时处理高达4000亿的事件,并生成PB级的数据。这些数据主要来源于分布式数据库、Kafka以及Twitter事件总线等多种事件源。接下来,我们将深入探讨Twitter在事件处理方面的演变,具体包括以下方面:

    陶然 · 2024-05-09 13:57
  • 浅谈现代消息队列与云存储

    讲述消息系统在现代化演进中软硬一体化,百万队列,分级存储等诸多竞争力特性的诞生和落地效果。探讨业界领先的 Shared-Log 存储计算分离,FFM与协程,RDMA 传输,列式存储等技术,将消息向流的领域延伸。

    陶然 · 2024-05-08 10:53
  • OPPO下一代大数据AI一体架构实践

    云厂商用存储吸引用户,进而提供上层 SaaS 服务。云原生弹性计算架构可提高调度效率,实现资源的自动弹性伸缩,优化资源利用。本文将展示OPPO 下一代大数据 AI 一体架构在功能云上的实践,希望为大家带来启发。

    陶然 · 2024-05-07 14:45
  • 得物质量管理体系的建设与应用

    质量保障是一门基于软件测试的系统化工程,遵循渐进式的发展规律。通过因地制宜地制定落地策略,设计场景方案,获取试验结果,并加以循环往复。最终,在每一位得物测试工程师的共同努力下,积累出一套适应得物技术的质量保障方法论,即本文介绍的得物质量管理体系。

    陶然 · 2024-05-07 10:08
  • 算法在 58 画像平台建设中的应用

    用户画像平台是企业应用大数据的根基,精准营销、精细化运营和个性化推荐都离不开用户画像的建设。精准地刻画用户行为、兴趣以及需求尤为重要。本文将探讨算法在 58 用户画像平台建设中的作用,包括画像标签体系的建设,个性化推荐、精细化运营等业务应用。

    陶然 · 2024-05-06 10:44
  • B站数据中心网络布线智慧管理平台实践

    前期我们详细介绍了B站在定制化数据中心(R2-AZ2)项目上的探索,主要集中在智慧节能数据中心的技术迭代和实施情况。数据中心的高效运作并非孤立存在,它依赖于复杂而精细的互联互通网络,确保数据中心内的服务器、存储和网络设备间的连接。

    陶然 · 2024-05-06 09:56
  • 携手伙伴,昇思MindSpore开源社区斩获第三届中国国际软件发展大会三项荣誉

    近日,由中国软件行业协会主办的第三届中国国际软件发展大会在京成功召开。2024年恰逢中国软协成立四十周年,来自昇思MindSpore开源社区、华为云等组织和单位的嘉宾都亲临现场送出祝福并做主题演讲。

    陶然 · 2024-04-30 14:41
  • 如何搞定一个可以支持多芯混合训练的AI集群

    由于外部环境的变化,适用于大模型训练任务的 GPU 整体规模无法继续增长。这些存量 GPU 组成的集群,仍然是当前加速大模型训练的主要 AI 算力来源。同时,各类国产 AI 芯片开始大规模投入实际生产任务。在未来一段时间内,数据中心的 AI 算力将保持多种芯片并存的现象。

    陶然 · 2024-04-30 09:56
  • NameNode锁细粒度优化在B站的实践

    随着业务的高速发展,针对HDFS元数据的访问请求量呈指数级上升。在之前的工作中,我们已经通过引入HDFS Federation和Router机制实现NameNode的平行扩容,在一定程度上满足了元数据的扩容需求;

    陶然 · 2024-04-29 10:40