DataFunTalk原创文章月刊 · 上线!

发布于 2021-04-07 21:12

DataFun的各位小伙伴们，DataFun秉承着给大家带来学习干货为主，每月工作日的首个周3为大家更新社区原创文章月刊合集电子书。

3月原创文章有：

百度知识图谱技术及应用

摘要：知识图谱是让机器像人类一样理解客观世界的基石。本文介绍了知识图谱在百度的位置及整体的发展概况。从通用知识图谱和行业知识图谱两个分支重点介绍百度知识图谱技术及应用的最新进展，并介绍了两个特殊的知识图谱——事件图谱和视频理解图谱。最后介绍百度知识图谱在技术和数据开放方面的工作。

深度排序模型在淘宝直播的演进与应用

摘要：淘宝直播近两年在排序模型上进行了持续的迭代优化和演进落地，在多目标学习、跨场景迁移、召回匹配、大促GMV优化上都有比较成功的应用实践，此外在全屏页上下滑场景上也有自己独特的建模思路和方案。本文将为大家分享下深度排序模型在淘宝直播的演进与应用。

转变，贝壳数据平台的演进

摘要：本文主要分享如何通过数据产品，帮助具有20年历史的传统企业在行业互联网数字化转型，促使业务更高效的应用数据，数据平台产品在公司数字化转型的过程中是如何演进的，会遇到什么样的困难，以及产品建设过程中的思考与实践。并重点介绍贝壳数据平台建设的演进、治理过程。

腾讯音乐：全民K歌推荐系统架构及粗排设计

摘要：腾讯音乐娱乐集团 ( TME ) 目前有四大移动音乐产品：QQ音乐、酷狗音乐、酷我音乐和全民K歌，总月活超8亿。其中，全民K歌与其他三款产品有明显的差异，具体表现如下：以唱为核心，在唱歌的功能上又衍生出了一些音乐娱乐的功能及玩法，目前有超过1.5亿的月活。推荐在全民K歌各个场景中起着重要作用，极大地影响着平台的内容分发状况及生产者与消费者的关系。本文将主要介绍全民K歌的推荐系统架构及粗排设计。

京东搜索在线学习探索实践

摘要：随着京东零售搜索业务的快速发展，对数据的时效性要求越来越高，要求搜索模型有捕捉更实时信号的能力，在线学习体现了业务对模型时效性的追求，希望能根据在线系统反馈的数据实时得对模型进行调整，使得模型能快速反应环境的变化，提高在线预估的准确率。

快手超大规模集群调度优化实践

摘要：随着公司业务的快速发展，离线计算集群规模和提交的作业量持续增长，如何支撑超大规模集群，如何满足不同场景的调度需求成为必须要解决的问题。基于以上问题，快手大数据团队基于YARN做了大量的定制和优化，支撑了不同场景下的资源调度需求。

贝壳基于Druid的OLAP引擎应用实践

摘要：贝壳作为全国领先的房产交易和租赁在线服务平台，有很多业务场景会产出大量实时和离线数据，针对这些数据进行查询分析，对于企业发展和业务拓展至关重要。不同业务线不同查询场景下，单一技术手段很难满足业务方的需求，Druid就是我们在探索之路上发现的比较切合业务方需求的OLAP引擎之一，基于Druid我们做了深入地实践...

5G+智能时代的多模搜索技术

2010年随着iphone4的发布，智能手机被广泛使用，从大学生到老人小孩，移动互联网的发展如火如荼。近两年，5G技术让下载速度变得越来越快，相较于传统的文本搜索技术，语音搜索和图片搜索等新型搜索方式出现在越来越多的产品形态当中。本文将为大家介绍5G+智能时代的多模搜索技术。

Hive MetaStore 在快手遇到的挑战与优化

摘要：快手基于Hive构建数据仓库，并把Hive的元数据信息存储在MySql中，随着业务发展和数据增长，一方面对于计算引擎提出了更高的要求，同时也给Hive元数据库的服务稳定性带来了巨大的挑战。本文将主要介绍Hive MetaStore服务在快手的挑战与优化。

模型化召回在陌陌社交推荐的应用和探索

摘要：在陌陌的社交推荐体系中，模型化Recall在召回模块中起到了重要作用。本文主要介绍模型化Recall在陌陌社交推荐中的技术探索和具体落地应用，重点介绍基于用户场景行为驱动、用户社交关系网络和动态语义内容的个性化召回通道构建方式，用户实时性兴趣偏好的捕获方法及如何提高分发场景中用户的社交匹配性。

月刊电子书下载方式：

月刊】，获取合集电子书！

本文来自网络或网友投稿，如有侵犯您的权益，请发邮件至：aisoutu@outlook.com 我们将第一时间删除。

DataFunTalk原创文章月刊 · 上线!

相关素材

平台上线啦

正式上线啦

某功能正式上线啦！

关于搜图网

精品素材

热门素材

素材网资讯

联系搜图网