/PaddleRec

大规模推荐模型训练工具

Primary LanguagePythonApache License 2.0Apache-2.0

(简体中文|English)

什么是推荐系统?

  • 推荐系统是在互联网信息爆炸式增长的时代背景下,帮助用户高效获得感兴趣信息的关键;

  • 推荐系统也是帮助产品最大限度吸引用户、留存用户、增加用户粘性、提高用户转化率的银弹。

  • 有无数优秀的产品依靠用户可感知的推荐系统建立了良好的口碑,也有无数的公司依靠直击用户痛点的推荐系统在行业中占领了一席之地。

    可以说,谁能掌握和利用好推荐系统,谁就能在信息分发的激烈竞争中抢得先机。 但与此同时,有着许多问题困扰着推荐系统的开发者,比如:庞大的数据量,复杂的模型结构,低效的分布式训练环境,波动的在离线一致性,苛刻的上线部署要求,以上种种,不胜枚举。

什么是PaddleRec?

快速安装

环境要求

  • Python 2.7/ 3.5 / 3.6 / 3.7

  • PaddlePaddle >= 1.7.2

  • 操作系统: Windows/Mac/Linux

    Windows下PaddleRec目前仅支持单机训练,分布式训练建议使用Linux环境

安装命令

  • 安装方法一 PIP源直接安装

    python -m pip install paddle-rec

    该方法会默认下载安装paddlepaddle v1.7.2 cpu版本,若提示PaddlePaddle无法安装,则依照下述方法首先安装PaddlePaddle,再安装PaddleRec

    • 可以在该地址,下载PaddlePaddle后手动安装whl包
    • 可以先pip安装PaddlePaddlepython -m pip install paddlepaddle==1.7.2 -i https://mirror.baidu.com/pypi/simple
    • 其他安装问题可以在Paddle IssuePaddleRec Issue提出,会有工程师及时解答
  • 安装方法二 源码编译安装

    • 安装飞桨 注:需要用户安装版本 == 1.7.2 的飞桨

      python -m pip install paddlepaddle==1.7.2 -i https://mirror.baidu.com/pypi/simple
    • 源码安装PaddleRec

      git clone https://github.com/PaddlePaddle/PaddleRec/
      cd PaddleRec
      python setup.py install
      
  • PaddleRec-GPU安装方法

    在使用方法一或方法二完成PaddleRec安装后,需再手动安装paddlepaddle-gpu,并根据自身环境(Cuda/Cudnn)选择合适的版本,安装教程请查阅飞桨-开始使用

一键启动

我们以排序模型中的dnn模型为例介绍PaddleRec的一键启动。训练数据来源为Criteo数据集,我们从中截取了100条数据:

# 使用CPU进行单机训练
python -m paddlerec.run -m paddlerec.models.rank.dnn  

帮助文档

项目背景

快速开始

入门教程

进阶教程

Benchmark

FAQ

社区


Release License Slack

版本历史

  • 2020.06.17 - PaddleRec v0.1.0
  • 2020.06.03 - PaddleRec v0.0.2
  • 2020.05.14 - PaddleRec v0.0.1

许可证书

本项目的发布受Apache 2.0 license许可认证。

联系我们

如有意见、建议及使用中的BUG,欢迎在GitHub Issue提交

亦可通过以下方式与我们沟通交流:

  • QQ群号码:861717190
  • 微信小助手微信号:paddlerec2020

     

PaddleRec交流QQ群               PaddleRec微信小助手