PaddleFlow简称PF，基于云原生Kubernetes或K3s，提供面向AI开发的批量作业执行系统，并且提供易用的共享文件系统，在apache license2.0 开源协议下发布。PaddleFlow可以作为机器学习平台的资源核心，适用于机器学习和深度学习的单机和分布式作业。

核心特性

1.存储

PaddleFlow由四个部分组成：

1.PaddleFlow 客户端（包含PaddleFlow fuse）: 命令行工具方便用户在开发机安装和使用，其中PaddleFlow fs管理以及fuse主要用于缓存数据和快照等能力，加速远端数据读写，可以支持多种数据源的对接，比如bos，hdfs，本地文件系统。
2.PaddleFlow server: PaddleFlow核心服务，主要包含队列、存储、工作流等的管理。
3.volcano（基于开源volcano改造）: 主要增加elastic quota更灵活管理资源的能力，未来会逐步提交社区review。
4.pf-csi-plugin: 基于k8s csi插件机制实现了PaddleFlow的文件系统接入。

PaddleFlow的部署主要分为客户端和服务端，其中客户端主要用于准备和打包作业，服务端主要用于作业解析和作业管理，其中执行作业如图中示例主要为kubernetes和k3s。其中，他们会共用一个共享的文件系统，这样会更加方便用户更加直观的查看作业状态和日志等。

在使用PaddleFlow之前需要做一下准备：

点击命令行操作说明获取所有操作命令和示例。

点击sdk使用说明获取sdk的使用说明。

使用 apache license 2.0开源，详见 LICENSE。

待补充。