Skip to content

Latest commit

 

History

History
97 lines (86 loc) · 4.11 KB

filesystem_create.md

File metadata and controls

97 lines (86 loc) · 4.11 KB

命令行安装教程

https://github.com/PaddlePaddle/PaddleFlow/blob/develop/docs/zh_cn/deployment/how_to_install_paddleflow.md

创建各类fs的命令行参考如下

S3

 paddleflow fs create <fsname> s3://<bucketname>/<subpath> -o accessKey=<ak> -o secretKey=<sk> -o region=<region> -o endpoint=<endpoint>

注意:其中括号内是您需要填写的内容

参考命令
paddleflow fs create s3name s3://paddleflow/data -o accessKey=****** -o secretKey=****** -o region=bj -o endpoint=s3.bj.bcebos.com

bos

 paddleflow fs create <fsname> s3://<bucketname>/<subpath) -o accessKey=<ak> -o secretKey=<sk> -o region=<region> -o endpoint=<endpoint>

注意:其中括号内是您需要填写的内容

bos和s3的不同之处是url前缀是bos以及endpoint的写法

参考命令
paddleflow fs create bosname bos://paddleflow/data -o accessKey=***** -o secretKey=***** -o region=bj -o endpoint=bj.bcebos.com

minio

paddleflow fs create <fsname> s3://<bucket>/<subpath> -o accessKey=<ak> -o secretKey=<sk> -o endpoint=<endpoint> -o insecureSkipVerify=true -o s3ForcePathStyle=true

注意创建minio的时候,-o insecureSkipVerify=true -o s3ForcePathStyle=true为必填项

参考命令
paddleflow fs create minioname s3://paddleflow/data/ -o accessKey=**** -o secretKey=**** -o endpoint=127.0.0.1:9000 -o insecureSkipVerify=true -o s3ForcePathStyle=true

hdfs

paddleflow fs create <fsname> hdfs://<hdfs_address>/<subpath> -o group=<group> -o user=<user>}{

如果您使用的是kerbos访问hdfs,请通过paddleflow fs create --help查看kerbos的填写参数

参考命令
paddleflow fs create hdfsname hdfs://127.0.0.1:9000/data/ -o group=*** -o user=***

sftp

paddleflow fs create <fsname> sftp://<sftp_address>/<subpath>
 -o user=<username> -o password=<password>

注意,sftp的用户名和密码也就是机器ssh的登陆密码和用户名

参考命令
paddleflow fs create sftpname sftp://127.0.0.1:22/data
 -o user=*** -o password=***

glusterfs

paddleflow fs create <fsname> glusterfs://<gluster_address>:<volume>

注意,使用paddleflow创建glusterfs的时候,paddleflow-server的镜像需要装glusterfs fuse的客户端,并且镜像默认是root用户

参考命令
paddleflow fs create glusterfsname glusterfs://127.0.0.1:default-volume

cfs

文件存储CFS(Cloud File Storage)是百度智能云提供的安全、可扩展的文件存储服务。通过标准的文件访问协议,为云上的虚机、容器等计算资源提供无限扩展、高可靠、全球共享的文件存储能力 创建的命令如下

paddleflow fs create cfsname cfs://<cfs-id>/<subpath>

需要paddleflow-server镜像支持nfs4协议,并且网络可访问云上cfs

参考命令
paddleflow fs create cfsname cfs://cfs-id/data/

hostpath

paddleflow支持创建本地文件系统的fs,如果要使用hostpath的方式挂载本地路径,需要paddleflow-server挂载宿主机的/mnt路径,用户如果想指定本地路径,需要将路径link到宿主机的/mnt路径下,并且保证运行的节点都有一个路径下的所有数据可以访问,创建方式如下

paddleflow fs create <fsname> local://<subpath>

使用hostpath方式需要注意以下几点:

  • 如果是在分布式集群中运行pipeline, 且不同机器上的hostpath在底层是完全独立的存储,则需要注意如下两点
    • cache功能不一定符合预期:因为不同机器上的hostpath同名文件modtime不一定相同
    • 不能使用hostpath类型的存储来存放artifact:因为节点A和节点B有可能会调度到不同的机器上,此时节点A的输出artifact将无法被节点B访问到。
  • 如果是单机集群,或者分布式集群中所有机器上的hostpath使用了同一个存储(比如在所有的机器hostpath目录下都挂载了同一个BOS存储),此时则可以正常使用Pipeline的所有功能
  • hostpath 正常使用,需在server 将该目录做好挂载,否则会报无法mkdir 问题
参考命令
paddleflow fs create localname local://mnt/data