问题
如何标记输入文件所需的文件格式?
如何标记输出文件的生成文件格式?
目标
学习如何明确地指定file对象的格式。
工具和工作流可以将file类型作为输入并生成它们作为输出。我们还建议为file类型指定格式。这有助于为其他人记录如何使用您的工具,同时允许您在创建参数文件时执行一些简单的类型检查。
对于文件格式,我们建议引用已存在的本体(如我们的例子中的EDAM),为您的机构引用一个本地本体,或者在与他人共享您的工具之前不要为快速开发添加文件格式。你可以在这里浏览IANA和EDAM的现有文件格式列表。
在下一篇教程中,我们将更详细地解释文档的$namespaces和$schemas一节,所以现在不必担心这些。
请注意,为了增加价值,cwltool可以根据文件格式进行一些基本的推理,并在出现一些明显的不匹配时发出警告。
metadata_example.cwl
#!/usr/bin/env cwl-runner
cwlVersion: v1.0
class: CommandLineTool
label: An example tool demonstrating metadata.
inputs:
aligned_sequences:
type: File
label: Aligned sequences in BAM format
format: edam:format_2572
inputBinding:
position: 1
baseCommand: [ wc, -l ]
stdout: output.txt
outputs:
report:
type: stdout
format: edam:format_1964
label: A text file that contains a line count
$namespaces:
edam: http://edamontology.org/
$schemas:
- http://edamontology.org/EDAM_1.18.owl
命令行格式的CWL描述等价如下:
wc -l /path/to/aligned_sequences.ext > output.txt
样本参数文件
下面是上面示例的参数文件示例。我们鼓励为您的工具检入参数文件的工作示例。这允许其他人快速使用您的工具,从“已知好的”参数化开始。
sample.yml
aligned_sequences:
class: File
format: http://edamontology.org/format_2572
path: file-formats.bam
注意:要遵循下面的示例,您需要下载示例输入文件file-format .bam。该文件可从https://github.com/common-workflow-language/user_guide/raw/gh-pages/_includes/cwl/16-file-formats/file-formats.bam获得,并可以通过wget下载:
wget https://github.com/common-workflow-language/user_guide/raw/gh-pages/_includes/cwl/16-file-formats/file-formats.bam
运行cwl-runner
$ cwltool metadata_example.cwl sample.yml
/usr/local/bin/cwltool 1.0.20161114152756
Resolved 'metadata_example.cwl' to 'file:///media/large_volume/testing/cwl_tutorial2/metadata_example.cwl'
[job metadata_example.cwl] /tmp/tmpNWyAd6$ /bin/sh \
-c \
'wc' '-l' '/tmp/tmpBf6m9u/stge293ac74-3d42-45c9-b506-dd35ea3e6eea/file-formats.bam' > /tmp/tmpNWyAd6/output.txt
Final process status is success
{
"report": {
"format": "http://edamontology.org/format_1964",
"checksum": "sha1$49dc5004959ba9f1d07b8c00da9c46dd802cbe79",
"basename": "output.txt",
"location": "file:///media/large_volume/testing/cwl_tutorial2/output.txt",
"path": "/media/large_volume/testing/cwl_tutorial2/output.txt",
"class": "File",
"size": 80
}
}