1. 问题
  2. 如何标记输入文件所需的文件格式?
  3. 如何标记输出文件的生成文件格式?
  4. 目标
  5. 学习如何明确地指定file对象的格式。

工具和工作流可以将file类型作为输入并生成它们作为输出。我们还建议为file类型指定格式。这有助于为其他人记录如何使用您的工具,同时允许您在创建参数文件时执行一些简单的类型检查。
对于文件格式,我们建议引用已存在的本体(如我们的例子中的EDAM),为您的机构引用一个本地本体,或者在与他人共享您的工具之前不要为快速开发添加文件格式。你可以在这里浏览IANA和EDAM的现有文件格式列表。
在下一篇教程中,我们将更详细地解释文档的$namespaces和$schemas一节,所以现在不必担心这些。
请注意,为了增加价值,cwltool可以根据文件格式进行一些基本的推理,并在出现一些明显的不匹配时发出警告。
metadata_example.cwl

  1. #!/usr/bin/env cwl-runner
  2. cwlVersion: v1.0
  3. class: CommandLineTool
  4. label: An example tool demonstrating metadata.
  5. inputs:
  6. aligned_sequences:
  7. type: File
  8. label: Aligned sequences in BAM format
  9. format: edam:format_2572
  10. inputBinding:
  11. position: 1
  12. baseCommand: [ wc, -l ]
  13. stdout: output.txt
  14. outputs:
  15. report:
  16. type: stdout
  17. format: edam:format_1964
  18. label: A text file that contains a line count
  19. $namespaces:
  20. edam: http://edamontology.org/
  21. $schemas:
  22. - http://edamontology.org/EDAM_1.18.owl

命令行格式的CWL描述等价如下:

  1. wc -l /path/to/aligned_sequences.ext > output.txt

样本参数文件

下面是上面示例的参数文件示例。我们鼓励为您的工具检入参数文件的工作示例。这允许其他人快速使用您的工具,从“已知好的”参数化开始。
sample.yml

  1. aligned_sequences:
  2. class: File
  3. format: http://edamontology.org/format_2572
  4. path: file-formats.bam

注意:要遵循下面的示例,您需要下载示例输入文件file-format .bam。该文件可从https://github.com/common-workflow-language/user_guide/raw/gh-pages/_includes/cwl/16-file-formats/file-formats.bam获得,并可以通过wget下载:

  1. wget https://github.com/common-workflow-language/user_guide/raw/gh-pages/_includes/cwl/16-file-formats/file-formats.bam

运行cwl-runner

  1. $ cwltool metadata_example.cwl sample.yml
  2. /usr/local/bin/cwltool 1.0.20161114152756
  3. Resolved 'metadata_example.cwl' to 'file:///media/large_volume/testing/cwl_tutorial2/metadata_example.cwl'
  4. [job metadata_example.cwl] /tmp/tmpNWyAd6$ /bin/sh \
  5. -c \
  6. 'wc' '-l' '/tmp/tmpBf6m9u/stge293ac74-3d42-45c9-b506-dd35ea3e6eea/file-formats.bam' > /tmp/tmpNWyAd6/output.txt
  7. Final process status is success
  8. {
  9. "report": {
  10. "format": "http://edamontology.org/format_1964",
  11. "checksum": "sha1$49dc5004959ba9f1d07b8c00da9c46dd802cbe79",
  12. "basename": "output.txt",
  13. "location": "file:///media/large_volume/testing/cwl_tutorial2/output.txt",
  14. "path": "/media/large_volume/testing/cwl_tutorial2/output.txt",
  15. "class": "File",
  16. "size": 80
  17. }
  18. }