1)统计reads_1.fq 文件中共有多少条序列信息
2）输出所有的reads_1.fq文件中的标识符(即以@开头的那一行)
3) 输出reads_1.fq文件中的所有序列信息(即每个序列的第二行)
4）输出以‘@’及其后面的描述信息(即每个序列的第一行)
5）输出质量值信息(即每个序列的第四行)
6) 计算reads_1.fq 文件含有N碱基的reads个数
7) 统计文件中reads_1.fq文件里面的序列的碱基总数
8）计算reads_1.fq 所有的reads中N碱基的总数
9）统计reads_1.fq 中测序碱基质量值恰好为Q20的个数
10）统计reads_1.fq 中测序碱基质量值恰好为Q30的个数
11）统计reads_1.fq 中所有序列的第一位碱基的ATCGNatcg分布情况
12）将reads_1.fq 转为reads_1.fa文件(即将fastq转化为fasta)
13) 统计上述reads_1.fa文件中共有多少条序列
14）计算reads_1.fa文件中总的碱基序列的GC数量
15）删除 reads_1.fa文件中的每条序列的N碱基
16）删除 reads_1.fa文件中的含有N碱基的序列
17) 删除 reads_1.fa文件中的短于65bp的序列
18）删除 reads_1.fa文件每条序列的前后五个碱基
19）删除 reads_1.fa文件中的长于125bp的序列
20）查看reads_1.fq 中每条序列的第一位碱基的质量值的平均值

如果涉及到一些没讲过的知识点，可以自己尝试搜索一下，实在不会做就跳过，能做多少就多少

网上可以搜到答案，搜索：fasta和fastq格式文件的shell小练习题作业

1)统计reads_1.fq 文件中共有多少条序列信息

首先要了解一下fq文件的数据格式，每4行为一条序列的信息
1.序列标识以及相关的描述信息，以‘@’开头；
2.是碱基序列
3.以‘+’开头，一般后面什么都不加，或者加序列标示符、描述信息，为预留行
4.是质量信息，和第二行的序列相对应，每一个序列都有一个质量评分，根据评分体系的不同，每个字符的含义表示的数字也不相同。

2）输出所有的reads_1.fq文件中的标识符(即以@开头的那一行)

3) 输出reads_1.fq文件中的所有序列信息(即每个序列的第二行)

4）输出以‘@’及其后面的描述信息(即每个序列的第一行)

5）输出质量值信息(即每个序列的第四行)

6) 计算reads_1.fq 文件含有N碱基的reads个数

7) 统计文件中reads_1.fq文件里面的序列的碱基总数

8）计算reads_1.fq 所有的reads中`N碱基`的总数

9）统计reads_1.fq 中测序碱基质量值恰好为`Q20`的个数

10）统计reads_1.fq 中测序碱基质量值恰好为`Q30`的个数

11）统计reads_1.fq 中所有序列的第一位`碱基的ATCGNatcg分布`情况

12）将reads_1.fq 转为reads_1.fa文件(即将fastq转化为fasta)

13) 统计上述reads_1.fa文件中共有多少条序列

14）计算reads_1.fa文件中总的碱基序列的GC数量

15）删除 reads_1.fa文件中的每条序列的N碱基

16）删除 reads_1.fa文件中的含有N碱基的序列

17) 删除 reads_1.fa文件中的短于65bp的序列

18）删除 reads_1.fa文件每条序列的前后五个碱基

19）删除 reads_1.fa文件中的长于125bp的序列

20）查看reads_1.fq 中每条序列的第一位碱基的质量值的平均值

【生信技能树】Linux

【day 5】Linux 课后练习题

1)统计reads_1.fq 文件中共有多少条序列信息

2）输出所有的reads_1.fq文件中的标识符(即以@开头的那一行)

3) 输出reads_1.fq文件中的所有序列信息(即每个序列的第二行)

4）输出以‘@’及其后面的描述信息(即每个序列的第一行)

5）输出质量值信息(即每个序列的第四行)

6) 计算reads_1.fq 文件含有N碱基的reads个数

7) 统计文件中reads_1.fq文件里面的序列的碱基总数

8）计算reads_1.fq 所有的reads中`N碱基`的总数

9）统计reads_1.fq 中测序碱基质量值恰好为`Q20`的个数

10）统计reads_1.fq 中测序碱基质量值恰好为`Q30`的个数

11）统计reads_1.fq 中所有序列的第一位`碱基的ATCGNatcg分布`情况

12）将reads_1.fq 转为reads_1.fa文件(即将fastq转化为fasta)

13) 统计上述reads_1.fa文件中共有多少条序列

14）计算reads_1.fa文件中总的碱基序列的GC数量

15）删除 reads_1.fa文件中的每条序列的N碱基

16）删除 reads_1.fa文件中的含有N碱基的序列

17) 删除 reads_1.fa文件中的短于65bp的序列

18）删除 reads_1.fa文件每条序列的前后五个碱基

19）删除 reads_1.fa文件中的长于125bp的序列

20）查看reads_1.fq 中每条序列的第一位碱基的质量值的平均值

【day 5】Linux 课后练习题

1)统计reads_1.fq 文件中共有多少条序列信息

2）输出所有的reads_1.fq文件中的标识符(即以@开头的那一行)

3) 输出reads_1.fq文件中的 所有序列信息(即每个序列的第二行)

4）输出以‘@’及其后面的描述信息(即每个序列的第一行)

5）输出质量值信息(即每个序列的第四行)

6) 计算reads_1.fq 文件含有N碱基的reads个数

7) 统计文件中reads_1.fq文件里面的序列的碱基总数

8）计算reads_1.fq 所有的reads中N碱基的总数

9）统计reads_1.fq 中测序碱基质量值恰好为Q20的个数

10）统计reads_1.fq 中测序碱基质量值恰好为Q30的个数

11）统计reads_1.fq 中所有序列的第一位碱基的ATCGNatcg分布情况

12）将reads_1.fq 转为reads_1.fa文件(即将fastq转化为fasta)

13) 统计上述reads_1.fa文件中共有多少条序列

14）计算reads_1.fa文件中总的碱基序列的GC数量

15）删除 reads_1.fa文件中的每条序列的N碱基

16）删除 reads_1.fa文件中的含有N碱基的序列

17) 删除 reads_1.fa文件中的短于65bp的序列

18） 删除 reads_1.fa文件每条序列的前后五个碱基

19）删除 reads_1.fa文件中的长于125bp的序列

20）查看reads_1.fq 中每条序列的第一位碱基的质量值的平均值

3) 输出reads_1.fq文件中的所有序列信息(即每个序列的第二行)

8）计算reads_1.fq 所有的reads中`N碱基`的总数

9）统计reads_1.fq 中测序碱基质量值恰好为`Q20`的个数

10）统计reads_1.fq 中测序碱基质量值恰好为`Q30`的个数

11）统计reads_1.fq 中所有序列的第一位`碱基的ATCGNatcg分布`情况

18）删除 reads_1.fa文件每条序列的前后五个碱基