length
length 可以计算出变量的长度。length($a)
$a = 'sd';
$size = length($a);
可以通过length 很快计算出一条氨基酸序列的长度。
substr
substr 可以用来输出指定的子字符串。substr($a, offset, length)
如果省略length 的输入,则默认由起始位置到最后。如果offset 为负数,则从右边开始。
注意:perl 默认的顺序是从0开始的。
$a = 'atcgaaaa';
$s = substr($a, 2, 2); # 从第三个字符开始,选定两个字符。
$s2 = substr($a, -5); # 从右边数第五个,开始输出整个字符。
可以通过substr 快速提取蛋白序列的功能区,比如功能区位于第12个到23个功能区的序列。
index
index 可以用来返回找寻的子字符串在字符串中的位置,如果不在字符串上,则返回-1。index($string, $substring, position)
,其中position表示限制搜寻的区域,默认是从头搜寻。
$s = index('perl6666', 'erl66', 1);
可以利用index 查找某一功能区在蛋白质序列中的位置。