Unix与Perl编程:数据检查、求助途径及问题解决
数据检查的重要性
在处理数据时,特别是DNA序列等专业数据,要确保数据的有效性。例如,某些字符不应出现在特定序列中,像“X”不能代表核苷酸,“J”不对应任何氨基酸;若下载对应基因的DNA序列,其编码部分长度应是三个核苷酸的倍数。
当面对大量数据时,不能仅靠肉眼检查。若对数据有怀疑,可以花一两个小时编写简单的“检查”脚本。比如,对于数据的合理性可以有一些基本推测:起始坐标应在结束坐标之前;“事物”的长度通常为非零值;化石、挖掘物或古代文明的年代不应超过46亿年。总之,永远不要盲目信任数据,一定要仔细检查。
内置支持工具
当在Unix或Perl编程中遇到问题时,可先利用计算机上的内置支持工具。
-Unix的man命令:每个Unix命令的文档都包含在man页面中,可使用man命令访问。
-Perl的perldoc命令:
-查看函数描述:使用perldoc -f加上函数名,可查看Perl函数的描述。例如,查看int函数:
$ perldoc -f int int EXPR int Returns the integer portion of EXPR. If EXPR is omitted, uses $_. You should not use this fu