linux基础常用命令_vlambda技术博客

vlambda
2020-06-18

linux基础常用命令

cat test.txt|awk '{print NF}' #统计字符串的个数cat test.txt|awk '{print NR}' #统计每一行的行号cat test.txt|awk '{print length}' #统计每一行的字符串长度

linux基础常用命令

cat test.txt|awk 'NR%2==1' #删除test.txt文件中的所有偶数行cat -n test.txt #标示文件的行号tac test.txt #从最后一行开始反向查看一个文件的内容

linux基础常用命令

head -6 test.txt|grep '>' #查看前行中带有>号的行head -6 test.txt|grep -v '>'     #查看前6行中不带>号的行wc -l test.txt #统计test.txt文件的行数wc -w test.txt    #统计test.txt文件的单词数wc -c test.txt #统计test.txt文件的字节数

linux基础常用命令

sort A.txt B.txt|uniq #取出两 A.txt 和B.txt两个文件的并集（重复的行只保留一份）sort A.txt B.txt|uniq -d #取出两 A.txt 和B.txt两个文件的交集（只留下同时存在两个文件的行）sort A.txt B.txt|uniq -u #删除两 A.txt 和B.txt两个文件的交集，留下其他的行

linux基础常用命令

sort -k 3 test.txt  #将文件按照test.txt以第三列来进行排序sort -k 1 test.txt|cut -f 1    #按照第1列字母顺序进行排序sort -n -k 1 test.txt|cut -f 1 #按照第1列数值大小进行排序，从小到大sort -n -r -k 1 test.txt|cut -f 1    #按照第1列数值大小进行排序，从大到小sort -k 3 test.txt|cut -f 3|uniq #去除重复行sort -k 3 test.txt|cut -f 3|uniq -c  #在前面加上每一行出现的次数

awk '{print $1}' test.txt #将test.txt文件的第一列输出到屏幕awk '$3="gene" {print $0}' test.txt  #将test.txt第三列是基因的列的一整行输出到屏幕中awk '$1=="Pt" && $4>=1531 && $5<=1548 {print $0}' test.txt  #想要筛选染色体某一块特定的区域内的序列awk '$1=="Pt" && $4>=1531 && $5<=1548 {print $1"\t"$5}' test.txt  #根据筛选条件，筛选出来第1、5列

linux基础常用命令

awk '$3=="gene" {print $1"\t"$3"\t"$4"\t"$5}' choose.gff>choose1.gff

下面是生成的choose1.gff文件

linux基础常用命令

awk '$3=="exon" {print $1"\t"$3"\t"$4"\t"$5}' choose.gff>choose2.gff

下面是生成的choose2.gff文件

linux基础常用命令

paste choose1.gff choose2.gff>choose3.gff #合并choose1.gff choose2.gff两个文件并输出到choose3中.gff

linux基础常用命令

paste -d '+' choose1.gff choose2.gff>choose4.gff  #合并choose1.gff choose2.gff两个文件，并用+区分，然后输出到choose4.gff文件中

linux基础常用命令

cat choose1.gff choose2.gff>choose6.gff  #将choose1.gff choose2.gff两个文件进行合并

linux基础常用命令

sed '/*#/d;/^$/d' choose.gff> choose5.gff  #删除文件中的所有注释和空白行

linux基础常用命令

下面是生成的choose5.gff文件

linux基础常用命令

grep 'Biological Process:' S1_S2_S3_vs_R1_R2_R3.annotation.txt>result.txt  #查看S1_S2_S3_vs_R1_R2_R3.annotation.txt中，包含Biological Process:的词汇，并输出到result.txt

comm -1 file1 file2  #比较两个文件的内容只删除file1所包含的内容comm -2 file1 file2  #比较两个文件的内容只删除file2所包含的内容comm -3 file1 file2  #比较两个文件的内容只删除两个文件共有的部分

grep '>' sequence.fasta|wc -l  #查看含有> 的序列行号

cut -d -f 3 choose4.gff  #系统把choose4.gff 文件的第三列输出到屏幕当中，由于cut的默认分隔符是Tab键，而choose4.gff文件分隔符也是Tab文件分隔符也是Tab键，所以这里可以不用-d来指定分隔符

sed -i 's/exon/EN/g' choose2.gff  #将choose2.gff文件里的所有exon换成EN

linux基础常用命令

grep [0-9] choose.gff >choose7.gff #将文件choose.gff文件中所有包含数字的行输出到choose7.gff

vlambda博客
学习文章列表

linux基础常用命令

标签:

推荐阅读

相关文章

vlambda博客 学习文章列表

linux基础常用命令

标签:

推荐阅读

相关文章

vlambda博客
学习文章列表