Se pueden hacer varios tipos de búsquedas con BLAST, como podemos ver
aquí, pero las dos
representativos son
blastp
y
blastn,
para hacer búsquedas
de secuencias de proteínas y nucleótidos respectivamente. Todas estas búsquedas se realizan con el mismo ejecutable, llamado
blastall,
que podemos invocar de esta manera para que nos muestre todas sus posible opciones:
$ blastall -
Las opciones más destacadas serían:
blastall 2.2.13 arguments:
-p Program Name [String]
-d Database [String]
default = nr
-i Query File [File In]
default = stdin
-e Expectation value (E) [Real]
default = 10.0
-m alignment view options:
0 = pairwise,
1 = query-anchored showing identities,
2 = query-anchored no identities,
3 = flat query-anchored, show identities,
4 = flat query-anchored, no identities,
5 = query-anchored no identities and blunt ends,
6 = flat query-anchored, no identities and blunt ends,
7 = XML Blast output,
8 = tabular,
9 tabular with comment lines
10 ASN, text
11 ASN, binary [Integer]
default = 0
-o BLAST report Output File [File Out] Optional
default = stdout
-F Filter query sequence (DUST with blastn, SEG with others) [String]
default = T
-v Number of database sequences to show one-line descriptions for (V) [Integer]
default = 500
-b Number of database sequence to show alignments for (B) [Integer]
default = 250
-M Matrix [String]
default = BLOSUM62
Una manera muy sencilla de correr BLAST sería:
$ blastall -p blastp -i misecuencias.fas -d basedesecuencias
De esta manera los resultados de BLAST se muestran en la salida estándar (pantalla), al no especificar
la opción
-o.
En este caso buscamos contra una biblioteca de secuencias llamada
basedesecuencias,
y esa búsqueda se realiza con todas las secuencias (al menos una) que haya, en formato FASTA, dentro de
misecuencias.fas.
Esta búsqueda se hace con todos los parámetros de BLAST con sus valores por defecto.