Se pueden hacer varios tipos de búsquedas con BLAST, como podemos ver
aquí, pero las dos
representativos son
blastp
y
blastn
,
para hacer búsquedas
de secuencias de proteínas y nucleótidos respectivamente. Todas estas búsquedas se realizan con el mismo ejecutable, llamado
blastall
,
que podemos invocar de esta manera para que nos muestre todas sus posible opciones:
$ blastall -
Las opciones más destacadas serían:
blastall 2.2.13 arguments: -p Program Name [String] -d Database [String] default = nr -i Query File [File In] default = stdin -e Expectation value (E) [Real] default = 10.0 -m alignment view options: 0 = pairwise, 1 = query-anchored showing identities, 2 = query-anchored no identities, 3 = flat query-anchored, show identities, 4 = flat query-anchored, no identities, 5 = query-anchored no identities and blunt ends, 6 = flat query-anchored, no identities and blunt ends, 7 = XML Blast output, 8 = tabular, 9 tabular with comment lines 10 ASN, text 11 ASN, binary [Integer] default = 0 -o BLAST report Output File [File Out] Optional default = stdout -F Filter query sequence (DUST with blastn, SEG with others) [String] default = T -v Number of database sequences to show one-line descriptions for (V) [Integer] default = 500 -b Number of database sequence to show alignments for (B) [Integer] default = 250 -M Matrix [String] default = BLOSUM62
Una manera muy sencilla de correr BLAST sería:
$ blastall -p blastp -i misecuencias.fas -d basedesecuencias
De esta manera los resultados de BLAST se muestran en la salida estándar (pantalla), al no especificar
la opción
-o
.
En este caso buscamos contra una biblioteca de secuencias llamada
basedesecuencias
,
y esa búsqueda se realiza con todas las secuencias (al menos una) que haya, en formato FASTA, dentro de
misecuencias.fas
.
Esta búsqueda se hace con todos los parámetros de BLAST con sus valores por defecto.