di Raffaele Calogero (BITS)
Cos’è la bioinformatica e perché è sempre più necessaria
La bioinformatica è un insieme di metodologie computazionali e matematiche che, applicate a dati biologici, permettono di interpretarli opportunamente per ricavarne importanti informazioni.
La bioinformatica, pur avendo applicazioni estremamente variegate, esprime il massimo delle sue potenzialità nell’analisi dei dati omici.
L’avvento delle tecnologie omiche, infatti, ha cambiato gli approcci con cui si sviluppa l’analisi di un problema biologico. L’approccio seriale allo studio di una problematica biologica, ad esempio un gene ed una perturbazione alla volta, è stato soppiantato da un approccio parallelo multi-livello, ad esempio l’analisi del trascrittoma e dell’accessibilità della cromatina in presenza di una serie di silenziamenti genici (siRNA e CRISPR).
L’uso di tecnologie omiche, combinato con strumenti di silenziamento genico, permette la generazione di migliaia di informazioni, che necessitano di approcci computazionali per essere organizzate, analizzate ed interpretate.
Sviluppo di software da una parte, analisi dei dati dall’altra
Per analizzare esperimenti complessi, che generano migliaia di dati, sono necessari specifici strumenti computazionali e personale capace di utilizzarli. Questo ci porta a dividere la bioinformatica in due aree: sviluppo di strumenti computazionali ed analisi di dati. Queste due aree necessitano di competenze alquanto diverse.
Chi è coinvolto nello sviluppo di nuovi strumenti computazionali applicabili nell’analisi di dati biologici deve avere profonde competenze matematiche e di programmazione, che permettano lo sviluppo di software capace di rispondere a specifiche domande biologiche in modo efficace e riproducibile.
Dall’altro lato è necessario avere profonde competenze in ambito biologico e statistico per analizzare i dati generati dalle tecnologie omiche ed al contempo essere capaci di utilizzare gli strumenti computazionali necessari per analizzare queste tipologie di dati.
Come si diventa bioinformatici
Dopo un lungo periodo, in cui i bioinformatici si sono formati sul campo per la mancanza di un percorso accademico dedicato, oggi in Italia abbiamo a disposizione alcuni percorsi formativi specificatamente disegnati per la formazione dei bioinformatici (Tabella 1), la maggior parte dei quali sono lauree magistrali.
La tipologia della laurea triennale determina la magistrale a cui si potrà accedere. Una laurea triennale che abbia sviluppato competenze in ambito matematico e computazionale aprirà la strada all’acquisizione di competenze per lo sviluppo di nuovi algoritmi e metodiche computazionali applicate alla biologia.
Allo stesso modo, una laurea triennale che sviluppi competenze in ambito biologico e biotecnologico porterà alla scelta di un curriculum analitico, dove gli approcci computazionali vengono utilizzati ed integrati tra loro per estrarre nuova conoscenza biologica.
A chi volesse cimentarsi in bioinformatica, e che intenda iniziare il suo cammino con una laurea triennale in ambito biologico, suggerisco di cominciare da subito ad acquisire competenze di base in R e/o Python, dato che prendere confidenza con un linguaggio di programmazione richiede tempo e prima si inizia meglio è.
Per chi, invece, decide di avvicinarsi alla bioinformatica partendo da un curriculum matematico/informatico, è importante ricordare che la biologia è un sistema complesso, che deve essere analizzato nella sua interezza.
In ambito biologico sono molte le cose che “sappiamo di non sapere”, ma sono ancora di più quelle che “non sappiamo di non sapere”. Sicuramente, il “non sapere di non sapere” può portare a scelte erronee nello sviluppo/scelta di strumenti bioinformatici atti a studiare una specifica problematica, e questo ha portato negli ultimi anni al massivo sviluppo di metodi di intelligenza artificiale e deep learning, che possono facilitare l’estrazione di informazione, dato che “non sapere di non sapere” ha un effetto limitato su queste tecniche.
A mio avviso, vedremo nascere presto delle nuove tipologie di bioinformatici focalizzati allo studio di problematiche biologiche attraverso l’estrazione di conoscenza mediata dall’uso di approcci di intelligenza artificiale, come ad esempio il calcolo neuromorfico.