|
|
|
Angra dos Reis, Rio de Janeiro, Brazil August 29-31, 2007 |
|
|
|
BIOINFORMATICS COURSE |
|
|
|
|
|
This course main goal is to introduce some concepts, foundations and an overview of problems and tools.
Open to all BSB+IWGD participants, mainly students at all levels.
Classes will be in Portuguese ONLY, slides are available (see below) for download.
|
|
Programação para o Curso de Introdução à Bioinformática
Abertura
- Silvana Giuliatti - Coordenadora do Curso
Professora da Faculdade de Medicina, USP-Ribeirão Preto, Brasil
Doutora em Física Aplicada à Medicina e Biologia, USP-São Paulo, Brasil - Imperial College (Londres)
Apresentação da equipe, orientações básicas sobre o curso e visão geral das atividades que serão desenvolvidas.
Equipe
- Alynne Oya Chiromatzo
Doutoranda em Genética - USP-Ribeirão Preto, Brasil
Mestre em Engenharia Elétrica (2005) - UEL, Brasil
- Daniel Macedo de Melo Jorge
Mestrando em Bioinformática - USP, Brasil
- Luciano Ângelo de Souza Bernardes
Doutorando em Genética - USP-Ribeirão Preto, Brasil
Mestre
em Biociências Aplicadas à Farmácia (2005) - USP-Ribeirão Preto, Brasil
- Saulo França Amui
Doutorando em Bioinformática - USP, Brasil
Mestre em Toxologia (2006) - USP, Brasil
- Monitor André Luiz Teixeira Vinci
Graduando em Informática Biomética - USP-Ribeirão Preto, Brasil
|
|
Aula 1
Genética Molecular (Daniel M. Jorge)
Genética, do grego genno (fazer nascer), é a ciência dos genes, da hereditariedade e da variação dos organismos. Ramo da biologia que estuda a forma como se transmitem as características biológicas de geração para geração. Com o advento da biologia molecular surgiu a genética molecular, que permitiu grandes avanços na genética. Entretanto com isso foram gerados uma grande quantidade de dados, que para serem analisados tornou-se necessário a utilização de computadores, com isso otimizando e melhorando os resultados. O conhecimento da genética então é indispensável para todos os professores, profissionais, pesquisadores que atuam na biologia, uma vez que essa ciência rege a vida dos seres vivos, quer animais, plantas ou microrganismos.
Conteúdo Proposto:
1. Genética;
2. História da Genética Molecular;
3. Genes e genomas;
4. Organização e estrutura dos genomas;
5. Genoma funcional;
6. Transcriptoma;
7. Técnicas Genética Molecular
|
|
Aula 2
PhredPhrap (Luciano Bernardes)
Na era genômica quantidades significativas de dados foram gerados através de equipamentos de sequenciadores automáticos, devido a isso foram criados softwares para que esses dados pudessem ser analisados de forma rápida e confiável. Então, o pacote PhredPhrap que incorpora outros programas como, phred, phd2fasta, cross_match, phrap e consed exercendo funcionalidades para interpretar e converter os cromatogramas que são os arquivos de saída da máquinas sequenciadoras, qualificar e associar valores de qualidade as bases, mascarar subseqüências (fragmentos) que correspondam aos vetores utilizados na clonagem e no final agrupando as seqüências que tiveram um grau de sobreposição ou complementaridade, formando assim contigs e caso não haja sobreposição gerando singlets. No final da análise é possível visualizar os resultados obtidos de forma gráfica e detalhada de todas as saídas do pacote.
Conteúdo Proposto:
1. Cromatogramas: máquinas seqüenciadores;
2. Phred: sintaxe, diretórios e arquivos;
3. Phd2fasta: sintaxe e arquivos;
4. Cross_match: sintaxe e vector;
5. Phrap: sintaxe e arquivos;
6. Cap3: sintaxe e arquivos;
7. Contig Viewer: visualização;
8. Consed: visualização;
9. Pipeline.
|
|
Aula 3
Alinhamento de Seqüências Biológicas (Silvana Giuliatti)
O Alinhamento de seqüências biológicas é uma ferramenta de extrema importância em Biologia Molecular. Com o sequenciamento automatizado do genoma de vários organismos tem-se acumulado um volume muito grande de dados, o que torna a análise de forma manual impraticável. Assim, ferramentas de Bioinformática, como alinhamento de seqüências, são muito úteis. O objetivo do alinhamento de seqüências biológicas é alinhar seqüências relacionadas, dada uma função de custo. Com isto, explora-se o grau de similaridade entre cadeias de DNA, RNA ou proteínas. Um grau alto de similaridade indica uma alta probabilidade das funções executadas pelas moléculas comparadas serem semelhantes. Os resultados obtidos permitem a descoberta, por exemplo, de funções de novas proteínas ou a identificação de possíveis mutações genéticas. O alinhamento pode ser utilizado também para medir a distância evolutiva entre duas ou mais espécies, baseado na homologia das seqüências comparadas.
Conteúdo Proposto:
1. Alinhamento de Pares de Seqüências
Matrizes de Pontos
Programação Dinâmica
Matrizes de Substituição – PAM e BLOSUM
Método por palavras
2. Alinhamento Múltiplo de Seqüências
|
|
Aula 4
Blast, Clustal e outros programas (Alynne Chiromatzo)
Devido seqüenciamento em massa, tornou-se muito difícil a análise manual dos dados. Para facilitar esse processo foram criadas diversas ferramentas que ajudam avaliar a similaridade entre seqüências. Elas servem tanto para comparar uma nova seqüência gerada no laboratório com um repositório já existente, quanto para comparar a distância entre diferentes organismos. Inicialmente serão apresentados os algoritmos fundamentais de alinhamento, para que se possa entender a evolução desses. Assim, com esta introdução é possível então apresentar as principais ferramentas de alinhamento que são o blast e o clustal.
Conteúdo Proposto:
1. Fasta, Blast e Clustal: introdução;
2. Algoritmos;
3. Funcionamento dos programas
|
|
Aula 5
Linguagem de Programação Perl na Bioinformática
Perl (Practical Extraction and Report Language) é uma linguagem de programação estável, multiplataforma e livre (GPL), podendo ser utilizada de forma procedural ou orientada a objeto. Originada do shell scripting, Awk e linguagem C, foi desenvolvida para ser prática (fácil de utilizar, eficiente, completa) na manipulação de texto, processamento de cadeias (strings), pattern matching (expressões regulares), o que permite tempos de desenvolvimento curtos. Devido à sua versatilidade é usada em aplicações de muitos setores: administração de sistemas, programação de redes, desenvolvimento de interfaces gráficas, e outros; destaca-se aqui aquelas destinadas a web (CGI Perl) e à bioinfomática (BioPerl). Seu lema é "There's More Than One Way To Do It" (Existe mais de um jeito de fazer).
Conteúdo Proposto:
1. Perl: a linguagem, a historia, a liberdade, o interpretador;
2. caracteristicas: Variáveis, estruturas de controle, manipulação de arquivos, expressões regulares;
3. Modularização do código: Funções, módulos, classes, objetos;
4. Ajudas: PerlDoc, docBioPerl, CPAN
5. BioPerl: Parsing Blast
6. Livros
7. Comunidades
|
|
Aula 6
Filogenia Molecular (Daniel M. Jorge)
A filogenia é o estudo das relações evolutivas entre os organismos, que surgiu com Darwin, junto com o conceito de ancestralidade entre espécies, já a filogenia molecular surgiu com os avanços das técnicas de biologia molecular. A aplicação desses métodos logo levou ao desenvolvimento de medidas de distância genética e de montagem de árvores que expressassem as diferenças observadas entre os organismos. A grande quantidade de dados gerados e seu acúmulo a partir da década de 1970 permitiu grandes avanços na filogenia molecular. Os dados das seqüências de DNA e proteínas foram utilizados para a montagem de árvores filogenéticas em organismos proximamente (homens e macacos) ou distantemente relacionados (eucarióticos, eubactéria e archaeabacteria). Portanto, os dados moleculares têm provido uma poderosa ferramenta de estudo da história evolutiva, de forma a possibilitar a reconstrução da filogenia dos maiores grupos de organismos vivos. Complementando os métodos tradicionais de classificação dos organismos, como a morfologia, fisiologia e paleontologia. Sendo assim com a combinação dos métodos moleculares e métodos tradicionais será possível reconstruir modelos mais precisos que reflitam de forma correta as relações entre os organismos.
Conteúdo Proposto:
1. Filogenia Molecular;
2. Conceitos;
3. Importância;
4. Métodos de reconstrução filogenética;
5. Modelos evolutivos;
6. Aplicações
|
|
Aula 7
Bancos de dados aplicados a sistemas biológicos (Saulo Amui)
A quantidade de bancos de dados em Biologia Molecular vem crescendo exponencialmente nos últimos anos, e o aspecto funcional da bioinformática é a representação, o armazenamento e a distribuição de dados. Os objetivos destes bancos variam e podem ser utilizados para armazenar e disponibilizar bioseqüências, funções moleculares, estruturas de proteínas, modelos metabólicos, entre outros, oferecendo em alguns casos informações mais amplas, ou seja, cobrindo uma área mais significativa da Biologia, e em outros, informações menos detalhadas. Em alguns casos, as informações biológicas são obtidas por análise computacional de outros bancos de dados; já em outros, através da literatura ou informações definidas por pesquisadores. Desta forma, será apresentado uma abordagem geral sobre a importância destes bancos de dados biológicos, sua estruturação, organização e busca de informações nos principais bancos existentes na área de bioinformática.
Conteúdo Proposto:
1. classificação dos bancos de dados;
2. bioinformática e banco de dados;
3. estruturação dos bancos vs. Acessibilidade;
4. formas de armazenamento;
5. realidades de armazenamento;
6. realidades e problemas comuns;
7. bancos de dados públicos
|
|
|
|
|
|
|