A CPU-FPGA Heterogeneous Approach for Biological Sequence Comparison using High Level Synthesis

/Discrepancy monitoring and model update: A data-driven approach to mitigate structural uncertainty in self-adaptive software systems

/Análise de métodos baseados em Aprendizado de Máquina para Predição de snoRNAs no genoma de vertebrados

/The Emergence of an Information Bottleneck Theory of Deep Learning

Palestrante: Carlos Antonio Campos Jorge (doutorando)

Orientador:Profa Alba Melo

Título: A CPU-FPGA Heterogeneous Approach for Biological Sequence Comparison using High Level Synthesis

Resumo:This paper presents an HLS implementation of the Longest Common Subsequence (LCS) algorithm combined with a weighted-based scheduler for comparing biological sequences prioritizing energy consumption. The LCS algorithm has been thoroughly tailored using Vivado High-Level Synthesis tool, which is able to synthesize Register Transfer Level (RTL) from high-level language descriptions, such as C/C++. Performance and energy consumption results were obtained with a CPU Intel Core i7-3770 and an Alpha-Data ADM-PCIE-KU3 board that has a Xilinx Kintex UltraScale XCKU060 FPGA chip. We executed a batch of 20 comparisons of sequences on 10k, 20k and 50k sizes. Our experiments showed that the energy consumption on the combined approach was significantly lower when compared to the CPU, achieving 75% energy reduction on 50k comparisons.

 

Horário: 14h30

Palestrante: Arthur José Rodrigues Farias (doutorando)

Orientador:Profa Genaina Rodrigues

Título: Discrepancy monitoring and model update: A data-driven approach to mitigate structural uncertainty in self-adaptive software systems

Resumo:Modern self-adaptive systems are prone to a range of uncertainties that is hard to identify, let alone to cope with all of them at runtime. A common, but complex type of uncertainty that has recently caught the community attention is the structural uncertainty, i.e., uncertainty that is caused by a misalignment between the model and the actual managed system. In order to develop a reliable and efficient controller, it is paramount that its vision of the managed system matches with reality. However, the complexity and dynamism of self-adaptive systems combined with the amount of information transferred between their components makes it difficult to develop a generic solution that mitigates structural uncertainty. In this work, we propose a data driven approach to monitor, detect and reduce the effects of structural uncertainty on self-adaptive systems. To this end, we enrich the model discrepancy method with information theory concepts such as entropy and mutual information, aiming at quantifying, during runtime, the divergence between the managed system model and the actual system. Additionally, we present the idea of managed system model update, which will allow us to adopt a model averaging method to derive models that faithfully represent the real system. For pedagogic and generalization purposes, we start validating our approach in a toy self-adaptive system and, once formalized, we evaluate the proposal in more complex case studies. Besides the conceptual validation of the proposal, we intend to assess the scalability in terms of time and space resource consumption.

 

Horário: 15h

Palestrante: Mirele Carolina Souza Ferreira Costa (mestranda)

Orientador:Profa. Maria Emilia M. T. Walter

Título: Análise de métodos baseados em Aprendizado de Máquina para Predição de snoRNAs no genoma de vertebrados

Resumo:Os RNAs não-codificadores (ncRNAs) de proteínas desempenham papéis importantes em vários processos biológicos. Essas moléculas de ncRNAs estão relacionadas a muitas doenças. Classificar e identificar ncRNAs é uma tarefa desafiadora, devido a dificuldade de certificar experimentalmente a função de um ncRNA. A função de um ncRNA esta associada à sua estrutura espacial secundária e terciária. O que impossibilita a utilização de métodos de predição de genes codificadores de proteínas. Pois esses métodos utilizam informação de sequência primária,  por exemplo, ferramentas de bioinformática baseadas em inferência de homologia, como Blast não são sensíveis na identificação de ncRNAs. A combinação de características da estrutura secundária de ncRNAs com Aprendizado de Máquina (AM) melhora a sensibilidade de identificação e classificação de ncRNAs. Deste modo, buscamos compreender quais são os limites da aplicação de técnicas de AM para predição de ncRNAs, em particular small nucleolar RNAs (snoRNAs). Neste projeto, propomos um método de análise, para investigar qual o poder de predição de ncRNAs dos métodos de AM, a partir de mutações simuladas computacionalmente em sequências de snoRNAs gerando uma árvore de evolução. Acreditamos que os resultados dessa investigação possam auxiliar na identificação de novas características para aprimorar os métodos de AM na predição de ncRNAs.

 

Horário: 15h30

Palestrante: Frederico Guth (mestrando)

Orientador:Prof. Teófilo de Campos

Título: The Emergence of an Information Bottleneck Theory of Deep Learning

Resumo: Nesta palestra será apresentado o problema relacionado a teoria de aprendizado de máquina e a teoria da informação com foco no information bottleneck theory(IBT), com o objetivo de investigar até que ponto IBT pode auxiliar no entendimento de aprendizado profundo e seus fenômenos.

Local: Teams MS - Equipe PPGI-316415 Seminário, Canal Seminários 1-2020

 

https://teams.microsoft.com/l/channel/19%3a728c9eee63174fb8ad9c29cbc6a3d1ff%40thread.tacv2/Semin%C3%A1rios1-2020?groupId=93b66213-b249-467a-bcbe-dcd4255edf95&tenantId=ec359ba1-630b-4d2b-b833-c8e6d48f8059

 

Profa Célia Ghedini Ralha (Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo.)

Coordenadora Seminários de Pós-Graduação em Informática 1-2020