Horário: 14h
Palestrante: Emerson de Araújo Macedo (doutorado)
Orientadora: Profa Alba Melo
Título: Simulação de Enovelamento de Proteínas com Enterramento Atômico utilizando NAMD em Ambiente de Alto Desempenho
Resumo: A função biológica que uma proteína desempenha em nosso organismo está relacionada com sua estrutura nativa, ou seja, a configuração tridimensional (3D) funcional da sua molécula. Uma proteína assume essa configuração 3D através de um processo chamado de enovelamento. Duas questões que envolvem a pesquisa sobre o problema do enovelamento de proteínas são: (i) qual é o código físico do enovelamento, isto é, como as propriedades físico-químicas codificadas na sequência de aminoácidos, sua configuração geométrica unidimensional (1D), determinam a configuração 3D nativa? (ii) é possível desenvolver uma solução computacional que permita predizer a configuração 3D nativa a partir de sua configuração 1D primária? O enterramento atômico é uma hipótese para responder à primeira questão. Trata-se de uma medida relacionada a propriedades como o efeito hidrofóbico e as pontes de hidrogênio e indica a distância física de cada átomo da proteína ao centro geométrico de sua estrutura 3D nativa. Sabe-se que este enterramento atômico possui informação suficiente para se determinar a configuração 3D nativa de pequenas proteínas globulares. A simulação de dinâmica molecular (MD, Molecular Dynamics) é um método computacional que auxilia tanto o processo experimental de determinação de estruturas de proteínas quanto a pesquisa e projeto de novos fármacos para tratar doenças relacionadas, como Alzheimer e Parkinson. A simulação MD é utilizada no estudo do código físico do enovelamento (i) e na predição de estruturas proteicas (ii). Porém, o algoritmo de simulação MD exige um alto custo computacional para modelar o processo de enovelamento de uma proteína. É neste contexto que a computação de alto desempenho é utilizada para viabilizar a simulação MD de enovelamentos de proteínas consideradas grandes e de eventos biológicos de interesse, tais como ataques a vírus HIV. Nessa apresentação, mostrarei uma solução de alto desempenho para a simulação MD, chamada NAMD, e como adaptá-la para auxiliar na pesquisa sobre o efeito do enterramento atômico no enovelamento de proteínas
Horário: 14h20
Palestrante: Francisco Handrick Tomaz da Costa (doutorado)
Orientador: Prof Rodrigo Bonifácio
Title: Mitigating Blindspots in the Android Mining Sandbox Approach for Malware Detection
Abstract: Android is by far the most popular operating system for the mobile platform and the ubiquitous nature of smartphones in our daily lives has only made its security a significant topic for researchers and practitioners alike. Previous research has shown that security experts can benefit from the mining sandbox approach based on sensitive APIs call to classify malware. This approach take advantage of test case generation tools to generate inputs to apps. In this paper, we present a negative result of previous works, which investigate accuracy of test case generation tools for mining sandbox. Even thought, these works find that test generation tool which performs best achieved an accuracy of 75%, our work revealed that this accuracy is only valid on a less representative dataset of app pairs (benign-malicious). We have reached this conclusion when we try to understand which malware families can be uncovered by mining sandbox approach or not based on these previous works. For that, we reproduced the results in a larger (complete) dataset of app pairs with a much more diverse similarity index and covering a broader range of malware kinds. To our surprise, our experiments revealed that the accuracy rate drops significantly. We also open the discussion on the possible blindspots that plague mining sandbox approaches and their accuracy issues when scaled. To this end, we hypothesize the presence of divergent dynamic call traces between app pairs. Our evaluation show that when mining sandbox approaches are made aware of this blindspot, the accuracy rate improves, among other valuable insights for the research community.
Horário: 14h40
Palestrante: Lucas Fernandes Ribeiro (doutorado)
Orientador: Prof Ricardo Jacobi
Title: Evaluating a Machine Learning-based Approach for Cache Configuration
Resumo: As the systems perform progressively complex tasks, the search for energy efficiency in computational systems is constantly increasing. The cache memory has a fundamental role in this issue. Through dynamic cache reconfiguration techniques, it is possible to obtain an optimal cache configuration that minimizes the impacts of energy losses. To achieve this goal, a precise selection of cache parameters plays a fundamental role. In this work, a machine learning-based approach is evaluated to predict the optimal cache configuration for different applications considering their dynamic instructions and a variety of cache parameters, followed by experiments showing that using a smaller set of application instructions it is already possible to obtain good classification results from the proposed model. The results show that the model obtains an accuracy of 96.19% using the complete set of RISC-V instructions and 96.33% accuracy using the memory instructions set, a more concise set of instructions that directly affect the cache power model, besides decreasing the model complexity.
Horário: 15h
Palestrante: Dennis Savio Martins da Silva (doutorado)
Orientadora: Profa Maristela Holanda
Título: Uma Arquitetura para Dados Geoespaciais Massivos de Internet das Coisas
Resumo: A popularização da internet das coisas (Internet of Things - IoT) tem estimulado a utilização de ferramentas de big data para o armazenamento e análise dos dados geoespaciais massivos oriundos destas aplicações. Podem ser encontradas na literatura soluções diversas, que consideram dispositivos heterogêneos e com níveis de mobilidade variando do estacionário ao móvel. Considerar o nível de mobilidade dos dispositivos na escolha dos mecanismos de armazenamento e análise pode representar uma melhoria no funcionamento das aplicações IoT, ao possibilitar o uso de ferramentas com desempenho e funcionalidades mais apropriados ao padrão de dados de localização gerado por contextos específicos. Neste trabalho, é investigada a relação entre o nível de mobilidade dos dispositivos e o desempenho dos frameworks para dados massivos geoespaciais. Além disso, é proposta uma arquitetura para gerenciamento de dados geoespaciais massivos de IoT, que considere o nível de mobilidade dos dispositivos para oferecer recursos de armazenamento e análise mais adequados aos padrões de dados de localização e de observação presentes em uma aplicação.
Horário: 15h20
Palestrante: Alessandro Rodrigues e Silva (doutorado)
Orientadora: Profa Mylene Farias
Title: Quality of User Experience for advanced multimedia services
Abstract: In the last decade, several types of multimedia services have been emerged, virtual reality, augmented/mixed reality, 360 videos, all of them may use 3D content to enhance the experience. Still, the level of acceptability and popularity these applications are strongly correlated to the quality of User Experience (QuX), i.e. the user's opinion should be taken into consideration when designing and testing his applications. Since research in this area depends heavily on data acquired in psychophysical experiments, a platform, and databases, that takes in to account the user, and the content, are considered important tools to researchers and developers of these technologies. In this work, our first goal is to build a platform and databases of 3D-enabled technologies, that contains a set of typical stereoscopic distortions. Our second goal is to understand how these stereoscopic degradations are perceived by viewers and how it influences the Quality of User Experience.
Horário: 15h40
Palestrante: Ricardo José Menezes Maia (doutorado)
Orientador: Prof Ricardo Jacobi
Título: Framework para Aprendizado de Máquina com Dados Privados
Resumo: A evolução dos algoritmos de aprendizado de máquina, Machine Learning (ML), com um grande volume de dados proporcionam inúmeras aplicações benéficas à sociedade. Em contrapartida, esses algoritmos acessam as informações dos usuários sem proteções que garantem a privacidade dos dados. Resolver este problema é primordial, pois a informação é um recurso valioso na sociedade moderna, além do que, muitos dados sobre indivíduos e empresas são sensíveis. O desenvolvimento de algoritmos de ML com dados privados e a técnica criptográfica de computação multipartidária segura, Secure Multi Party Computation (MPC), mesmo limitado a operações de soma e multiplicação, é viável, pois cada parte envolvida no treinamento e inferência não revela seu dado privado a outras partes. Contudo, essa limitação de operações impõe um desafio ao projetista ao mapear algoritmos para MPC, pois exigirá a busca por estratégias matemáticas para representar funções apenas com soma e multiplicação. Nesta pesquisa o objetivo é propor e implementar protocolos MPC para algoritmos de ML, de modo a garantir a privacidade de dados nas fases de treinamento e inferência. Foram criados protocolos MPC para resolver três problemas distintos: (i) implementar inferência privada de programas maliciosos, Malicious Software (malware), que utilizam algoritmos geradores de domínio, Domain Generation Algorithms (DGA), através dos modelos Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM) e MultiLayer Perceptron (MLP); (ii) desenvolver protocolo MPC para treinamento e inferência privada de COVID-19 com CNN e tendo como entrada imagens de raio-X de tórax; (iii) criar protocolo para modelos K Nearest Neighbors (KNN) com distância Jaccard para sistemas de recomendação sobre dados privados de usuários. Para provar formalmente a segurança dos protocolos MPC utiliza-se do paradigma de simulação. Os resultados obtidos nas otimizações dos métodos são comparados com o estado da arte quanto a tempo de execução e taxas de erro.
Local: Teams- Equipe PPGI-316415 Seminário, Canal 2-2022
https://teams.microsoft.com/l/channel/19%3a05900df7390e45edaa77283171cbb44b%40thread.tacv2/Semin%25C3%25A1rios%25202-2022?groupId=93b66213-b249-467a-bcbe-dcd4255edf95&tenantId=ec359ba1-630b-4d2b-b833-c8e6d48f8059
Profa Célia Ghedini Ralha (Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo.)
Coordenadora Seminários de Pós-Graduação em Informática 2-2022