você está aqui: Home → Coluna do Cesar Brod
De acordo com as Leis 12.965/2014 e 13.709/2018, que regulam o uso da Internet e o tratamento de dados pessoais no Brasil, ao me inscrever na newsletter do portal DICAS-L, autorizo o envio de notificações por e-mail ou outros meios e declaro estar ciente e concordar com seus Termos de Uso e Política de Privacidade.
Por Cesar Brod
Data de Publicação: 08 de Agosto de 2008
Em novembro de 2005 escrevi um artigo (que depois virou uma palestra) chamado Computação para Humanos. Há mais tempo eu já havia escrito outro sobre o projeto Oxygen, do MIT, relatando alguns exemplos do que é chamado computação ubíqua, ou onipresente. Há duas línguas oficiais no Brasil, uma delas é a LIBRAS, que é usada na comunicação com (e entre) os surdos. Uma das áreas mais fascinantes e que mais apresenta desafios na computação é a que trata da interface entre humanos e máquinas. Se já não é trivial construir a interface ideal para aqueles que dispõem de todos os sentidos, imagine como é tratar isto para os que não podem contar com um ou mais deles. Mas já existe tecnologia para a construção de soluções que tratam estas questões. Vou falar de algumas das quais não falei nos artigos anteriores.
Eu, a torcida do glorioso Grêmio e todos os demais que o conhecem são fãs do Rafinha Bastos, que tem muitos de seus vídeos disponíveis no Youtube. A comédia do Rafinha é ácida, crítica, inteligente. Mas tente assistir a qualquer um dos vídeos dele sem som, como os surdos são obrigados a fazê-lo! Não seria legal ter um plugin que permitisse abrir um gadget, um desklet, ou qualquer outro tipo de janela que, em tempo real, traduzisse o que o Rafinha fala, em seus vídeos, para LIBRAS?
O projeto V-ART, desenvolvido no Innovation Center UFRGS/Microsoft, trata de alguns aspectos desta questão. Com as bibliotecas do V-ART é possível criar humanos virtuais, com articulações fisiologicamente corretas. Usando um programa desenvolvido para o V-ART, que é o Action Builder, já foi possível criar um humano que fala em LIBRAS, o Human LIBRAS. Para o reconhecimento da fala há vários projetos em andamento. Direcionando a saída de áudio do vídeo do Rafinha para um sistema de reconhecimento de fala, e daí para um arquivo XML que possa ser reconhecido pelo Human LIBRAS, tá pronta a solução!
Claro, as coisas não são tão simples assim. Esperar que um usuário seja obrigado a instalar as bibliotecas do V-ART, o Human LIBRAS, mais algum software de reconhecimento de fala e os integre com a saída de áudio de um vídeo do Youtube é destruir, para uma grande maioria, a acessibilidade da solução. As coisas precisam ser mais simples. Por isto, o Kao, do projeto V-ART, está fazendo uma pesquisa que permitirá que os humanos gerados pelo V-ART possam executar suas ações em um navegador web, através do Silverlight ou do Moonlight, plugins que permitem a exibição de animações sofisticadas diretamente no navegador. A idéia é que estas ações possam ser também exibidas em um gadget ou desklet (aquelas janelinhas no desktop que normalmente mostram fotos, calendários, notícias, previsão do tempo, etc).
O reconhecimento da fala e seu processamento por um humano virtual que a traduza, em tempo real, para LIBRAS são trabalhos que requerem um grande poder de processamento. Estas tarefas podem ser divididas para a execução paralela, entre vários computadores. Grupos de computadores que executam tarefas de forma paralela são conhecidos por clusters. Seria muito bom se todas as tarefas de reconhecimento de voz, tradução para o LIBRAS e a própria animação do humano virtual pudessem ser distribuídas entre vários clusters, sem a preocupação de saber qual sistema operacional roda cada um deles e nem do lugar aonde estão localizados. Aí entra outro projeto, desenvolvido no Innovation Center Unicamp/Microsoft, que é o Interop Router. Hoje o Interop Router fornece uma interface web para a submissão de tarefas em um conjunto de clusters mas, no futuro, fornecerá uma interface (API) para a submissão de programas para uma "nuvem" de clusters conectados a eles.
Mas não acaba por aqui. Queremos que nosso humano virtual, que traduz o que o Rafinha fala para LIBRAS, ainda reaja às piadas e, quando for o momento de rir, ele ria também. Também há projetos que tratam desta questão de emoções e afetividade, que hoje estão sendo aplicadas em ambientes virtuais de aprendizagem.
Falo com minhas filhas que moram em Porto Alegre e Brasília, com voz e imagem, via web, através de meu computador. Abro o meu celular da mesma forma que o Capitão Kirk abria seu comunicador para pedir ao Scotty que o teletransportasse. São coisas do futuro que tornaram-se corriqueiras em meu dia-a-dia. Ainda verei o tempo em que riremos do mouse e do teclado.
Esqueci de dizer, mas acho que isso já deve ser óbvio para meus leitores: todos os projetos citados aqui são de código aberto. E as equipes que os desenvolvem estão abertas a todo o tipo de colaboração. Quanto mais colaboração, mais rápido o futuro chegará.
Cesar Brod estará falando sobre este e outros assuntos no dia 13 de agosto, no Interop São Paulo
Cesar Brod usa Linux desde antes do kernel atingir a versão 1.0. Dissemina o uso (e usa) métodos ágeis antes deles ganharem esse nome. Ainda assim, não está extinto! Escritor, consultor, pai e avô, tem como seu princípio fundamental a liberdade ampla, total e irrestrita, em especial a do conhecimento.
Mais sobre o Cesar Brod: [ Linkedin ] | [ Twitter ] | [ Tumblr ].