quinta-feira, 15 de julho de 2010

E se um avatar fizer o diagnóstico do seu filho? Não é ficção, é realidade



Os avatares que auxiliam os médicos compreendem a fala, identificam situações e motivos pediátricos e conseguem fazer o diagnóstico inicial de uma doença infantil

"Olá, obrigado por terem vindo", diz a auxiliar médica, cumprimentando uma mãe e o seu filho de cinco anos. "Estão aqui pela criança ou pela senhora?"

O rapaz, responde a mãe. Ele tem diarreia.

A auxiliar questiona a mãe a propósito de outros sintomas, incluindo febre ("baixa") e dor abdominal ("Ele não se tem queixado").

A mãe vira-se para o rapaz.

"Tem-te doído a barriga?"

"Sim", responde ele.

Após mais algumas questões, a auxiliar mostra-se "não muito preocupada neste momento". Ela marca uma consulta com um médico para poucos dias mais tarde. A mãe leva o filho para fora da sala, segurando-o pela mão. Mas continua a olhar para trás, para a assistente, fascinada, como se tivesse relutância em abandonar a sala.

Talvez isto tenha a ver com o facto de a auxiliar ser a imagem desmaterializada da cara de uma mulher, a preto e branco, num ecrã de computador - um avatar básico. As suas palavras de compaixão não têm ritmo nem variação e são mecânicas. Mas ela tem aquilo que é necessário - a capacidade de compreender a fala, identificar situações e motivos pediátricos segundo regras simples - para efectuar um diagnóstico inicial de uma doença infantil e da sua gravidade. E para conquistar a confiança de um rapazinho.

Durante décadas, os cientistas informáticos têm procurado a inteligência artificial - o uso de computadores para simular o pensamento humano. Mas nos últimos anos tem sido alcançado um progresso rápido em máquinas que conseguem ouvir, falar, ver, raciocinar e aprender à sua maneira. A perspectiva, segundo os cientistas e economistas, é não só que a inteligência artificial vá alterar a maneira como humanos e máquinas comunicam e colaboram, mas também eliminar milhões de empregos, criar muitos outros e mudar a natureza do trabalho e das rotinas diárias.

A tecnologia da inteligência artificial que mais tem avançado no convencional é a compreensão do que os humanos estão a dizer por parte do computador. De um modo crescente, as pessoas falam com os seus telemóveis para encontrarem coisas, em vez de escreverem. Tanto os serviços de busca do Google como da Microsoft respondem agora a comandos de voz. Cada vez mais condutores pedem aos seus carros para fazer coisas, como encontrar moradas ou tocar música.

O número de médicos dos EUA que usam software de fala para gravar e transcrever registos de visitas de pacientes e tratamentos mais do que triplicou nos últimos três anos, sendo agora de 150 mil. O progresso é impressionante. Há alguns anos, o supra-espinhal (um músculo rotador do punho) foi traduzido como "peixe-banana". Hoje, o software transcreve de forma perfeita todos os tipos de terminologia médica, referem os médicos. Tem mais dificuldade com outras palavras e gramática, necessitando de mudanças de redacção em cerca de uma em quatro expressões, explicam os médicos.

Como tal, a perspectiva é incerta para muitos dos quatro milhões de trabalhadores estimados dos call centers dos EUA, ou para as 100 mil pessoas que se dedicam à transcrição médica no país, cujos empregos estavam já ameaçados pelo outsourcing no estrangeiro.

A ASSISTENTE DIGITAL "Olá, está à procura do Eric?", pergunta a recepcionista no exterior do gabinete de Eric Horvitz na Microsoft.

Esta assistente é um avatar, um gestor de tempo para trabalhadores de escritórios. Por trás da cara feminina no ecrã está um arsenal de tecnologia informática que inclui compreensão da fala, reconhecimento de imagem e aprendizagem de máquina. A assistente digital utiliza bases de dados que incluem o calendário de reuniões e compromissos do patrão dos últimos anos, assim como os seus padrões de trabalho. O seu software monitoriza as chamadas telefónicas em termos de duração, pessoa com quem falou, altura do dia e dia da semana. Também segue a localização dele e o uso do computador no que respeita a aplicações utilizadas - email, escrita de documentos, browser de internet - durante quanto tempo e a que altura do dia.

Quando um colega pergunta quando deve terminar a reunião ou a chamada telefónica de Horvitz, o avatar analisa a informação em busca de padrões.

O avatar tem uma base de dados de todos os colegas de trabalho e relações do patrão, desde membros da equipa de investigação a gestores de topo, e pode agendar reuniões. Horvitz deu ordens ao avatar sobre os tipos de reuniões que são mais ou menos passíveis de interrupção. Como parte do projecto, os investigadores planeiam programar o avatar para estabelecer "conversa fiada relacionada com trabalho" com os colegas que estão à espera.

Os computadores com inteligência artificial podem ser considerados o equivalente em máquina do autista sábio. Eles podem ser extremamente bons em aptidões que desafiam os humanos mais inteligentes, jogar xadrez como um grande mestre ou responder a questões do "Jeopardy!" como um campeão. Porém, essas aptidões estão em domínios limitados do conhecimento. O que é muito mais difícil para um computador são as aptidões do senso comum, como compreender o contexto da fala e das situações sociais quando fala - revezar-se numa conversa, por exemplo.

Os projectos da Microsoft são apenas iniciativas de investigação, mas indicam para onde as coisas caminham. E conforme o reconhecimento da fala e outras tecnologias de inteligência artificial assumem a responsabilidade por mais tarefas, existem preocupações acerca do impacto social da tecnologia e muito pouca atenção prestada às suas limitações.

APARELHOS MAIS INTELIGENTES "Pretendo uma reserva para duas pessoas para amanhã às 20h00, num restaurante romântico a uma distância para onde possa ir a pé."

Este pedido falado parece suficientemente simples, mas para um computador responder de forma inteligente é necessário um bailado entre mais de uma dúzia de tecnologias.

Um exército de empresas - AT&T, Microsoft, Google e diversas companhias novas - está a investir em serviços que fazem alusão ao conceito de máquinas que podem agir de acordo com comandos falados. Elas vão bem mais além do que a busca na Internet através da voz.

Talvez a mais avançada entre elas seja a Siri, uma empresa de Silicon Valley que oferece uma "assistente pessoal virtual", um conjunto de programas de software que consegue ouvir um pedido, encontrar informação e proceder à acção.

Neste caso, a Siri, apresentada como uma aplicação para iPhone, envia o pedido falado de um restaurante romântico sob a forma de um ficheiro áudio para os computadores operados pela Nuance Communications, a maior empresa de reconhecimento de fala, que o converte em texto. O texto é depois devolvido aos computadores da Siri, que efectuam suposições instruídas acerca do significado.

A Apple está tão impressionada que comprou a Siri em Abril, numa transacção privada no valor de mais de 200 milhões de dólares (162 milhões de euros).

Também nos carros, os sistemas de reconhecimento de fala têm melhorado enormemente. Em apenas três anos, a Ford Motor Company, utilizando o software Nuance, aumentou o número de comandos de fala reconhecidos pelos seus veículos de 100 para dez mil palavras e expressões.

Sistemas como o Sync da Ford estão a tornar-se opções populares nos automóveis novos. Eles são também vistos por alguns especialistas em segurança como uma defesa, embora imperfeita, contra o conjunto de pequenos ecrãs distractivos de aparelhos de GPS, smartphones e afins.

No final deste Verão, um novo modelo do Ford Edge irá reconhecer moradas completas, incluindo cidade e estado, falados numa única expressão, e responder com a sugestão de direcções a seguir viragem a viragem.

PARA A SALVAÇÃO DO CLIENTE "Por favor seleccione um dos seguintes produtos do nosso menu", costumava dizer o gigante das electrónicas Panasonic às pessoas que ligavam a pedir ajuda com produtos desde ferramentas mecânicas a televisores plasma.

Não estava a funcionar. Os clientes ao telefone demoravam em média 21, 22 minutos apenas para navegar com grande esforço pelo menu. E 40% deles desligavam frustrados.

"Estávamos a afogar-nos em chamadas", recorda Donald Szczepaniak, vice--presidente do serviço de clientes. Em 2005, a Panasonic pediu a ajuda dos AT&T Labs.

Os investigadores da AT&T trabalharam com milhares de horas de gravações de chamadas para o centro da Panasonic, em Chesapeake, Virgínia, para construir modelos estatísticos de palavras e expressões que os clientes usavam para descrever os produtos e problemas e criar uma base de dados que é actualizada constantemente.

O objectivo do sistema é identificar palavras-chave - entre as expressões e frases - para que um assistente automático possa responder de forma inteligente.

Problemas simples - como registo de produtos ou onde levar um produto para reparação - podem ser resolvidos unicamente no sistema automático. Essa tecnologia tem melhorado, mas os clientes que telefonam também ficaram mais à vontade a falar para o sistema. Um número surpreendente de pessoas desliga dizendo: "Obrigado."

Alguns clientes, sobretudo os mais jovens, também tornam as coisas mais fáceis para o computador, ao proferirem uma expressão-chave como "ajuda com o plasma", refere Szczepaniak. "Chamo-lhe a Googleização do cliente", afirma.

A resolução automática do problema pela tecnologia da fala tem permitido à Panasonic globalizar o seu serviço ao cliente, com perguntas sobre produtos mais antigos e mais simples a serem encaminhadas para os seus call centers nas Filipinas e na Jamaica. O centro da Virgínia centra-se agora nos produtos topo de gama da Panasonic, como televisores plasma e equipamentos de home cinema. E embora o número de funcionários esteja nos 200, como há cinco anos, os trabalhadores são agora mais especializados. Aqueles que ficaram foram reciclados com frequência.

O OUVINTE EFICIENTE "Esta chamada pode ser gravada por motivos de garantia de qualidade."

Mas num número cada vez maior de call centers do consumidor, balcões de apoio técnico e linhas de emergência de empresa, o ouvinte é um computador. Um que consegue reconhecer não apenas palavras mas também emoções - e escutar atentamente, à procura de tendências nas queixas do cliente.

Na indústria dos telefones, por exemplo, as empresas usam software de reconhecimento de fala para fornecer um aviso inicial sobre mudanças nos planos de chamadas de um concorrente. Ao detectar o uso frequente de nomes como AT&T e outros concessionários, o software pode alertar a empresa de que um rival baixou os preços, por exemplo, bastante mais rápido do que centenas de agentes de serviço ao cliente. Depois as empresas colocam os seus agentes de cliente a efectuar contra-ofertas às pessoas que ligam com o intuito de desligar o serviço.

Num fim-de-semana do ano passado, um software semelhante, usado pela Aetna, começou a reconhecer a expressão "dinheiro por ferro-velho" em centenas de telefonemas para os seus call centers. Descobriu-se que dezenas de milhares de compradores de automóveis, em resposta ao incentivo do governo, estavam a procurar orçamentos de seguros. A Aetna criou ofertas de seguros para esses clientes particulares e acrescentou trabalhadores para tratar do volume de serviço.

fonte: Jornal i

Sem comentários:

Enviar um comentário