Poder numa concha
Primeiro estranha-se, depois entranha-se: o Windows PowerShell entrou discretamente no MLDC pelas portas da administração, mas rapidamente tomou um forte lugar noutras tarefas. E por direito próprio.
A primeira aplicação do Windows PowerShell foi para a razão principal pela qual foi criado. Entrou ao serviço para automatizar tarefas de administração, e rapidamente comprovou as suas prometidas valências neste domínio. A sua linguagem de scripting permitiu a automatização de instalações diferenciadas de máquinas virtuais (sem o recurso a aplicações que exigem uma complexa infra-estrutura de administração), e a configuração de servidores Exchange usando os commandlets (cmdlets – extensões à linha de comandos tradicional) para PowerShell. Neste projecto, foi também comprovada a integração entre PowerShell e a .NET Framework: foram criados novos cmdlets para satisfazer necessidades específicas, e uma interface gráfica para interagir com os scripts previamente criados.
A utilização de PowerShell foi também fomentada nos projectos relacionados com o desenvolvimento de sistemas TTS. Para além das típicas aplicações (correr várias ferramentas em série, organizar e validar ficheiros, etc.), o PowerShell foi também usado para preparação, processamento, e validação de grandes volumes de dados. E quando essa validação pedia o controlo por parte de um humano, criou-se uma interface gráfica inline no script, para tornar a tarefa mais robusta ao erro.
À medida que os casos de sucesso foram aparecendo nos projectos, o PowerShell foi aproveitado para melhorar os recursos e metodologias de trabalho. Hoje, é uma forte presença em tarefas internas de administração. Recentemente, foi criado um script para notificação (por email) de conclusão de tarefas longas: um pequeno brinquedo, mas muito útil.
Por estes motivos, ao PowerShell, a equipa MLDC diz: “Entre senhor crustáceo. Puxe uma cadeira, sente-se entre nós. E seja bem-vindo!”.
Posted by: Francisco Pires
Começaram as gravações para o novo TTS em Dinamarquês da Microsoft
Depois de um processo rigoroso de selecção de vozes, o MLDC foi a Copenhaga no início de Novembro para dar início às gravações da voz dinamarquesa que será usada no primeiro TTS em dinamarquês da Microsoft.

Em baixo, foto da esquerda: Jeppe Beck, o nosso linguista dinamarquês, Henrik Storland, engenheiro de som e Vibeke Dueholm, a locutora dinamarquesa. Na foto da direita: a locutora dinamarquesa e eu.


Posted by: Daniela Braga
Começaram as gravações para o novo TTS em Catalão da Microsoft
Na continuação do projecto de desenvolvimento de sintetizadores em Português Europeu e em Português do Brasil, actualmente em fase final de teste e refinamento, o MLDC está a desenvolver um sistema de conversão Texto-Fala (Text-to-Speech) em Catalão .
As gravações começaram no início de Novembro de 2008, depois de um rigoroso processo de selecção das locutoras. A voz catalã escolhida pertence a Marta Ullod. Fomos visitar o estúdio de Barcelona e acompanhar o início das gravações, que já estão em curso.

Primeira foto: da esquerda para a direita, Marta Ullod, a locutora catalã, Silvia Rustullet, a nossa linguista catalã, Beatriz Escudero, a directora do estúdio em Barcelona e Cláudia Gaset, a engenheira de som. Segunda foto: Eu e a estrela do estúdio, a Lola, que nos deu uma ajuda preciosa neste início das gravações:).
Posted by: Daniela Braga
MLDC participa na organização do próximo DSAI 2009 (International Conference on Software Development for Enhancing Accessibility and Fighting Info-exclusion)
Após o sucesso das edições de 2006 e 2007, o DSAI (International Conference on Software Development for Enhancing Accessibility and Fighting Info-exclusion (DSAI 2009)) vai ter nova edição em 2009, desta vez realizada nas instalações da Microsoft Portugal, em Porto Salvo, no Taguspark. O objectivo principal deste evento no próximo ano é contribuir para a iniciativa europeia da inclusão de pessoas com necessidades especiais na sociedade de informação e comunicação e promover a acessibilidade às novas tecnologias. Mais informações sobre o programa e chamada para trabalhos em:http://dsai2009.utad.pt.
Posted by: Daniela Braga
MLDC traz investigador convidado ao PROPOR 2008
O MLDC convidou Chris Quirk, um dos melhores investigadores do Grupo de Linguagem Natural da Microsoft Research em Redmond, Seattle, sede da Microsoft Corporation, para apresentar uma das duas palestras plenárias do PROPOR 2008 subordinada ao tema: "Scaling Statistical Machine Translation to the Web". Chris Quirk trabalha em tradução automática, tema sobre o qual versou, mostrando o estado da arte da área e exemplos do trabalho desenvolvido pela Microsoft na área da tradução automática, nomeadamente o Microsoft Translator, serviço que permite traduzir páginas web e que está disponível em várias línguas, entre as quais o português.
Posted by: Daniela Braga
MLDC promoveu Sessão Especial no Propor 2008
O MLDC organizou uma sessão especial no âmbito do PROPOR 2008, International Conference on Computacional Processing of Portuguese sobre Aplicações de tecnologias de fala e de linguagem em português. O evento realizou-se no Grande Hotel da Curia, no dia 10 de Setembro, no último dia da conferência, e foi divido em duas sessões: uma primeira parte em que os autores apresentaram demonstrações e em que era possível testar as aplicações e uma segunda parte em que se fizeram apresentações. Esta sessão realizou-se na esteira da I Microsoft Workshop on Speech Technologies, que teve lugar a 2 de Maio de 2007, em Porto Salvo, nas instalações da Microsoft. Foi assim nosso objectivo estreitar os laços entre a academia e a indústria, promovendo a discussão científica e tecnológica, abrindo caminho para futuras colaborações e permitindo a divulgação de novos trabalhos e aplicações para o português nas áreas das tecnologias de fala e de texto. As actas do evento, programa e outras informações estão disponíveis aqui. Os nossos agradecimentos à organização do PROPOR, em especial ao Prof. António Teixeira, pela oportunidade que nos deu de organizar este envento no âmbito do PROPOR.
Posted by: Daniela Braga
MLDC na RTP 1 - PORTUGUESES TRABALHAM NO RECONHECIMENTO DE VOZ
A RTP 1 veio ao MLDC:
http://ww1.rtp.pt/noticias/index.php?headline=98&visual=25&article=364223&tema=1&pagina=2&palavra=&ver=1
Posted by: Daniela Braga
CAMPANHA NÚMERO 2 DE RECOLHA DE FALA TELEFÓNICA PELO MLDC E SDI MEDIA
Esta campanha é muito semelhante à campanha número 1 descrita no post Quid novi? (#24). A diferença é que nesta todos os participantes que completem com sucesso uma chamada ganham 10 EUROS, podendo fazer no máximo duas chamadas telefónicas. Pode ainda ganhar 2 EUROS por cada amigo que indicar.
Para participar navegue até ao site:
http://falarcompensa.com
...e seguir as instruções.
Para mais informações sobre esta campanha, veja-se a notícia publicada no Diário Económico publicada a 23-05-2008:

(disponível em: http://diarioeconomico.sapo.pt/edicion/diarioeconomico/edicion_impresa/empresas/pt/desarrollo/1126599.html)
Posted by: António Calado
CAMPANHA NÚMERO 1 DE RECOLHA DE FALA TELEFÓNICA PELO MLDC
O MLDC (Microsoft Language Development Center) encontra-se neste momento a recolher fala telefónica em Português Europeu para desenvolvimento de tecnologias de voz. A fala é um recurso essencial para a criação e desenvolvimento de motores de reconhecimento de fala para Português Europeu, sendo crucial que esta seja o mais diversificada possível, ou seja, pretende-se recolher fala com vários sotaques, idades e ambientes acústicos.
De modo a encorajar a participação, o MLDC está a oferecer 10 Xbox 360 aos participantes!
Para participar, apenas necessita de navegar até ao site:
http://www.sip-campaign.net/pt-pt
e seguir as instruções na página.
Obrigado!
Posted by: António Calado
Applications of Portuguese Speech and Language Technologies
Propor 2008 Special Session, September 10, 2008, Curia, Portugal
Promoted by MLDC - Microsoft Language Development Center
MLDC - Microsoft Language Development Center, the first Microsoft Development Center outside of Redmond (USA) dedicated to key Speech and Natural Language developments, is pleased to announce that will promote a Propor 2008 Special Session on Applications of Portuguese Speech and Language Technologies.
It is our goal to continue our action of building bridges between Industry and Academia, gathering synergies of both communities in order to enhance Speech and Natural language technology in Portugal and Brazil.
Therefore, we would like to encourage both university and industry communities from Portugal, Brazil and any other country working on the Portuguese Natural Language Processing and Speech Technology to submit proposals reporting their most recent products, systems, resources or tools for Portuguese.
Important dates:
June 30 – deadline for abstracts submission
July 15 – authors’ notification
July 25 – registration
September 10 – Special Session
Submission of proposals:
The proposals must be in English. PROPOR Chairs and a MLDC representative will review all proposals. The accepted proposals will be published by MLDC in a Microsoft website. The authors are encouraged to contribute to the proceedings with their presentations, tools, demos, etc.
Two formats are allowed: presentations and demos.
Guidelines for presentations:
-
Non blinded abstract, in English, at least 4 pages (2.5 cm margins, single space, Times 12 pt);
-
The abstract should contain description of the work, results and conclusions;
-
Presentations can have as subject a recent version of a product, system, resource or tool that cannot be tried or tested by the participants during the special session.
Guidelines for demos:
-
Non blinded abstract, in English, at least 1 page (2.5 cm margins, single space, Times 12 pt)
-
Products, systems, tools are examples of demos;
-
Demos are defined as allowing participants to try and test them during their presentation;
-
Abstracts should contain a brief description of the work, what is going to be demonstrated and how.
The proposals should be submitted to: chair@propor2008.org. Please use as subject “Special Session”.
For any question regarding this special session, please contact: Daniela Braga (i-dbraga@microsoft.com)
Agenda Telefónica do Techdays2008
Além do Robot Lego Mindstorm controlado por fala, de que o Mário falou no último post, na nossa próxima sessão do Techdays vamos também mostrar a Agenda Telefónica do Techdays2008!
Este sistema é uma aplicação IVR que permite aos utilizadores ligarem para um número de telefone e poderem obter informações sobre as várias sessões que vão decorrer no evento Techdays2008, podendo procurar por uma sessão em particular através do orador ou do código da sessão, usando comandos de fala, totalmente em Português. O sistema foi desenvolvido utilizando a plataforma Microsoft Office Communications Server 2007 Speech Server e tira partido da última tecnologia de reconhecimento e síntese de fala em Português disponibilizada pelo MLDC. O nosso agradecimento ao Ricardo Portela, que tem estado a trabalhar connosco no desenvolvimento deste sistema e que está a fazer um excelente trabalho!
Mais informações:
http://www.microsoft.com/portugal/mldc/news/feb08_Techdays2008.mspx
http://www.techdays.pt/
Posted by: Pedro Silva
Lego MindStorm controlado por fala usando o Microsoft Robotics Studio
A plataforma Microsoft Robotics Studio é um ambiente de desenvolvimento que permite criar facilmente aplicações para uma grande variedade de plataformas (robôs).
De entre os robôs suportados por esta plataforma encontramos o Lego MindStorm. Este robô inclui alguns sensores que lhe conferem algumas capacidades e funcionalidades muito interessantes.
Há uns tempos atrás surgiu a ideia de metermos isto tudo no mesmo caldeirão e juntar um ingrediente muito especial... o reconhecimento de fala!
Mexeu-se tudo muito bem e ficou uma aplicação muito gira.
Aqui está um pequeno exemplo do que se poderá ver na nossa sessão do TechDays!
Posted by: Mário Henriques
Na conferência Techdays 2008 (http://www.techdays.pt) da Microsoft, o MLDC terá a sua participação através de uma sessão relacionada com desenvolvimento de aplicações Speech.

Título e data provisórios:
“Are you talking to me?" – Como integrar e utilizar tecnologia de Fala para o desenvolvimento de aplicações desktop e IVR - DEV04
http://www.techdays.pt/session/2008/DEV04.aspx
Dia 13 Sala A5 17:00
Abstract:
A área crescente de tecnologia de fala, tanto ao nível do Reconhecimento como da Síntese, tem vindo a ganhar um enorme interesse e popularidade nos últimos anos, tanto no mercado empresarial como no mercado doméstico. À medida que a tecnologia evolui, têm vindo a surgir muitas aplicações cliente desktop, como por exemplo a leitura automática de documentos e emails usando a síntese de fala, bem como sistemas telefónicos IVR que beneficiam de reconhecimento de fala cada vez mais robusto e síntese de texto para fala com cada vez mais qualidade. Recentemente a Microsoft lançou o “Windows Speech Recognition” no Windows Vista, que possibilita aos utilizadores a interacção com o seu computador usando apenas a fala e o Microsoft Office Communications Server 2007 Speech Server, uma plataforma completa de IVR.
Esta sessão vai cobrir a .NET Framework Speech API e o OCS 2007 Speech Server para o desenvolvimento de aplicações Windows desktop e aplicações telefónicas IVR respectivamente, tirando partido da tecnologia de fala. Iremos utilizar Reconhecimento e Síntese de fala em Português Europeu, demonstrando os mais recentes resultados do Microsoft Language Development Center (www.microsoft.com/portugal/mldc). Serão apresentados vários exemplos de aplicações, demonstrações e desenvolvimento hands-on, incluindo a facilidade de interacção com um Robot Lego MindStorm usando tecnologia de fala através da plataforma Microsoft Robotics Studio 1.5, uma aplicação do tipo portal-de-notícias e a Agenda Telefónica do TechDays 2008.
Orador(es)
Pedro Silva Santos, Microsoft
Pedro é Lead Software Development Engineer no Microsoft Language Development Center (MLDC). Juntou-se à Microsoft em 2006 e tem vindo a especializar-se em desenvolvimento de software usando as novas tecnologias de Speech da Microsoft. Actualmente, é responsável pelas actividades de desenvolvimento de software no Centro e pela disponibilização da tecnologia de fala em Português desenvolvida no MLDC através do Programa Beta. Tem um Mestrado e Licenciatura em Engenharia de Telecomunicações e Informática atribuídos pelo Instituto Superior de Ciências do Trabalho e da Empresa (ISCTE), onde também foi professor assistente de Computação Gráfica.
Mário Vaz Henriques, Microsoft
Mário Vaz Henriques juntou-se à Microsoft em Setembro de 2006, mais precisamente ao Microsoft Language Development Center (MLDC) onde assumiu funções de Software Development Engineer. Tem um Mestrado e Licenciatura em Engenharia Informática atribuídos pela Faculdade de Ciências da Universidade de Lisboa.
Apareça!
Posted by: Daniela Braga
O MLDC está a crescer. Nascido em Novembro de 2005, conta agora com 13 membros. Por ordem de chegada ao MLDC, faço as honras das apresentações:
Nome: Miguel Sales Dias
Idade: Não digo
Equipa: Todas elas
Posição: O tipo que está ali para chatear
Projectos em que está envolvido: Demais
Áreas de trabalho/interesse: Tecnologia, Ciência, Política Científica, História
Hobbies: Filhos, Desporto (sky de neve, corrida, natação, ténis), Viagens nem vê-las, Selos, Moedas, e outras coisas piores
E-mail: midias@microsoft.com
Nome: António Calado Lopes
Idade: 30
Equipa: SIP (PM/Test), Modelling (Developer)
Posição: Lead Software Test Engineer
Projectos em que está envolvido: SIP – Speech International Program 1.0, SIP – Speech International Program 2.0, Modelling – Treino e criação de modelos acústicos
Áreas de trabalho/interesse: Tecnologia, Viagens, Astronomia
Hobbies: Música, Literatura, Pintura, Arquitectura, Viagens
E-mail: i-antonc@microsoft.com
Nome: Pedro Silva Santos
Idade: 28
Equipa: Development
Posição: Lead Software Development Engineer
Projectos em que está envolvido: SIP, TTS, Portuguese Speech technology (Beta Program) for Windows client + OCS 2007 Speech Server + Exchange Server 2007, MediaCenter, Micarray
Áreas de trabalho/interesse: ASR, TTS, IVR; C#, C++; Computação Gráfica, Realidade Aumentada, Interacção Pessoa Máquina; Game development; Software design, architecture and development
Hobbies: Guitarra, Canto, Música, Cinema, Tecnologia
E-mail: i-pedros@microsoft.com
Nome: Mário Vaz Henriques
Idade: 24
Equipa: Desenvolvimento/Teste
Posição: Engenheiro de Software/Developer
Áreas de trabalho/interesse: Reconhecimento e Síntese de Fala; Redes de Computadores; Robótica; Mecânica
Projectos em que está envolvido: Windows Vista Media Center Controlado por Fala; Speech International Program 1 e 2; Integração do Microphone Array no Motor de Reconhecimento; Speech Ecosystem
Hobbies: Aquariofilia; Futebol; Cinema
E-mail: t-marioh@microsoft.com
Nome: Carla Simões
Idade: 25
Equipa: Modelling (Developer), TTS team (Support), Content team (Support)
Posição (dentro de cada equipa): Software Development Engineer
Projectos em que está envolvido: TTS – Text to Speech Synthesis, Modelling – Treino e criação de modelos acústicos, Content – compilação de léxicos
Áreas de trabalho/interesse: Novas tecnologias, Viagens, Dança
Hobbies: Dança, Natação, Fotografia, Literatura, Cinema.
E-mail: t-carlas@microsoft.com
Nome: Daniela Braga
Idade: 29
Equipa: MLDC TTS team
Posição: Program Manager
Áreas de trabalho/interesse: Síntese e Reconhecimento de Fala; Processamento da Linguagem Natural, Fonética, Fonologia, Prosódia, Linguística Geral
Projectos em que está envolvido: TTS – Text to Speech Synthesis, Recursos Linguísticos para tecnologias de voz (Léxicos em Português Europeu, Português do Brasil e Catalão, Normalização de Texto), Speech Ecosystem
Hobbies: Windsurf, Natação, Cinema, Literatura, Teatro
E-mail: i-dbraga@microsoft.com
Nome: João Freitas
Idade: 24
Equipa: SIP (Dev/Test)
Posição (dentro de cada equipa): Engenheiro de Software
Projectos em que está envolvido: SIP – Speech International Program 1.0, SIP – Speech International Program 2.0
Áreas de trabalho/interesse: Tecnologia, Ciências, Literatura
Hobbies: Cinema, Futebol, Natação, Jogos Online
E-mail: t-joaof@microsoft.com
Nome: Manuel Ribeiro
Idade: 23
Equipa: MLDC TTS team
Posição (dentro de cada equipa): Linguista de Português Europeu
Projectos em que está envolvido: TTS – Text to Speech Synthesis, SIP – Speech International Program
Áreas de trabalho/interesse: Linguística, Cinema, Literatura
Hobbies: Música, Literatura, Cinema, Fotografia
E-mail: t-manrib@microsoft.com
Nome: João Nogueira
Idade: 25
Equipa: MLDC TTS team
Posição (dentro de cada equipa): Developer
Áreas de trabalho/interesse: Síntese de fala, segurança, jogos
Hobbies: Futebol, música, jogos, gamedev, viagens
E-mail: i-jonogu@microsoft.com
Nome: Cirineu Cecote Stein
Idade: 37
Equipa: MLDC TTS team
Posição (dentro de cada equipa): linguista brasileiro
Projectos em que está envolvido: TTS
Áreas de trabalho/interesse: Fonética e fonologia do português; prosódia; dialectologia
Hobbies: Fotografia
E-mail: i-cirins@microsoft.com, cirineustein@uol.com.br
Nome: Sílvia Rustullet Suñé
Idade: 23
Posição: Linguista catalão
Equipa: MLDC TTS team
Áreas de trabalho/interesse: Reconocimiento e Síntese de Fala, Sintaxe, Psicolingüística, Neologia
Projectos em que está envolvido: Léxico do Catalão para Síntese e Reconhecimento
Hobbies: Viajar, Música, Cinema
E-mail: i-sirust@microsoft.com
Nome: Raphael Nunes da Motta
Idade: 22
Equipa: SIP (PM/Test),
Posição: Engenheiro de Software/Developer Brasileiro (estagiário)
Projectos em que está envolvido: Speech International Program 2
Áreas de trabalho/interesse: Reconhecimento e Síntese de Fala, Processamento de Imagens, Sistemas Digitais
Hobbies: Viagens, Futebol
E-mail: v-raphmo@microsoft.com
Nome: Adriana Azevedo
Idade: 28
Equipa: MLDC TTS team
Posição (dentro de cada equipa): Portuguese linguist (estagiária)
Projectos em que está envolvido: TTS – Text to Speech Synthesis
Áreas de trabalho/interesse: linguística, novas tecnologias
Hobbies: dança, pintura
E-mail: v-adria@microsoft.com
Posted by: Daniela Braga
Balanço da Workshop em "Speech Technology for Accessibility", DSAI 2007, UTAD, Vila Real, 9 de Novembro
Como mais vale tarde do que nunca, finalmente consigo deixar este post há muito tempo prometido. Vila Real recebeu-nos outonal e solarenga no dia 8 de Novembro passado. O DSAI teve início no dia mundial da usabilidade e abriu com a Workshop I-Teach, organizada pelos nossos colegas João Abreu e Vítor Santos. É o segundo ano consecutivo que a Microsoft, através do meu querido colega Vitor Santos, apoia o DSAI e esta aliança já deu os seus frutos: o DSAI passou a evento internacional, recebendo oradores e autores estrangeiros e o seu sucesso perspectiva já não só a sua continuidade, enquanto evento periódico de qualidade científica, como a sua expansão.
A realização da segunda edição do DSAI na UTAD explica-se bem pela qualidade do trabalho e experiência do seu corpo docente na área da acessibilidade. Os nossos parabéns à organização, e em especial ao seu chair, o Prof. João Barroso, por tornar possível um evento nesta área em Portugal pela segunda vez consecutiva.
Em nome do MLDC, tenho também de agradecer à organização a oportunidade que nos deu de organizar a workshop em "Speech Technology for Accessibility", em que pudemos não só mostrar o actual estado de desenvolvimento da tecnologia de fala no MLDC, como também trazer nomes com grande experiência no desenvolvimento de soluções para melhorar a acessibilidade. Foi o caso de Carla Faria (Ajudas.com, vale a pena visitar: http://www.ajudas.com/), vencedora de vários prémios de inovação com software para crianças com necessidades especiais, de Aquilino Rodrigues, director da Electrosertec (http://www.electrosertec.pt/), a maior empresa em Portugal especializada em soluções para deficientes visuais, e da APEDV - Associação Promotora de Emprego para deficientes Visuais (http://www.apedv.org.pt/). Pudemos ainda mostrar novas aplicações de acessibilidade, pelo Prof. Norberto Pires (http://robotics.dem.uc.pt/norberto/), nosso parceiro na aplicação de tecnologia de voz à Robótica Industrial e pelo Rui Maia (INOV), que nos trouxe estado da arte das soluções para acessibilidade no INOV. O nosso muito obrigado a todos os intervenientes. As apresentações vão estar disponíveis no website do DSAI.

Posted by: Daniela Braga