O grande modelo de linguagem (LLM) português Amália, que tem por trás a mesma tecnologia do ChatGPT, tem "previsto um investimento de 5,5 milhões de euros", anunciou esta sexta-feira o Ministério da Juventude e Modernização.

"Esta iniciativa tem previsto um investimento de 5,5 milhões de euros e um calendário de trabalho e desenvolvimento de 18 meses, do qual resultará uma primeira versão multimodal do Amália", lê-se no comunicado.

A este montante "acresce o vasto investimento já realizado em infraestrutura de computação, projetos de desenvolvimento e recursos humanos especializados que contribuirão em grande medida para o desenvolvimento do LLM", sendo que "o financiamento necessário à concretização do LLM português é assegurado no âmbito do Plano de Recuperação e Resiliência (PRR) e será desenvolvido inteiramente por entidades públicas", adianta o ministério.

"O financiamento do projeto estará exclusivamente destinado às entidades públicas envolvidas no desenvolvimento do Amália".

Na sequência do anúncio do primeiro-ministro sobre o lançamento do primeiro modelo de linguagem em grande escala de língua portuguesa de Portugal, em 11 de novembro, realizou-se esta sexta-feira uma reunião interministerial entre os dois ministros que coordenam a iniciativa -- a ministra da Juventude e Modernização e o ministro da Educação, Ciência e Inovação.

"É uma prioridade do Governo português o desenvolvimento e lançamento do primeiro LLM de língua portuguesa de Portugal, o Amália, 'Assistente Multimodal Automático de Linguagem com Inteligência Artificial'", uma iniciativa que "é a primeira divulgada no âmbito da Agenda Nacional de Inteligência Artificial que será apresentada de forma consolidada no primeiro trimestre de 2025".

Ao longo de ano e meio (18 meses), "serão disponibilizadas diversas versões do Amália à medida que forem desenvolvidas novas funcionalidades", refere. Assim, no final de março será disponibilizada a versão beta do Amália, no terceiro trimestre de 2025 uma versão base e no segundo trimestre de 2026 será disponibilizado um Amália versão multimodal.

"Numa fase inicial, o Amália será criado através da conjugação dos esforços realizados no desenvolvimento do EuroLLM, do GlórIA e do v-Glória, será capaz de diferenciar as variantes da língua portuguesa e será treinado com dados do Arquivo.pt previamente curados".

Esta versão beta do Amália conseguirá receber e interpretar instruções em formato de texto e responder com base no conhecimento adquirido, também em texto escrito em português de Portugal, adianta.

"Até ao final do terceiro trimestre de 2025, serão curados novos dados sobre a língua, a cultura e história de Portugal. Estes dados serão provenientes de fontes como o Arquivo.pt, e serão utilizados para treinar o Amália na sua versão base. Só nesta versão será possível gerar respostas fiáveis e precisas sobre estas temáticas, bem como responder a questões com total segurança e sem risco para o utilizador", refere.

Nesta altura, o Amália "já poderá ser integrado noutras aplicações externas e utilizar dados dessas fontes para gerar respostas de texto".

O ministério da Juventude e Modernização salienta que "todas as versões desenvolvidas serão disponibilizadas de forma gratuita e em 'open source', para que seja utilizado por todos, incluindo Academia, centros de investigação, entidades públicas, empresas e cidadãos".

Além das versões do LLM, "todos os dados que suportam o treino serão disponibilizados em dados abertos, criando assim uma infraestrutura nacional de Inteligência Artificial que potencia o ecossistema de inovação da inteligência artificial em Portugal. O LLM português poderá ser aplicado a diversos domínios de atividade, sendo necessário afiná-lo e treiná-lo com dados específicos dos setores de atuação, como educação, saúde, serviços públicos", entre outros, prossegue.

No final dos 18 meses do primeiro projeto de desenvolvimento, a versão multimodal do Amália "já será capaz de interpretar diversos formatos de dados", como texto, imagem e vídeo.

"Esta versão final do LLM será diferenciadora na interpretação e geração de texto de língua portuguesa, no conhecimento que tem da literatura, cultura e história de Portugal. No entanto, o objetivo deste LLM não é de responder a perguntas genéricas em que o foco é a realização de raciocínios ou cálculos complexos, havendo outros LLM no mercado com bom desempenho nessas tarefas", aponta.

O Amália estará disponível "para todos de forma aberta e gratuita, para que possam utilizá-lo para concretizar os seus projetos".

Nos últimos anos tem havido iniciativas em vários países de desenvolver LLM próprios, proficientes nas línguas dos países envolvidos, nomeadamente o Alia, que fala castelhano, catalão, galego e basco, e o Viking 7B, que fala dinamarquês, finlandês, norueguês, islandês e sueco, entre outros exemplos, aponta o Governo.