Linguística computacional – o que é?

Começando esse post com um pouco de Wikipedia:

“A Linguística Computacional ou Processamento de língua natural (PLN, em inglês Natural Language Processing, sigla NLP) é um campo multidisciplinar que envolve a Inteligência Artificial, a Informática, a Estatística e a Linguística e que se utiliza de processos computacionais para manipulação da linguagem humana. Os linguistas computacionais almejam desenvolver, através de modelos lógico-formais ou estatísticos de línguas naturais, sistemas com capacidade de reconhecer e produzir informação apresentada em linguagem natural.”

Bom, no geral é bem isso mesmo. Mas, calma, a gente pode ir um pouco além!

Estudar a linguagem humana é uma empreitada e tanto. Uma consequência da complexidade dessa empreitada é a miríade de abordagens diferentes que temos na linguística: você pode explicar fatos da língua olhando para a sociedade, para o indivíduo, para a relação entre indivíduo e sociedade ou para a espécie do indivíduo (entre outras visões). Todas essas abordagens têm razões, objetivos, sucessos e, também, problemas próprios.

O processamento de linguagem natural é fruto do encontro de inovações tecnológicas (grandes quantidades de dados de língua disponíveis, associadas ao processamento cada vez mais barato e poderoso) com questionamentos (como funciona a língua?) e possibilidades (podemos construir algo que entenda língua?) que já existiam.

Cabe ao linguista computacional fazer essa ponte.

Essa ligação passa justamente por modelar a língua e por, a partir desses modelos, desenvolver aplicações e tecnologias.

As aplicações são muitas, e com certeza você topa com elas diariamente. Tradução automática, correção automática de erros de digitação, pesquisa de documentos na internet, reconhecimento e síntese de voz… A lista é longa, e justifica o destaque que a área tem recebido nos últimos anos.

objavljen-program-ovogodisnjebabel-fish-konferencije-valicon-knowledge-club
Babel Fish – Tradutor automático universal: um sonho antigo!

Os linguistas computacionais nem sempre são linguistas. Na verdade, atualmente grande parte dos pesquisadores da área são cientistas da computação. Só mais recentemente que apareceram alguns esforços por parte dos linguistas de tentar participar das discussões.

Por mais interessante que seja, a composição histórica do campo é assunto para outro post.

A linguística computacional é uma área científica com aplicações amplas e variadas. As disciplinas envolvidas são uma mostra de como essa é uma vertente que ainda tem muita coisa pra ser explorada. No próximo post, vou indicar alguns materiais bacanas para linguistas, programadores e leigos começarem a se divertir com esse universo.

Até lá!

 

Publicidade

Olá, NP!

Bem-vindos ao meu blog!

Meu nome é Bruno Guide, eu sou um linguista formado pela USP e atualmente faço mestrado por lá mesmo, na área de Linguística Computacional.

Passei os últimos anos da minha vida estudando coisas bem específicas, e percebi que não existem muitas iniciativas de falar sobre elas para quem não quer também gastar anos estudando. Assim, decidi que poderia tentar fazer algo a respeito.

Quero falar um pouco sobre linguística, programação, lógica, inteligência artificial, estatística, ciência e pesquisa. É muito , mas eu tenho certeza de que o esforço é válido.

Sintaxe à vontade! (trocadilhos são um mal dos linguistas, peço perdão)