Quando a divulgação não informa

Saiu agora um dossiê sobre inteligência artificial no portal da Super Interessante.

Era uma grande oportunidade de divulgar um tema de grande apelo sob um viés sério e científico. Infelizmente, não foi isso que essa primeira parte do dossiê mostrou.

É revoltante ler em um portal que pretende divulgar assuntos ligados à ciência uma mistura tão intensa entre o que é fato científico e ficção pura, sem que haja nenhuma preocupação com o tipo de impacto que esse tipo de coisa possa ter.

É inegável que exista um apelo muito grande da inteligência artificial na cultura popular:  vemos diversos filmes, livros e séries sobre o tema, e isso não é problema! Inclusive, considero diversas dessas histórias excelentes e, é claro, pensar nessas questões dentro da perspectiva fantástica que as ficções apresentam é uma atividade muito divertida.

Agora, é importante pensar também no papel da divulgação científica e lembrar que a inteligência artificial não é só ficção. Existem muitas pessoas que estudam esse tópico dos mais diversos pontos de vista e das mais diversas origens acadêmicas: filósofos, engenheiros, cientistas da computação, biólogos, linguistas…Esses estudos são sérios e revelam um panorama incrível que é tão atraente quanto o revelado pela ficção – com o bônus de ser real!

A grande questão é que a linguagem científica, ao se refinar ao longo do progresso de determinada área, vai se tornando cada vez menos acessível para o público geral.Daí a missão da divulgação científica: trazer a mensagem expressa no desenvolvimento científico de modo que o público geral a compreenda, mas se mantendo fiel às ideias trazidas pela comunidade científica.

154062807_science-communication_-istockphoto_thinkstock
Divulgação científica não é simples!

Essa é uma missão ingrata! Com frequência você corre o risco de perder público sendo mais rigoroso. Além disso, não tenha dúvidas de que algum técnico virá apontar qualquer detalhe perdido na sua divulgação.

Mas, o ponto importante aqui é: para se fazer divulgação científica, é fundamental ter rigor. Quando se fala de uma área tão presente no imaginário popular, é necessário ter o dobro de rigor.

Uma matéria curta sobre inteligência artificial tem que, no mínimo, tomar muito cuidado ao falar de determinados tópicos. A primeira parte dessa reportagem da Super traz uma perspectiva que:

1- Apresenta o futuro da IA como necessariamente alcançar a Singularidade (que é, no mínimo, forçar a barra)

2 – Não tem nenhum cuidado ao tratar a inteligência artificial como se fosse igual à inteligência humana, só que em robôs.

O primeiro ponto, pelo menos, é atribuído a um pesquisador (Ray Kurzweil).

Sobre o segundo ponto: como você fala de IA em geral sem falar de uma das grandes questões filosóficas da IA? Ainda mais quando a posição científica sobre a IA tende para o lado oposto ao que você defende?

É possível comparar a chamada inteligência artificial, criada por agente inteligentes em computadores com a inteligência humana, fruto da evolução biológica da espécie?

Veja o que o texto fala:

“Você está em outro nível de desenvolvimento cognitivo, lógico e filosófico. Você é um robô. Criado por robôs. Mas é como se fosse gente.”

“É como se uma pessoa tivesse, ao mesmo tempo, a genialidade de Einstein, Mozart, Marie Curie, Steve Jobs e Da Vinci. Só que ela é um computador.”

“Um robô francês chamado NAO passou na prova. Diante de perguntas simples, NAO foi capaz de raciocinar a respeito da sua própria existência – algo que, até outro dia, era exclusividade dos seres humanos.”

Apenas não! Não se faz o paralelo entre inteligência artificial e o que quer que ela alcance que se dê o nome de consciência com a consciência humana, forjada por milhões de anos de processo evolutivo biológico!!

Pelo menos não se faz isso sem apresentar as críticas (3 links apontando como essa comparação é complicada, TODOS encontrados na primeira página do google).

Além disso, a conclusão de uma matéria de divulgação científica não poderia ser mais descabida:

“Muito em breve, computadores vão tirar suas próprias conclusões, desenvolver uma ética peculiar, demonstrar uma inteligência superior inigualável e criar autossuficiência. Por que um mundo assim precisaria de humanos?”

Vender essa área como se fosse a grande responsável por criar um possível apocalipse é tremendamente irresponsável. Beira ao ludismo.

471027a-i1-0
Contra as máquinas e não contra os exploradores!

Vamos falar de realidade? O que é real sobre a inteligência artificial é que é uma área que tem criado produtos e mecanismos que afetam muito positivamente diversos aspectos da vida humana. Temos carros autônomos, algoritmos que indicam filmes e livros, assistentes pessoais no celular.

É claro que existem problemas novos trazidos pelas novas tecnologias, mas vender ficção como se fosse o resultado lógico do avanço de uma área científica é extremamente problemático. Deve ser a vontade de ganhar mais cliques.

 

Publicidade

Estudando machine learning!

Pois bem, depois de falarmos um pouco sobre o conceito geral de aprendizado de máquina, vamos aos materiais!

1 – Livro: Learning From Data -Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin

front

Bom livro  sobre o assunto. Uma das grandes vantagens é que não parte de um ponto muito avançado (matematicamente falando), tem como objetivo explorar os conceitos gerais pra você entender do que está falando e o que está fazendo.

O interessante é que é um livro que aborda tanto os aspectos teóricos quanto os aspectos práticos, e conta com exercícios para ajudarem a tornar tudo ainda mais claro.

2- Vídeos: Machine Learning Recipes

maxresdefault

Uma série de vídeos do Youtube para um público leigo sobre Machine Learning. Isso já deveria bastar para esse ser uma ótima sugestão. Mas vou acrescentar uma coisa: quem fez a série foi a equipe de desenvolvedores da Google. Sério, é muito legal mesmo! E você ainda consegue brincar com o Tensor Flow – a biblioteca de redes neurais que a empresa usa como motor para suas aplicações.

3- Curso: Machine LearningAndrew Ng

large-icon

Já falamos do Andrew Ng por aqui: professor de Stanford e fundador do Coursera. Ele tem um curso na própria plataforma sobre Machine Learning que é uma abordagem muito consistente sobre o assunto. Já adianto que o curso é muito bom, mas não é tão amigável quanto os dois materiais descritos acima. Vale a pena fazer no próprio ritmo, pegando todos os conceitos de cada aula e indo estudar por conta, por que nesse curso as coisas andam bem depressa.

4- Livro: Programming Collective Intelligence: Building Smart Web 2.0 Applications – Toby Segaran

71r-ilkolol

Esse livro é um personal favorite. Ainda que o foco dele não seja explicar machine learning, e sim construir programas de inteligência coletiva, a relação entre os tópicos e o caráter extremamente didático do texto fazem a coisa toda valer a pena.

No fim do primeiro capítulo, por exemplo, você já sai com um sistema de recomendação de filmes, baseado nos primórdios dos algoritmos usados pela rede Netflix!

5 – Site: Kaggle

kaggle-logo-transparent-300

Esse site é um playground de machine learning. É possível conversar com outras pessoas interessadas no assunto usando o fórum, ler um blog muito bom sobre a área e o principal: encontrar milhares de desafios de machine learning.

Isso funciona da seguinte forma: você lê o desafio, que pode ser algo como “Preveja se esse conjunto de pessoas sobreviveria ao naufrágio do Titanic baseado no peso, altura e origem de todos os passageiros originais”, aí você baixa os dados e então fica ao seu critério criar as soluções mais eficientes para os desafios.

6 -Livro Online: A course in machine learning – Hal Daumé III

machine-learning

Outro livro introdutório. A vantagem desse é que é muito bem organizado em tópicos que abrangem todo o campo de estudo de um jeito bastante pedagógico. Além disso, esse volume possui a grande vantagem de estar disponível de graça no link acima!

7- Curso: Practical Machine Learning Tutorial with Python

maxresdefault1

Os quase 60 vídeos mostram um panorama bem completo sobre o campo. Melhor do que isso, as implementações são todas em Python! É bom pensar que se trata de uma abordagem prática, então não é uma ferramenta para se compreender o que está acontecendo exatamente dentro de cada um dos programas descritos.

Extras:

Lista de scripts: Machine Learning em Python

Um ótimo tutorial sobre  machine learning. O autor transformou a resolução de exercícios em um guia completo nesse site. É ótimo para ver os conceitos aprendidos sendo aplicados em Python.

Reddit: Machine Learning

Tem muita coisa legal nesse subreddit. É um bom lugar para ir para ver novidades da área e encontrar materiais novos para estudar.

Telegram: Machine Learning em Python – Brasil

Use o melhor aplicativo de mensagens para discutir (e ler discussões) sobre machine learning! Mais uma vez, assim como no Python, a comunidade é super receptiva e muito provavelmente qualquer dúvida (pertinente) que você tiver será levada em conta pelos membros.

Espero que o guia ajude, você conhece algum outro material? Por favor, me conte!

 

Estudando Estatística e métodos quantitativos – um guia amigável para linguistas

Estatística e análise de dados são fundamentais.

Não só para linguistas, não só para acadêmicos: estatística é parte fundamental do conhecimento que precisamos para lidar com o mundo de hoje. É um tipo de alfabetização lógica que todos nós deveríamos ter.

Eu digo isso pois é muito comum nos depararmos com argumentos baseados em estatística para defender a opinião X ou Y . Na verdade, é considerado uma boa prática ter a sua argumentação respaldada por fatos, e esses fatos muitas vezes são codificados de alguma forma por algum tipo de tratamento estatístico.

 

2000px-scientificgraphspeedvstime-svg
Gráfico aleatório estrategicamente colocado para respaldar minhas opiniões.

Ao mesmo tempo em que a retórica estatística está por todo lado, o respeito à metodologia, à apuração de fontes e ao próprio conhecimento mínimo sobre os métodos quantitativos não são tão bem disseminados assim. Já presenciei, por exemplo, apresentações em congressos feitas por professores que usavam estatística de modo completamente absurdo.

Ainda duvida que estatística é fundamental? Eis uma definição elegante da área:

Estatística é o estudo sobre a coleta, análise, interpretação, apresentação e organização de dados.[1] Ao aplicar estatística em um problema científico, industrial ou social, costuma-se começar com a definição da população ou do modelo estatístico que será estudado. Populações podem ser coisas distintas tais como “todas as pessoas que moram em um país” ou “todos os átomos que compõe um cristal”. A estatística lida com todos os aspectos dos dados, incluindo o planejamento da coleta de informações, como o desenvolvimento de pesquisas e experimentos.

Falando sobre a área de Linguística, a análise de dados não é útil apenas para a linguística computacional. Existem áreas dos estudos da língua que dão mais ou menos importância para as análises quantitativas, sendo a sociolinguística talvez o exemplo mais claro de como se pode ganhar juntando a análise quantitativa com as noções da linguística. Mas, de maneira geral, é muito raro fazer a associação de duas matérias que costumam ser colocadas em pontos tão distantes do aprendizado – e não são poucas as pessoas que se arrepiam ao ouvir “mostre o que você está querendo dizer em um gráfico!”.

Foi só quando eu comecei a mexer com linguística computacional que pude perceber o quanto é surreal que se forme um linguista que não tenha nenhum conforto para lidar com esse tipo de raciocínio.

Esses são os cursos e materiais de estatística que me ajudaram e ajudam a lidar com esse mundo de conteúdos:


 

6440155

Livro – Statistics for Linguists with R – Stefan Th. Gries (De Gruyter Mouton, 2013)

É difícil estudar estatística e fugir da linguagem de programação R. Apesar de não ser a minha praia, é uma ferramenta poderosíssima que ajuda a entender estatística de um jeito prático, nem que seja em termos básicos. Para quem não conhece, a linguagem R é voltada para a computação científica, e possui muitas bibliotecas específicas para processamento e análise de dados.

De todo modo, o melhor do livro é a abordagem mão na massa: primeiro explica os conceitos, depois dá exemplos linguísticos e, então, exercícios com dados linguísticos.

data-science-from-scratch

Livro – Data Science from Scratch – Joel Grus (O’Reilly, 2015)

Esse excelente livro, de leitura rápida, é um apanhado de diversos campos que compõem a chamada ciência de dados. Ele pressupõe algum conhecimento de Python ou de programação, mas se você já tem esse background, o livro é muito legal. Basicamente, o que o autor faz é ir explicando os conceitos das ciências de dados através da implementação deles em Python.

Ele apresenta um problema, o tipo de conhecimento necessário para lidar com esse problema e a implementação dessa solução em Python, tudo isso com explicações on the run. Recomendo muito!
41pptmtwvfl-_sx398_bo1204203200_

Livro – OpenIntro Statistics – David M. Diaz, Christopher D. Barr, Mine Çetinkaya-Runde (2015)

Excelente e completíssimo material de introdução à estatística, oferece um panorama geral das bases da estatística. E o melhor de tudo: está disponível para baixar de graça nesse site. A ideia é oferecer um panorama geral das bases da estatística.

É uma boa sugestão para quem quer ir além da alfabetização funcional na estatística e descobrir mais a fundo alguns dos conceitos, como regressão linear e regressão logística.

cat

Livro – Python for Data Analysis – Wes McKinney (O’Reilly, 2013)

A aplicação de Python para a análise de dados está acontecendo em diversas áreas, já que é uma linguagem fácil, eficiente e bastante intuitiva. Isso ajuda não só na hora de escrever o seu código, mas também para divulgar os resultados e apresentar o código feito.

Esse livro apresenta a análise de dados de um modo geral usando o Python como base. Também traz principais ferramentas dentro do Python que são usadas por grandes empresas e pesquisadores para atacar as questões da análise de dados. Uma versão mais aprofundada e densa do Data Science from Scratch.

 

minibook

Livro – Learning IPython for Interactive Computing and Data Visualization – Cyrille Rossant (Packt Publishing, 2015)

O IPython é uma interface para programar em Python que merece um post só para ela. De modo geral, o que vale dizer por enquanto é que, para quem é acadêmico, ela é o futuro. A facilidade de fazer um código altamente legível, combinado com texto e interativo é absurda. Mas o que é mais interessante desse livro é que ele conta com uma abordagem bem empírica como usar essa interface para fazer análise e visualização de dados.

Há um outro livro do autor, intitulado IPython Interactive Computing and Visualization Cookbook (Packt Publishing, 2014) que é um livro de receita para análise de dados usando o IPython.

 

khan-logo-vertical-transparent

Site – Khan academy

Esse site é muito bom! Ele foi criado como uma ferramenta para ajudar crianças e adolescentes na escola, mas os conteúdos, videoaulas e exercícios são muito bons para todos os que querem um reforço em algum conteúdo específico. É um jeito fácil e rápido de ir atrás daquela matemática que você teve na escola e por algum motivo acabou não aprendendo ou esquecendo com o tempo (“mas eu nunca vou usar isso na vida, professora!” ¯\_(ツ)_/¯ ).

Livro online – Online Statistics Education: An Interactive Multimedia Course of Study

Esse recurso online, criado por universidades americanas, é uma ótima fonte de conhecimento sobre estatística. Tem a vantagem de estar organizado em links, e um conceito específico está ligado tanto com os tópicos que você precisa dominar para entendê-lo como com os tópicos que estão relacionados a ele de modo geral.

Curso – Computational Statistics with Python – Universidade de Duke

Um curso completo sobre estatística. Além disso, é todo voltado para a implementação dos conceitos usando o Python. Um material incrível, que eu descobri recentemente e vou usar a partir de agora.


Outras recomendações:

Estatística na Wikipedia (Inglês) – A Wikipédia em inglês é quase sempre um ótimo jeito de começar a estudar alguma coisa. No caso da estatística, a descrição é boa e te conduz para outras leituras e fontes bem legais. A versão em português é bem interessante também, e está nesse link aqui.

Sub-reddit de Estatística: O reddit é uma ótima plataforma de fóruns onde dá para encontrar pessoas falando sobre qualquer coisa. O de estatística é um jeito legal de ter algum contato com discussões dessa comunidade.

Quora – No Quora, que eu já mencionei aqui, é possível encontrar perguntas de vários níveis respondidas pelas mais diversas pessoas, desde curiosos até professores universitários famosos. Deem uma olhada nessa pergunta que coloquei como exemplo: tem uma resposta que está no mesmo nível de livros texto. É uma fonte que, se bem trabalhada, pode contribuir muito!

O estatístico – Essa página de divulgação no Facebook é uma iniciativa super importante. Como eu disse, estatística é um mundo, e aqui você vai poder ver diversos links e artigos interessantes sobre as mais variadas áreas e aplicações da estatística.

 

Espero que uma porção significativa (p<0,05) das sugestões e dicas ajudem! Se você tiver alguma outra sugestão, por favor, compartilhe!