A Leitura em Inglês: Uma Abordagem Baseada na Lei de Zipf

28 de janeiro de 2024 rubens.queiroz

A minha maior preocupação com relação ao aprendizado da língua inglesa era descobrir uma forma de permitir com que profissionais de informática pudessem dominar a leitura em um prazo curto de tempo.

E esta preocupação teve origem no meu primeiro emprego como analista de sistemas, em que toda documentação era em inglês. Não havia absolutamente nada em português e o desespero de meus colegas de trabalho por sua incapacidade de ler os textos me incomodava muito.

Infelizmente não consegui desenvolver uma solução que atendesse a estes meus colegas, pois fiquei neste emprego por pouco tempo. Mas não desisti e depois de muito procurar, encontrei a solução: as palavras mais comuns da língua inglesa.

A partir de uma grande amostra de textos da língua inglesa, com mais de 10 milhões de palavras, descobri que apenas com o conhecimento de 250 palavras era possível identificar cerca de 70% das palavras de um texto, e os cognatos, que são as palavras que se parecem em ambos os idiomas, elevava este número para quase 90%.

É claro que eu não fui o primeiro a descobrir isso, mas na época, final dos anos 90, eu não tinha acesso a essa informação. Então o que eu fiz foi uma redescoberta. 😉

Por muitos anos eu distribuí um arquivo PDF com o meu trabalho, que consistia em pegar as palavras mais comuns e montar frases com elas. Lembre-se sempre, memorizar palavras isoladas é uma perda enorme de tempo e vai atrasar o seu aprendizado, sempre estude as palavras em contexto, em frases.

O que eu também não sabia, é que existe uma lei matemática que explica isso, a Lei de Zipf. Esta lei, nomeada em homenagem ao linguista americano George Kingsley Zipf, é um princípio estatístico que descreve uma relação fascinante entre a frequência de palavras e seu ranqueamento em um dado corpus linguístico. Esta lei afirma que a frequência de qualquer palavra é inversamente proporcional ao seu ranque na tabela de frequência. Por exemplo, a segunda palavra mais comum em um texto será usada aproximadamente metade do tempo que a palavra mais comum, a terceira palavra um terço do tempo, e assim por diante.

No contexto da linguística, ela sugere que poucas palavras são usadas muito frequentemente, enquanto a maioria das palavras são usadas raramente. Esta observação tem implicações profundas, não só para a compreensão de padrões linguísticos, mas também para áreas como processamento de linguagem natural e análise textual.

George Zipf originalmente formulou esta lei com base em dados do idioma inglês, mas estudos subsequentes mostraram que ela se aplica a uma variedade de idiomas, embora com variações específicas para cada língua.

A relevância da Lei de Zipf vai além da linguística. Ela tem sido observada em outros domínios, como a distribuição de renda em economias (onde poucas pessoas detêm a maior parte da riqueza) e até em padrões de uso de sites na Internet. Essa universalidade sugere princípios organizacionais subjacentes comuns a sistemas complexos. A compreensão desses princípios pode oferecer insights valiosos para diversas áreas, desde a sociologia até a teoria da informação e a ciência da computação.

A Lei de Zipf pode ser uma ferramenta valiosa no aprendizado de idiomas, oferecendo insights sobre como priorizar o estudo de palavras e estruturas linguísticas.

Se você quiser saber mais sobre a Lei de Zipf, recomendo o vídeo The Zipf Mystery do canal do Youtube Vsauce. A Lei de Zipf é explicada de uma maneira muito divertida e didática e certamente pode lhe ajudar em outras áreas de sua vida.

Recomendo também que você assista ao meu vídeo Como aprender a ler em inglês em seis meses ou menos, onde apresento algumas estratégias que podem lhe ajudar a dominar o inglês para leitura em um prazo bastante curto.

Twittar

0 Compart.