As palavras mais comuns da língua inglesa

© Rubens Queiroz de Almeida

Um profissional moderno que não consiga ao menos ler textos em inglês sofre sérios impedimentos no exercício diário de sua profissão. A boa notícia é que a leitura, e apenas a leitura de textos em inglês, é uma habilidade que pode ser desenvolvida em um espaço de tempo relativamente curto. A leitura pode ser aprendida independentemente do aprendizado da fala, da escrita e da audição.

Para aprender a ler em inglês o aluno deve dominar alguns rudimentos da estrutura da língua. Este domínio é passivo, ou seja, é necessário apenas que se saiba identificar as estruturas para obter a compreensão da mensagem.

E o vocabulário, que é a preocupação maior de todos, não constitui impedimento algum ao domínio do idioma. A língua inglesa e a portuguesa possuem diversos elementos em comum. Os cognatos, palavras com origens no latim, como por exemplo a palavra “impossible“, ou “impossível“, são facilmente identificáveis. Os cognatos correspondem a aproximadamente 20% de todos os termos encontrados em textos técnicos.

Gostaria de destacar alguns fatos interessantes de um trabalho que realizei com a coleção de livros online mantida pelo Projeto Gutenberg.

O Projeto Gutenberg é uma iniciativa que tem por objetivo disponibilizar em formato eletrônico livros cujo direito autoral já tenha expirado.

Até hoje já foram convertidos cerca de 58.000 livros, principalmente em inglês, porém existem também obras em espanhol, italiano e francês.

O objetivo do trabalho realizado foi identificar as palavras mais comuns da língua inglesa e seu percentual de ocorrência.

Dos 1067 livros disponíveis no dia 29 de setembro de 1997, foram utilizados para o cálculo 1032 livros. Todos estes livros foram combinados em um único arquivo de 440MB de tamanho, contendo 6.615.271 palavras. Deste total foram extraídas 103.590 palavras diferentes, sendo que 78.332 delas ocorrem menos de dez vezes, ou seja, 75% das palavras aparecem com muito pouca frequência.

E o mais interessante, as 250 palavras mais frequentes são responsáveis por 57% do total das palavras. Desta forma, se você conhece estas 250 palavras você já conhece aproximadamente 60% de qualquer texto em inglês.

Juntando-se a estas palavras os cognatos, você tem que aproximadamente 80% do vocabulário de textos técnicos é facilmente identificável.

E ainda mais importante, as 1.000 palavras mais comuns totalizam cerca de 99,25% de todas as palavras. Excelente, não?

Então, se você precisa do inglês no seu trabalho, pense em aprender a ler primeiro. Você vai atender à sua necessidade imediata ao mesmo tempo em que se capacita para seguir aprendendo o idioma inglês em sua totalidade. A leitura vai facilitar o aprendizado da fala, da escrita e da audição.

Abaixo segue a lista das 250 palavras mais comuns, o percentual com que ocorrem e um resumo das estatísticas que mencionei acima.

Número de livros1032
Tamanho do arquivo combinado440MB
Data29/09/97
Número total de palavras6.615.271
Número total de palavras diferentes103.590
Número de palavras que ocorrem
menos de dez vezes
78.332
Número de ocorrências das 250 palavras
mais comuns
3.781.615 (57%)
Número de ocorrências das 1000 palavras
mais comuns
6.565.736 (99.25%)
PalavraPorc. TotalNúmero de Ocorrências
the7.846512519068
of4.460135295050
and3.653471241687
to2.556630169128
in1.815451120097
was1.16190376863
that1.11260773602
his1.07912471387
he1.03366968380
it0.87240657712
with0.77280351123
as0.73738548780
by0.70757546808
for0.66682144112
is0.66332943881
had0.62245441177
but0.57657538142
which0.53866335634
on0.52034134422
be0.50699433539
at0.50493833403
not0.49975333060
they0.49934533033
from0.49479532732
were0.47437231381
their0.47257331262
this0.44909729709
or0.40067926506
have0.38424725419
you0.38087625196
her0.37699124939
who0.36309924020
all0.36140623908
him0.35997023813
an0.33880722413
so0.32685021622
are0.29770519694
one0.29362419424
she0.26375317448
my0.25778217053
them0.25439616829
we0.25149416637
been0.25060216578
no0.24215216019
me0.23671015659
if0.23563715588
said0.23418515492
there0.22978715201
when0.22361914793
would0.22126114637
more0.21290114084
will0.18162512015
some0.17474711560
what0.17379511497
into0.17210211385
has0.16734011070
could0.15875410502
than0.15825510469
out0.15654710356
then0.15372010169
up0.15341810149
its0.1506979969
man0.1475539761
time0.1453159613
now0.1402819280
two0.1391339204
upon0.1390579199
these0.1379849128
after0.1365339032
footnote0.1354148958
may0.1350068931
only0.1348558921
other0.1336768843
see0.1280078468
such0.1233218158
do0.1232458153
great0.1209328000
very0.1200867944
any0.1200107939
your0.1183027826
about0.1146897587
made0.1134957508
our0.1128007462
well0.1127247457
first0.1123467432
most0.1103517300
like0.1101547287
before0.1091877223
little0.1084017171
himself0.1052876965
over0.1037606864
without0.1028686805
own0.1028086801
those0.1016446724
good0.1012666699
might0.1011756693
men0.0993616573
can0.0993316571
should0.0988176537
did0.0987416532
where0.0958246339
come0.0957636335
people0.0956276326
must0.0934506182
us0.0930576156
day0.0889915887
long0.0888255876
much0.0888105875
down0.0883115842
same0.0876765800
mr0.0839275552
never0.0835795529
even0.0833985517
old0.0822045438
under0.0813275380
through0.0808285347
still0.0808285347
while0.0803145313
many0.0802395308
know0.0798765284
every0.0791965239
life0.0785915199
three0.0777905146
how0.0777595144
way0.0772915113
years0.0763845053
came0.0763545051
king0.0749634959
go0.0734364858
being0.0723184784
again0.0705494667
here0.0690674569
make0.0686294540
back0.0681154506
new0.0675104466
against0.0664374395
found0.0651984313
yet0.0650314302
say0.0642304249
too0.0641704245
last0.0631574178
though0.0630514171
head0.0626134142
away0.0619484098
right0.0611314044
hand0.0606934015
place0.0603753994
god0.0602093983
another0.0591363912
shall0.0591213911
country0.0588943896
part0.0587883889
far0.0586673881
left0.0576243812
eyes0.0575343806
soon0.0568383760
went0.0559613702
take0.0558563695
each0.0558403694
just0.0553113659
power0.0552213653
name0.0548583629
am0.0543443595
death0.0541473582
world0.0533613530
nor0.0531043513
mind0.0531043513
once0.0529233501
off0.0522433456
among0.0516993420
thought0.0512753392
whom0.0507313356
house0.0506563351
get0.0506253349
nothing0.0505953347
between0.0504593338
hundred0.0502783326
think0.0500963314
both0.0489783240
young0.0488873234
because0.0485093209
saw0.0482673193
ever0.0480553179
let0.0479803174
themselves0.0475573146
emperor0.0473453132
case0.0466803088
work0.0462413059
whose0.0461213051
war0.0460753048
took0.0459393039
general0.0456223018
city0.0456073017
state0.0452592994
side0.0448212965
things0.0446842956
always0.0445332946
days0.0438382900
thus0.0438082898
face0.0432332860
night0.0429462841
less0.0429312840
give0.0428712836
asked0.0428252833
body0.0425382814
also0.0423112799
seemed0.0418432768
four0.0416462755
non0.0416312754
son0.0415862751
whole0.0415252747
called0.0411932725
don’t0.0408752704
however0.0404372675
love0.0403162667
put0.0402102660
thousand0.0398932639
hands0.0398772638
seen0.0398172634
tell0.0395302615
almost0.0392272595
look0.0391822592
father0.0391222588
heart0.0388502570
few0.0388502570
got0.0386532557
five0.0385022547
nature0.0383662538
find0.0381842526
public0.0380942520
going0.0380632518
roman0.0379122508
perhaps0.0377162495
woman0.0376102488
since0.0371262456
having0.0367482431
arms0.0367182429
heard0.0367032428
looked0.0365822420
age0.0365522418
gave0.0360082382
why0.0359922381
words0.0357812367
light0.0355242350
better0.0353122336
end0.0349342311
water0.0349192310
twenty0.0344352278
until0.0343602273
others0.0343302271
29570cookie-checkAs palavras mais comuns da língua inglesa

Lista Aprendendo Inglês

Sabia que manter o contato diário com o idioma é uma das principais sacadas para aprender inglês com facilidade?

Assine a lista "Aprendendo Inglês" e receba em seu email todos os dias, um texto ou uma piadinha em inglês.


Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *