Brincando com Distribuição de Benford
Resumen
O astrônomo Simon Newcomb e o físico (engenheiro elétrico) Frank Benford perceberam, com uma diferença de quase 60 anos, que folhas das antigas tábuas de logaritmos possuíam suas páginas associadas a números iniciados em 1 bem mais desgastadas do que a maioria. Supuseram, então, que alguns conjuntos de dados de certos fenômenos observados, por uma razão ainda não muito clara para ambos, seguiam uma distribuição para seus primeiros dígitos, implicando maior frequência de números iniciados em 1 em relação a números iniciados em 8 ou 9. Essa distribuição ficou conhecida como Lei de Newcomb-Benford (NB)[9, 1]. Com o tempo, observou-se que um número enorme de conjuntos de dados segue NB, dando um caráter meio 'mágico' à distribuição [6]. A partir principalmente das análises de Mark Nigrini [10], NB passou a ser aplicada na detecção de fraudes contábeis, entre outras. Recentemente, a partir da invariância por mudança de base em NB [4], começamos a estudar possíveis fraudes (eleitorais) utilizando NB em outras bases numéricas [2, 8, 3]. Pb(d) = logb (1 + 1/d). A equação acima descreve a frequência esperada (probabilidade) P(d) de números iniciados com o dígito d em um conjunto de dados escritos na base b que segue a distribuição de Newcomb-Benford (NB). Neste trabalho, observamos a emergência da distribuição de Newcomb-Benford a partir de simulações simples em sorteios de um conjunto discreto de números, em outras palavras, a partir de um dado de n lados com uma distribuição de probabilidade qualquer, conseguimos chegar a NB. A ideia básica é sortear um conjunto de dados que comece com dígito 1 a b - 1 escritos na base b. Cada dado é obtido a partir do produto de n sorteios de modo que o resultado final será sempre dividido por bj garantindo que o resultado esteja no intervalo I = [1, b - 1). [...]
Descargas
Citas
F. Benford. “The law of anomalous numbers”. Em: Proceedings of the American philosophical society (1938), pp. 551–572.
E. Gueron e J. Pellegrini. “Application of Benford–Newcomb law with base change to electoral fraud detection”. Em: Physica A: Statistical Mechanics and its Applications 607, 128208 (2022). doi: 10.1016/j.physa.2022.128208.
E. Gueron, J. Pellegrini e B. Aristimunha. “Distribuição de Newcomb-Benford, Mudanças de Bases e Aplicações Eleitorais”. Em: Proceeding Series of the Brazilian Society of Computational and Applied Mathematics. 2023. doi: https://doi.org/10.5540/03.2023.010.01.0042.
T. P. Hill. “Base-invariance implies Benford’s law”. Em: Proceedings of the American Mathematical Society 123.3 (1995), pp. 887–895.
T. P. Hill. “The significant-digit phenomenon”. Em: The American Mathematical Monthly 102.4 (1995), pp. 322–327.
W. Hurlimann. “Benford’s Law from 1881 to 2006: a bibliography”. preprint arXiv:math/0607168. 2006. url: https://arxiv.org/abs/math/0607168.
S. Miller e M. Nigrini. “The modulo 1 central limit theorem and Benford’s law for products”. Em: International Journal of Algebra 2.13-16 (2008), pp. 615–631.
H. N. Silva. “Uso de Invariância de Base em Aplicações da Lei de Newcomb-Benford”. Dissertação de mestrado. Universidade Federal do ABC, 2023.
S. Newcomb. “Note on the frequency of use of the different digits in natural numbers”. Em: American Journal of mathematics 4.1 (1881), pp. 39–40.
M. Nigrini e J. Wells. Benford’s Law: Applications for Forensic Accounting, Auditing, and Fraud Detection. John Wiley & Sons, 2012. isbn: 978-1-118-15285-0.